（动手学习深度学习）第7章残差网络---ResNet

ResNet

在这里插入图片描述

总结

残差块使得很深的网络更加容易训练
- 甚至可以训练一千层的网络
残差网络对随后的深层神经网络设计产生了深远影响，无论是卷积类网络还是全连接类网络。

ResNet代码实现

导入相关库

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

定义网络模型

# 定义基本残差块
class Residual(nn.Module):
    def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1):
        super().__init__()
        self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides)
        self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1)
        if use_1x1conv:  # 是否需要降低空间分辨率，增加通道维维度
            self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides)
        else:
            self.conv3 = None
        self.bn1 = nn.BatchNorm2d(num_channels)
        self.bn2 = nn.BatchNorm2d(num_channels)
        self.relu = nn.ReLU(inplace=True)
        # inplace为True，将会改变输入的数据 ，否则不会改变原输入，只会产生新的输出。
        # 产生的计算结果不会有影响。利用in-place计算可以节省内（显）存，同时还可以省去反复申请和释放内存的时间。但是会对原变量覆盖，只要不带来错误就用。
    def forward(self, X):
        Y = F.relu(self.bn1(self.conv1(X)))
        Y = self.bn2(self.conv2(Y))
        if self.conv3:
            X = self.conv3(X)
        Y += X
        return F.relu(Y)

查看普通残差块：输入和输出形状一致

blk= Residual(3, 3)
X = torch.rand(4, 3, 6, 6)
Y = blk(X)
Y.shape

在这里插入图片描述

查看升维残差块：增加输出通道的同时，减半输入的高和宽

blk = Residual(3, 6, use_1x1conv=True, strides=2)
X =torch.rand(4, 3, 6, 6)
Y =blk(X)
Y.shape

在这里插入图片描述

# 定义resnet块
def resnet_block(input_channels, num_channels, num_residuals, first_block=False):
    """定义大的残差块（5块）"""
    blk = []
    for i in range(num_residuals):
        if i == 0 and not first_block:
            # 除了一个块，每个块的一个升维残差块，要先缩小输入特征图的尺寸，增大通道数
            blk.append(
                Residual(input_channels, num_channels, use_1x1conv=True, strides=2)
            )
        else:
            # 第一块或者每块中用于提取特征的堆叠的基本残差块，输入和输出的形状一致
            blk.append(
                Residual(num_channels, num_channels)
            )
        return blk

# 定义ResNet网络模型
b1 = nn.Sequential(  # 输入形状：[1, 1, 224, 224]
    nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),   # (224 - 7 + 2*3)/2 + 1 = 112
    nn.BatchNorm2d(64), nn.ReLU(),  # [1, 64, 112, 112]
    nn.MaxPool2d(kernel_size=3, stride=2, padding=1)  # [1, 64, 56. 56]
)
b2= nn.Sequential(
    # *列表：表示解包操作，把列表元素顺序展开
    # *[1, 3, 2 , 5, 4] = 1, 3, 2, 5, 4
    *resnet_block(64, 64, 2, first_block=True)  # [1, 64, 56, 56]、[1, 64, 56, 56]
)
b3 = nn.Sequential(
    *resnet_block(64, 128, 2)  # [1, 128, 28, 28]、[1, 128, 28, 28]
)
b4 = nn.Sequential(
    *resnet_block(128, 256, 2)  # [1, 256, 14, 14]、[1, 256, 14, 14]
)
b5 = nn.Sequential(
    *resnet_block(256, 512, 2)  # [1, 512, 7, 7]、[1, 512, 7, 7]
)

net = nn.Sequential(
    b1,
    b2,
    b3,
    b4,
    b5,
    nn.AdaptiveAvgPool2d((1, 1)),  # [1, 512, 1, 1]
    nn.Flatten(),  # [1, 512*1*1]= [1, 512]
    nn.Linear(512, 10)  # [1, 512] --> [1, 10]
)

查看网络模型

X = torch.randn(1, 1, 224, 224)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__, 'output shape:\t', X.shape)

在这里插入图片描述

加载数据集

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)

训练模型

lr, num_epochs = 0.05, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

在这里插入图片描述

ResNet的梯度计算

在这里插入图片描述
QA

学习率也可以让靠近输出（标签）的小一些，靠近输入（输入）的大一些，来缓解梯度消失的问题

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/130021.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

（动手学习深度学习）第7章残差网络---ResNet

目录

ResNet

总结

ResNet代码实现

ResNet的梯度计算

相关文章

【优选算法系列】【专题二滑动窗口】第二节.1004. 最大连续1的个数 III和1658. 将 x 减到 0 的最小操作数

Centos配置邮件发送

state 和 props 有什么区别？

滚珠螺杆的精度和使用场景之间的关系？

WebGL-Vue3-TS-Threejs：基础练习 / Javascript 3D library / demo

ROS Motion Planning运动规划库安装方法及进阶使用方法详细介绍

2011年09月01日 Go生态洞察：Go语言词法扫描与App Engine演示

蓝桥杯每日一题2023.11.10

sql学习笔记（三）

RFID携手制造业升级，为锂电池生产带来前所未有的可靠性

Android T窗口动画显示和退出流程（更新中）

redis数据倾斜如何解决

Java 算法篇-深入理解递归（递归实现：青蛙爬楼梯）

启动Docker服务后显示Docker Engine stopped

依赖倒转原则接口隔离原则迪米特法则合成复用原则

如何快速落地LLM应用？通过Langchain接入千帆SDK

如何利用软文推广提升消费者“购买力”？

黄执中老师人际说服课思考总结（个人笔记整理 ②）

SQL Server 2022 安装步骤——SQL Server设置身份验证教程

自媒体项目详述

（动手学习深度学习）第7章 残差网络---ResNet

目录

ResNet

总结

ResNet代码实现

ResNet的梯度计算

相关文章

（动手学习深度学习）第7章残差网络---ResNet