全部文章
2023-07-07 20:50:42
@[toc]网络模型代码import torchfrom torch import nnfrom torch.utils.data import Datasetclass CnnModel(nn.Module): def __init__(self): super
2023-07-03 21:35:14
代码:import torch.optimfrom torch import nnimport osimport numpy as npfrom PIL import Imagefrom torch.utils.data import DataLoader,Datasetclass
2023-07-02 16:28:04
计算E对W的导数,以用来进行梯度更新。1.2.3.如果矩阵W的显性特征值大于1,梯度爆炸。如果它小于1,梯度消失。参考文献Why LSTMs Stop Your Gradients From Vanishing: A View from the Backwards Pass
2023-07-01 14:22:36
@[toc]RNN循环神经网络RNN可以分为好多种实现方式,经典的形式用时刻t-1的输出作为t时刻隐藏层的输入去计算,但这样会依赖于以前的计算结果,如果上一步的结果有错误在后续的计算中会无限被放大。举个例子,在计算数学题目的时候,会有很多步骤,在前几步中某一步计算错误,则会导致后续的计算受很