RNN循环神经网络
2025年1月15日大约 2 分钟
基本RNN神经网络

RNN 的核心是一个循环单元,它在每个时间步接受输入
公式如下:
- 隐藏状态更新:
- 输出计算:
其中:
是输入到隐藏层的权重矩阵。 是隐藏层到隐藏层的权重矩阵。 是隐藏层到输出层的权重矩阵。 和 是偏置项。
LSTM神经网络

LSTM 的核心是 门控机制,包括输入门、遗忘门、输出门和细胞状态。以下是 LSTM 的计算公式:
遗忘门(Forget Gate):
- 决定哪些信息从细胞状态
中丢弃。
- 决定哪些信息从细胞状态
输入门(Input Gate):
- 决定哪些新信息将存储到细胞状态中。
候选细胞状态(Candidate Cell State):
- 生成候选值,用于更新细胞状态。
更新细胞状态(Cell State Update):
- 结合遗忘门和输入门的结果,更新细胞状态。
输出门(Output Gate):
- 决定哪些信息从细胞状态中输出。
隐藏状态(Hidden State):
- 输出当前时间步的隐藏状态。
GRU神经网络

梯度裁剪
梯度剪裁是一种在网络反向传播过程中,将误差导数改变或剪裁到阈值,并利用剪裁后的梯度来更新权值的方法。