4 GRU模型

学习目标

1 GRU介绍

GRU(Gated Recurrent Unit)也称门控循环单元结构, 它也是传统RNN的变体, 同LSTM一样能够有效捕捉长序列之间的语义关联, 缓解梯度消失或爆炸现象. 同时它的结构和计算要比LSTM更简单, 它的核心结构可以分为两个部分去解析:

2 GRU的内部结构图

2.1 GRU结构分析

为什么是LSTM的简化?我们发现LSTM的c和h其实形状是一样的,因此我们尝试把这两者合并到一起,就成了GRU

image.png

image.png