Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
288d4043
Commit
288d4043
authored
Aug 15, 2021
by
zengxin
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
10
parent
be2669f0
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
2 行增加
和
2 行删除
+2
-2
Chapter10/chapter10.tex
+2
-2
没有找到文件。
Chapter10/chapter10.tex
查看文件 @
288d4043
...
@@ -541,7 +541,7 @@ $\funp{P}({y_j | \mathbi{s}_{j-1} ,y_{j-1},\mathbi{C}})$由Softmax实现,Softm
...
@@ -541,7 +541,7 @@ $\funp{P}({y_j | \mathbi{s}_{j-1} ,y_{j-1},\mathbi{C}})$由Softmax实现,Softm
\hat
{
\mathbi
{
c
}}_
t
&
=
&
\textrm
{
Tanh
}
([
\mathbi
{
h
}_{
t-1
}
,
\mathbi
{
x
}_{
t
}
]
\mathbi
{
W
}_
c +
\mathbi
{
b
}_
c )
\label
{
eq:10-8
}
\hat
{
\mathbi
{
c
}}_
t
&
=
&
\textrm
{
Tanh
}
([
\mathbi
{
h
}_{
t-1
}
,
\mathbi
{
x
}_{
t
}
]
\mathbi
{
W
}_
c +
\mathbi
{
b
}_
c )
\label
{
eq:10-8
}
\end{eqnarray}
\end{eqnarray}
之后,用
$
\mathbi
{
i
}_
t
$
点乘
$
\hat
{
\mathbi
{
c
}}_
t
$
,得到当前需要记忆的信息,记为
$
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}}_
t
$
。接下来需要更新旧的信息
$
\mathbi
{
c
}_{
t
-
1
}$
,得到新的记忆信息
$
\mathbi
{
c
}_
t
$
,更新的操作如图
\ref
{
fig:10-11
}
(c)红色线部分所示,“
$
\bigoplus
$
”表示相加。具体规则是通过遗忘门选择忘记一部分上文信息
$
\mathbi
{
f
}_
t
$
,通过输入门计算新增的信息
$
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}}_
t
$
,然后根据“
$
\bigotimes
$
”门与“
$
\bigoplus
$
”门进行相应的乘法和加法计算,如公式
\eqref
{
eq:10-9
}
:
之后,用
$
\mathbi
{
i
}_
t
$
点乘
$
\hat
{
\mathbi
{
c
}}_
t
$
,得到当前需要记忆的信息,记为
$
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}}_
t
$
。接下来需要更新旧的信息
$
\mathbi
{
c
}_{
t
-
1
}$
,得到新的记忆信息
$
\mathbi
{
c
}_
t
$
,更新的操作如图
\ref
{
fig:10-11
}
(c)红色线部分所示,“
$
\bigoplus
$
”表示相加。具体规则是通过遗忘门选择忘记一部分上文信息
$
\mathbi
{
f
}_
t
\odot
\mathbi
{
c
}_{
t
-
1
}
$
,通过输入门计算新增的信息
$
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}}_
t
$
,然后根据“
$
\bigotimes
$
”门与“
$
\bigoplus
$
”门进行相应的乘法和加法计算,如公式
\eqref
{
eq:10-9
}
:
\begin{eqnarray}
\begin{eqnarray}
\mathbi
{
c
}_
t
&
=
&
\mathbi
{
f
}_
t
\odot
\mathbi
{
c
}_{
t-1
}
+
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}_
t
}
\mathbi
{
c
}_
t
&
=
&
\mathbi
{
f
}_
t
\odot
\mathbi
{
c
}_{
t-1
}
+
\mathbi
{
i
}_
t
\odot
\hat
{
\mathbi
{
c
}_
t
}
\label
{
eq:10-9
}
\label
{
eq:10-9
}
...
@@ -573,7 +573,7 @@ $\funp{P}({y_j | \mathbi{s}_{j-1} ,y_{j-1},\mathbi{C}})$由Softmax实现,Softm
...
@@ -573,7 +573,7 @@ $\funp{P}({y_j | \mathbi{s}_{j-1} ,y_{j-1},\mathbi{C}})$由Softmax实现,Softm
\subsection
{
门控循环单元
}
\subsection
{
门控循环单元
}
\parinterval
LSTM 通过门控单元控制传递状态,忘记不重要的信息,记住必要的历史信息,在长序列上取得了很好的效果,但是其进行了许多门信号的计算,较为繁琐。
{
\small\bfnew
{
门
循环单元
}}
\index
{
门
循环单元
}
(Gated Recurrent Unit,GRU)
\index
{
Gated Recurrent Unit
}
作为一个LSTM的变种,继承了LSTM中利用门控单元控制信息传递的思想,并对LSTM进行了简化
\upcite
{
Cho2014Learning
}
。它把循环单元状态
$
\mathbi
{
h
}_
t
$
和记忆
$
\mathbi
{
c
}_
t
$
合并成一个状态
$
\mathbi
{
h
}_
t
$
,同时使用了更少的门控单元,大大提升了计算效率。
\parinterval
LSTM 通过门控单元控制传递状态,忘记不重要的信息,记住必要的历史信息,在长序列上取得了很好的效果,但是其进行了许多门信号的计算,较为繁琐。
{
\small\bfnew
{
门
控循环单元
}}
\index
{
门控
循环单元
}
(Gated Recurrent Unit,GRU)
\index
{
Gated Recurrent Unit
}
作为一个LSTM的变种,继承了LSTM中利用门控单元控制信息传递的思想,并对LSTM进行了简化
\upcite
{
Cho2014Learning
}
。它把循环单元状态
$
\mathbi
{
h
}_
t
$
和记忆
$
\mathbi
{
c
}_
t
$
合并成一个状态
$
\mathbi
{
h
}_
t
$
,同时使用了更少的门控单元,大大提升了计算效率。
%----------------------------------------------
%----------------------------------------------
\begin{figure}
[htp]
\begin{figure}
[htp]
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论