Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
ae1736d0
Commit
ae1736d0
authored
Oct 23, 2019
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
new pages
parent
f348505b
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
99 行增加
和
1 行删除
+99
-1
Section05-Neural-Networks-and-Language-Modeling/section05-test.tex
+47
-1
Section05-Neural-Networks-and-Language-Modeling/section05.tex
+52
-0
没有找到文件。
Section05-Neural-Networks-and-Language-Modeling/section05-test.tex
查看文件 @
ae1736d0
...
...
@@ -124,12 +124,58 @@
\begin{frame}
{
循环单元
}
\begin{itemize}
\item
假设有输入序列
$
(
\textbf
{
x
}_
0
,
\textbf
{
x
}_
1
,...,
\textbf
{
x
}_
t,...
)
$
,这里
$
\textbf
{
x
}_
t
$
表示序列中第
$
t
$
个元素,也被称作时刻
$
t
$
所对应的输入。它所对应的输出序列是
$
(
\textbf
{
y
}_
0
,
\textbf
{
y
}_
1
,...,
\textbf
{
y
}_
t,...
)
$
。 循环神经网络的核心是`` 记忆''任意长时间的历史
\item
有输入序列
$
(
\textbf
{
x
}_
0
,
\textbf
{
x
}_
1
,...,
\textbf
{
x
}_
t,...
)
$
,其中
$
\textbf
{
x
}_
t
$
表示序列中第
$
t
$
个元素,也被称作
\alert
{
时刻
$
t
$}
输入。它所对应的输出序列是
$
(
\textbf
{
y
}_
0
,
\textbf
{
y
}_
1
,...,
\textbf
{
y
}_
t,...
)
$
。 在循环神经网络中,每个时刻的输出都可以用同一个
\alert
{
循环单元
}
来描述。
\visible
<2->
{
对于语言模型,一种简单的结构:
}
\visible
<2->
{
{
\small
\begin{tcolorbox}
[bicolor,sidebyside,righthand width=4.3cm,size=title,frame engine=empty,
colback=blue!10!white,colbacklower=black!5!white]
\begin{eqnarray}
\textbf
{
y
}_
t
&
=
&
\textrm
{
Softmax
}
(
\textbf
{
h
}_
t
\textbf
{
V
}
)
\nonumber
\\
\textbf
{
h
}_
t
&
=
&
\textrm
{
TanH
}
(
\textbf
{
x
}_
t
\textbf
{
U
}
+
\textbf
{
h
}_{
t-1
}
\textbf
{
W
}
)
\nonumber
\end{eqnarray}
\footnotesize
{$
\textbf
{
h
}_
t
$
:
$
t
$
时刻的隐层状态
\\
$
\textbf
{
h
}_{
t
-
1
}$
:
$
t
-
1
$
时刻的隐层状态
\\
$
\textbf
{
V
}
,
\textbf
{
U
}
,
\textbf
{
W
}$
: 参数
}
\tcblower
\begin{center}
\begin{tikzpicture}
\begin{scope}
\node
[anchor=west,inner sep=3pt,minimum width=8em] (h) at (0,0)
{
\tiny
{$
\textbf
{
h
}_
t
=
\textrm
{
TanH
}
(
\textbf
{
x
}_
t
\textbf
{
U
}
+
\textbf
{
h
}_{
t
-
1
}
\textbf
{
W
}
)
$}}
;
\node
[anchor=south west,inner sep=3pt] (r) at ([yshift=-0.2em]h.north west)
{
\tiny
{
循环单元:
}}
;
\begin{pgfonlayer}
{
background
}
\node
[rectangle,draw,inner sep=0em,fill=green!20!white] [fit = (r) (h)] (rbox)
{}
;
\end{pgfonlayer}
\node
[anchor=south,draw,minimum width=8em,fill=green!20!white] (y) at ([yshift=1.5em]rbox.north)
{
\tiny
{$
\textbf
{
y
}_
t
=
\textrm
{
Softmax
}
(
\textbf
{
h
}_
t
\textbf
{
V
}
)
$}}
;
\node
[anchor=south,inner sep=2pt] (output) at ([yshift=1em]y.north)
{
\scriptsize
{$
\textbf
{
y
}_
t
$}}
;
\node
[anchor=north,inner sep=2pt] (input) at ([yshift=-1em]h.south)
{
\scriptsize
{$
\textbf
{
x
}_
t
$}}
;
\draw
[->,thick] (input.north) -- ([yshift=-0.1em]rbox.south);
\draw
[->,thick] ([yshift=0.1em]rbox.north) -- ([yshift=-0.1em]y.south) node [pos=0.5,left]
{
\tiny
{$
\textbf
{
h
}_
t
$}}
;
\draw
[->,thick] ([yshift=0.1em]y.north) -- (output.south);
\draw
[->,thick] ([xshift=0.1em]rbox.east) -- ([xshift=1em]rbox.east) node [pos=1,above]
{
\tiny
{$
\textbf
{
h
}_
t
$}}
;
\draw
[->,thick] ([xshift=-1em]rbox.west) -- ([xshift=-0.1em]rbox.west) node [pos=0,above]
{
\tiny
{$
\textbf
{
h
}_{
t
-
1
}$}}
;
\end{scope}
\end{tikzpicture}
\end{center}
\end{tcolorbox}
}
}
\item
<3->
\textbf
{
如何体现循环?
}$
t
$
时刻的状态是
$
t
-
1
$
时刻状态的函数,这个过程可以不断被执行
\end{itemize}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 循环神经网络的“记忆”
\begin{frame}
{
循环神经网络的``记忆''
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 深度学习带来的问题及思考 - 并不是无所不能
...
...
Section05-Neural-Networks-and-Language-Modeling/section05.tex
查看文件 @
ae1736d0
...
...
@@ -4111,6 +4111,58 @@ NLP问题的\alert{隐含结构}假设 & 无隐含结构假设,\alert{端到
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 循环神经网络的结构
\begin{frame}
{
循环单元
}
\begin{itemize}
\item
有输入序列
$
(
\textbf
{
x
}_
0
,
\textbf
{
x
}_
1
,...,
\textbf
{
x
}_
t,...
)
$
,其中
$
\textbf
{
x
}_
t
$
表示序列中第
$
t
$
个元素,也被称作
\alert
{
时刻
$
t
$}
输入。它所对应的输出序列是
$
(
\textbf
{
y
}_
0
,
\textbf
{
y
}_
1
,...,
\textbf
{
y
}_
t,...
)
$
。 在循环神经网络中,每个时刻的输出都可以用同一个
\alert
{
循环单元
}
来描述。
\visible
<2->
{
对于语言模型,一种简单的结构:
}
\visible
<2->
{
{
\small
\begin{tcolorbox}
[bicolor,sidebyside,righthand width=4.3cm,size=title,frame engine=empty,
colback=blue!10!white,colbacklower=black!5!white]
\begin{eqnarray}
\textbf
{
y
}_
t
&
=
&
\textrm
{
Softmax
}
(
\textbf
{
h
}_
t
\textbf
{
V
}
)
\nonumber
\\
\textbf
{
h
}_
t
&
=
&
\textrm
{
TanH
}
(
\textbf
{
x
}_
t
\textbf
{
U
}
+
\textbf
{
h
}_{
t-1
}
\textbf
{
W
}
)
\nonumber
\end{eqnarray}
\footnotesize
{$
\textbf
{
h
}_
t
$
:
$
t
$
时刻的隐层状态
\\
$
\textbf
{
h
}_{
t
-
1
}$
:
$
t
-
1
$
时刻的隐层状态
\\
$
\textbf
{
V
}
,
\textbf
{
U
}
,
\textbf
{
W
}$
: 参数
}
\tcblower
\begin{center}
\begin{tikzpicture}
\begin{scope}
\node
[anchor=west,inner sep=3pt,minimum width=8em] (h) at (0,0)
{
\tiny
{$
\textbf
{
h
}_
t
=
\textrm
{
TanH
}
(
\textbf
{
x
}_
t
\textbf
{
U
}
+
\textbf
{
h
}_{
t
-
1
}
\textbf
{
W
}
)
$}}
;
\node
[anchor=south west,inner sep=3pt] (r) at ([yshift=-0.2em]h.north west)
{
\tiny
{
循环单元:
}}
;
\begin{pgfonlayer}
{
background
}
\node
[rectangle,draw,inner sep=0em,fill=green!20!white] [fit = (r) (h)] (rbox)
{}
;
\end{pgfonlayer}
\node
[anchor=south,draw,minimum width=8em,fill=green!20!white] (y) at ([yshift=1.5em]rbox.north)
{
\tiny
{$
\textbf
{
y
}_
t
=
\textrm
{
Softmax
}
(
\textbf
{
h
}_
t
\textbf
{
V
}
)
$}}
;
\node
[anchor=south,inner sep=2pt] (output) at ([yshift=1em]y.north)
{
\scriptsize
{$
\textbf
{
y
}_
t
$}}
;
\node
[anchor=north,inner sep=2pt] (input) at ([yshift=-1em]h.south)
{
\scriptsize
{$
\textbf
{
x
}_
t
$}}
;
\draw
[->,thick] (input.north) -- ([yshift=-0.1em]rbox.south);
\draw
[->,thick] ([yshift=0.1em]rbox.north) -- ([yshift=-0.1em]y.south) node [pos=0.5,left]
{
\tiny
{$
\textbf
{
h
}_
t
$}}
;
\draw
[->,thick] ([yshift=0.1em]y.north) -- (output.south);
\draw
[->,thick] ([xshift=0.1em]rbox.east) -- ([xshift=1em]rbox.east) node [pos=1,above]
{
\tiny
{$
\textbf
{
h
}_
t
$}}
;
\draw
[->,thick] ([xshift=-1em]rbox.west) -- ([xshift=-0.1em]rbox.west) node [pos=0,above]
{
\tiny
{$
\textbf
{
h
}_{
t
-
1
}$}}
;
\end{scope}
\end{tikzpicture}
\end{center}
\end{tcolorbox}
}
}
\item
<3->
\textbf
{
如何体现循环?
}$
t
$
时刻的状态是
$
t
-
1
$
时刻状态的函数,这个过程可以不断被执行
\end{itemize}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection
{
词嵌入
}
%%%------------------------------------------------------------------------------------------------------------
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论