Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
单韦乔
Toy-MT-Introduction
Commits
b9ffa081
Commit
b9ffa081
authored
Feb 11, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Plain Diff
Merge commit '
d2b2d26c
'
parents
aea42a05
d2b2d26c
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
38 行增加
和
18 行删除
+38
-18
Section04-Phrasal-and-Syntactic-Models/section04.tex
+28
-3
Section06-Neural-Machine-Translation/section06.tex
+10
-15
没有找到文件。
Section04-Phrasal-and-Syntactic-Models/section04.tex
查看文件 @
b9ffa081
...
...
@@ -1819,10 +1819,10 @@ $d$是一个$(\textbf{s},\textbf{t})$上基于短语的翻译推导,$\textrm{P
%%------------------------------------------------------------------------------------------------------------
%% 改进方法
\begin{frame}
{
更好更多的短语
}
%
\begin{frame}{更好更多的短语}
% 提高词对齐性能 -> 增加短语质量? -> 提高翻译质量?
% 提高Recall,对于不同任务,词对齐的密度更重要?
\end{frame}
%
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 如何度量短语的好坏
...
...
@@ -1974,9 +1974,34 @@ $d$是一个$(\textbf{s},\textbf{t})$上基于短语的翻译推导,$\textrm{P
%%%------------------------------------------------------------------------------------------------------------
%%% 展示短语表的内容
\begin{frame}
{
短语表实例
}
\begin{itemize}
\item
下面来看一个真实的短语表例子
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\node
[anchor=west] (s1) at (0,0)
{
\scriptsize
{
报告 认为
$
\vert\vert\vert
$
report holds that
$
\vert\vert\vert
$
-2.62 -5.81 -0.91 -2.85 1 0
$
\vert\vert\vert
$
4
$
\vert\vert\vert
$
0-0 1-1 1-2
}}
;
\node
[anchor=west] (s2) at ([yshift=-1.2em]s1.west)
{
\scriptsize
{
,悲伤
$
\vert\vert\vert
$
, sadness
$
\vert\vert\vert
$
-1.946 -3.659 0 -3.709 1 0
$
\vert\vert\vert
$
1
$
\vert\vert\vert
$
0-0 1-1
}}
;
\node
[anchor=west] (s3) at ([yshift=-1.2em]s2.west)
{
\scriptsize
{
,北京 等
$
\vert\vert\vert
$
, beijing , and other
$
\vert\vert\vert
$
0 -7.98 0 -3.84 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
0-0 1-1 2-2 2-3 2-4
}}
;
\node
[anchor=west] (s4) at ([yshift=-1.2em]s3.west)
{
\scriptsize
{
,北京 及
$
\vert\vert\vert
$
, beijing , and
$
\vert\vert\vert
$
-0.69 -1.45 -0.92 -4.80 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
0-0 1-1 2-2
}}
;
\node
[anchor=west] (s5) at ([yshift=-1.2em]s4.west)
{
\scriptsize
{
一个 中国
$
\vert\vert\vert
$
one china
$
\vert\vert\vert
$
0 -1.725 0 -1.636 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
1-1 2-2
}}
;
\node
[anchor=west] (s7) at ([yshift=-1.1em]s5.west)
{
\scriptsize
{
...
}}
;
\node
[anchor=west] (s6) at ([yshift=1.0em]s1.west)
{
\scriptsize
{
...
}}
;
\begin{pgfonlayer}
{
background
}
\node
[rectangle,inner sep=0.3em,fill=red!20] [fit = (s1) (s3) (s4) (s6) (s7)] (box1)
{}
;
\end{pgfonlayer}
\end{tikzpicture}
\end{center}
\item
在短语表的例子中,每行使用
$
\vert\vert\vert
$
划分为五个部分
\begin{itemize}
\item
第一部分为源语端的短语
\item
第二部分为目标语端的短语
\item
第三部分为多个特征的值,包含了短语翻译概率、词汇翻译概率等特征
\item
第四部分为短语对在短语抽取集合中出现的频率
\item
第五部分为词对齐信息
\end{itemize}
\end{itemize}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection
{
调序
}
...
...
Section06-Neural-Machine-Translation/section06.tex
查看文件 @
b9ffa081
...
...
@@ -4040,9 +4040,8 @@ $\textrm{``you''} = \argmax_{y} \textrm{P}(y|\textbf{s}_1, \alert{\textbf{C}})$
\begin{itemize}
\item
Transformer 总体结构
\end{itemize}
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\begin{scope}
...
...
@@ -4081,7 +4080,7 @@ $\textrm{``you''} = \argmax_{y} \textrm{P}(y|\textbf{s}_1, \alert{\textbf{C}})$
\node
[posnode,anchor=north east] (pos2) at ([yshift=-1em]sa2.south east)
{
\tiny
{$
\textbf
{
Postion
}$}}
;
\node
[anchor=north] (outputs) at ([yshift=-3em]sa2.south)
{
\tiny
{$
\textbf
{
解码器输入:
$
<
$
SOS
$
>
$
I am fine
}$}}
;
\node
[anchor=east] (decoder) at ([xshift=-1em,yshift=-1.5em]o1.west)
{
\scriptsize
{
\textbf
{
解码器
}}}
;
\node
[anchor=north] (decoutputs) at ([yshift=1.5em]o1.north)
{
\tiny
{$
\textbf
{
解码器输出: I am fine
$
<
$
EOS
$
>
$
}$}}
;
\draw
[->] (sa2.north) -- (res3.south);
\draw
[->] (res3.north) -- (ed1.south);
...
...
@@ -4121,9 +4120,8 @@ $\textrm{``you''} = \argmax_{y} \textrm{P}(y|\textbf{s}_1, \alert{\textbf{C}})$
\begin{itemize}
\item
Transformer 输入和位置编码
\end{itemize}
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\begin{scope}
...
...
@@ -4162,7 +4160,7 @@ $\textrm{``you''} = \argmax_{y} \textrm{P}(y|\textbf{s}_1, \alert{\textbf{C}})$
\node
[posnode,anchor=north east] (pos2) at ([yshift=-1em]sa2.south east)
{
\tiny
{$
\textbf
{
Postion
}$}}
;
\node
[anchor=north] (outputs) at ([yshift=-3em]sa2.south)
{
\tiny
{$
\textbf
{
解码器输入:
$
<
$
SOS
$
>
$
I am fine
}$}}
;
\node
[anchor=east] (decoder) at ([xshift=-1em,yshift=-1.5em]o1.west)
{
\scriptsize
{
\textbf
{
解码器
}}}
;
\node
[anchor=north] (decoutputs) at ([yshift=1.5em]o1.north)
{
\tiny
{$
\textbf
{
解码器输出: I am fine
$
<
$
EOS
$
>
$
}$}}
;
\draw
[->] (sa2.north) -- (res3.south);
\draw
[->] (res3.north) -- (ed1.south);
...
...
@@ -4352,9 +4350,8 @@ PE_{(pos,2i+1)} = cos(pos/10000^{2i/d_{model}})
\begin{itemize}
\item
Transformer 多头自注意力机制
\end{itemize}
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\begin{scope}
...
...
@@ -4393,7 +4390,7 @@ PE_{(pos,2i+1)} = cos(pos/10000^{2i/d_{model}})
\node
[posnode,anchor=north east] (pos2) at ([yshift=-1em]sa2.south east)
{
\tiny
{$
\textbf
{
Postion
}$}}
;
\node
[anchor=north] (outputs) at ([yshift=-3em]sa2.south)
{
\tiny
{$
\textbf
{
解码器输入:
$
<
$
SOS
$
>
$
I am fine
}$}}
;
\node
[anchor=east] (decoder) at ([xshift=-1em,yshift=-1.5em]o1.west)
{
\scriptsize
{
\textbf
{
解码器
}}}
;
\node
[anchor=north] (decoutputs) at ([yshift=1.5em]o1.north)
{
\tiny
{$
\textbf
{
解码器输出: I am fine
$
<
$
EOS
$
>
$
}$}}
;
\draw
[->] (sa2.north) -- (res3.south);
\draw
[->] (res3.north) -- (ed1.south);
...
...
@@ -4739,9 +4736,8 @@ PE_{(pos,2i+1)} = cos(pos/10000^{2i/d_{model}})
\begin{itemize}
\item
Transformer 残差和层正则化
\end{itemize}
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\begin{scope}
...
...
@@ -4780,7 +4776,7 @@ PE_{(pos,2i+1)} = cos(pos/10000^{2i/d_{model}})
\node
[posnode,anchor=north east] (pos2) at ([yshift=-1em]sa2.south east)
{
\tiny
{$
\textbf
{
Postion
}$}}
;
\node
[anchor=north] (outputs) at ([yshift=-3em]sa2.south)
{
\tiny
{$
\textbf
{
解码器输入:
$
<
$
SOS
$
>
$
I am fine
}$}}
;
\node
[anchor=east] (decoder) at ([xshift=-1em,yshift=-1.5em]o1.west)
{
\scriptsize
{
\textbf
{
解码器
}}}
;
\node
[anchor=north] (decoutputs) at ([yshift=1.5em]o1.north)
{
\tiny
{$
\textbf
{
解码器输出: I am fine
$
<
$
EOS
$
>
$
}$}}
;
\draw
[->] (sa2.north) -- (res3.south);
\draw
[->] (res3.north) -- (ed1.south);
...
...
@@ -4964,9 +4960,8 @@ x_{l+1} = x_l+\mathcal{F}(x_l)
\begin{itemize}
\item
Transformer 前馈全连接网络
\end{itemize}
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\begin{scope}
...
...
@@ -5005,7 +5000,7 @@ x_{l+1} = x_l+\mathcal{F}(x_l)
\node
[posnode,anchor=north east] (pos2) at ([yshift=-1em]sa2.south east)
{
\tiny
{$
\textbf
{
Postion
}$}}
;
\node
[anchor=north] (outputs) at ([yshift=-3em]sa2.south)
{
\tiny
{$
\textbf
{
解码器输入:
$
<
$
SOS
$
>
$
I am fine
}$}}
;
\node
[anchor=east] (decoder) at ([xshift=-1em,yshift=-1.5em]o1.west)
{
\scriptsize
{
\textbf
{
解码器
}}}
;
\node
[anchor=north] (decoutputs) at ([yshift=1.5em]o1.north)
{
\tiny
{$
\textbf
{
解码器输出: I am fine
$
<
$
EOS
$
>
$
}$}}
;
\draw
[->] (sa2.north) -- (res3.south);
\draw
[->] (res3.north) -- (ed1.south);
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论