Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
5e7fad84
Commit
5e7fad84
authored
May 11, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
minor updates of section 4
parent
87a8c036
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
6 行增加
和
6 行删除
+6
-6
Book/Chapter4/Figures/reorder-base-distance.tex
+2
-2
Book/Chapter4/chapter4.tex
+4
-4
没有找到文件。
Book/Chapter4/Figures/reorder-base-distance.tex
查看文件 @
5e7fad84
...
@@ -34,8 +34,8 @@
...
@@ -34,8 +34,8 @@
\node
[anchor=north]
(d1) at ([xshift=-0.1em,yshift=-0.1em]distance.south)
{
+4
}
;
\node
[anchor=north]
(d1) at ([xshift=-0.1em,yshift=-0.1em]distance.south)
{
+4
}
;
\node
[anchor=north]
(d2) at ([yshift=-1.8em]d1.south)
{
-5
}
;
\node
[anchor=north]
(d2) at ([yshift=-1.8em]d1.south)
{
-5
}
;
\node
[anchor=north west,fill=blue!20]
(m1) at ([xshift=-1em,yshift=-0.0em]t1.south west)
{
\small
{$
\textrm
{
start
}_
1
\
-
\ \textrm
{
end
}
_{
0
}
\
-
\
1
$
\
=
\
5
\
-
\
0
\
-
\
1
}}
;
\node
[anchor=north west,fill=blue!20]
(m1) at ([xshift=-1em,yshift=-0.0em]t1.south west)
{
\small
{$
start
_
1
\
-
\
end
_{
0
}
\
-
\
1
$
\
=
\
5
\
-
\
0
\
-
\
1
}}
;
\node
[anchor=north west,fill=blue!20]
(m2) at ([xshift=-1em,yshift=-0.0em]t2.south west)
{
\small
{$
\textrm
{
start
}_
2
\
-
\ \textrm
{
end
}
_{
1
}
\
-
\
1
$
\
=
\
1
\
-
\
5
\
-
\
1
}}
;
\node
[anchor=north west,fill=blue!20]
(m2) at ([xshift=-1em,yshift=-0.0em]t2.south west)
{
\small
{$
start
_
2
\
-
\
end
_{
1
}
\
-
\
1
$
\
=
\
1
\
-
\
5
\
-
\
1
}}
;
\draw
[-]
([xshift=0.02in]target.south west)--([xshift=2in]target.south west);
\draw
[-]
([xshift=0.02in]target.south west)--([xshift=2in]target.south west);
...
...
Book/Chapter4/chapter4.tex
查看文件 @
5e7fad84
...
@@ -537,13 +537,13 @@ d = {(\bar{s}_{\bar{a}_1},\bar{t}_1)} \circ {(\bar{s}_{\bar{a}_2},\bar{t}_2)} \c
...
@@ -537,13 +537,13 @@ d = {(\bar{s}_{\bar{a}_1},\bar{t}_1)} \circ {(\bar{s}_{\bar{a}_2},\bar{t}_2)} \c
\parinterval
基于距离的调序是最简单的一种调序模型。很多时候,语言的翻译基本上都是顺序的,也就是,译文单词出现的顺序和源语言单词的顺序基本上是一致的。反过来说,如果译文和源语言单词(或短语)的顺序差别很大,就认为出现了调序。
\parinterval
基于距离的调序是最简单的一种调序模型。很多时候,语言的翻译基本上都是顺序的,也就是,译文单词出现的顺序和源语言单词的顺序基本上是一致的。反过来说,如果译文和源语言单词(或短语)的顺序差别很大,就认为出现了调序。
\parinterval
基于距离的调序方法的核心思想就是度量当前翻译结果与顺序翻译之间的差距。对于译文中的第
$
i
$
个短语,令
$
\textrm
{
start
}_
i
$
表示它所对应的源语言短语中第一个词所在的位置,
$
\textrm
{
end
}
_
i
$
是这个短语中最后一个词所在的位置。于是,这个短语(相对于前一个短语)的调序距离为:
\parinterval
基于距离的调序方法的核心思想就是度量当前翻译结果与顺序翻译之间的差距。对于译文中的第
$
i
$
个短语,令
$
start
_
i
$
表示它所对应的源语言短语中第一个词所在的位置,
$
end
_
i
$
是这个短语中最后一个词所在的位置。于是,这个短语(相对于前一个短语)的调序距离为:
\begin{eqnarray}
\begin{eqnarray}
dr =
\textrm
{
start
}_
i-
\textrm
{
end
}
_{
i-1
}
-1
dr =
start
_
i-end
_{
i-1
}
-1
\label
{
eq:4-15
}
\label
{
eq:4-15
}
\end{eqnarray}
\end{eqnarray}
\parinterval
在图
\ref
{
fig:4-20
}
的例子中,``the apple''所对应的调序距离为4,``在桌子上的''所对应的调序距离为-5。显然,如果两个源语短语按顺序翻译,则
$
\textrm
{
start
}_
i
=
\textrm
{
end
}
_{
i
-
1
}
+
1
$
,这时调序距离为0。
\parinterval
在图
\ref
{
fig:4-20
}
的例子中,``the apple''所对应的调序距离为4,``在桌子上的''所对应的调序距离为-5。显然,如果两个源语短语按顺序翻译,则
$
start
_
i
=
end
_{
i
-
1
}
+
1
$
,这时调序距离为0。
%----------------------------------------------
%----------------------------------------------
\begin{figure}
[htp]
\begin{figure}
[htp]
...
@@ -797,7 +797,7 @@ dr = \textrm{start}_i-\textrm{end}_{i-1}-1
...
@@ -797,7 +797,7 @@ dr = \textrm{start}_i-\textrm{end}_{i-1}-1
\subsubsection
{
翻译假设扩展
}
\subsubsection
{
翻译假设扩展
}
\parinterval
下一步,需要使用这些翻译候选生成完整的译文。在机器翻译中,一个很重要的概念是
{
\small\bfnew
{
翻译假设
}}
\index
{
翻译假设
}
(Translation Hypothesis)
\index
{
Translation Hypothesis
}
。它可以被当作是一个局部译文所对应的短语翻译推导。在解码开始时,只有一个空假设,也就是任何译文单词都没有被生成出来。接着,可以挑选翻译选项来扩展当前的翻译假设。图
\ref
{
fig:4-28
}
展示了翻译假设扩展的过程。在翻译假设扩展时,需要保证新加入的翻译候选放置在旧翻译假设译文的右侧,也就是要确保翻译自左向右的连续性。而且,同一个翻译假设可以使用不同的翻译候选进行扩展。例如,扩展第一个翻译假设时,可以选择``桌子''的翻译候选``table'';也可以选择``有''的翻译候选``There is''。扩展完之后需要记录输入句子中已翻译的短语,同时计算当前所有翻译假设的模型得分。这个过程相当于生成了一个图的结构,每个节点代表了一个翻译假设。当翻译假设覆盖了输入句子所有的短语,不能被继续扩展时,就生成了一个完整的翻译假设(译文)。最后需要找到得分最高的完整翻译假设,它对应了搜索图中的最优路径。
\parinterval
下一步,需要使用这些翻译候选生成完整的译文。在机器翻译中,一个很重要的概念是
{
\small\bfnew
{
翻译假设
}}
\index
{
翻译假设
}
(Translation Hypothesis)
\index
{
Translation Hypothesis
}
。
它可以被当作是一个局部译文所对应的短语翻译推导。在解码开始时,只有一个空假设,也就是任何译文单词都没有被生成出来。接着,可以挑选翻译选项来扩展当前的翻译假设。图
\ref
{
fig:4-28
}
展示了翻译假设扩展的过程。在翻译假设扩展时,需要保证新加入的翻译候选放置在旧翻译假设译文的右侧,也就是要确保翻译自左向右的连续性。而且,同一个翻译假设可以使用不同的翻译候选进行扩展。例如,扩展第一个翻译假设时,可以选择``桌子''的翻译候选``table'';也可以选择``有''的翻译候选``There is''。扩展完之后需要记录输入句子中已翻译的短语,同时计算当前所有翻译假设的模型得分。这个过程相当于生成了一个图的结构,每个节点代表了一个翻译假设。当翻译假设覆盖了输入句子所有的短语,不能被继续扩展时,就生成了一个完整的翻译假设(译文)。最后需要找到得分最高的完整翻译假设,它对应了搜索图中的最优路径。
%----------------------------------------------
%----------------------------------------------
\begin{figure}
[htp]
\begin{figure}
[htp]
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论