Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
79689dc0
Commit
79689dc0
authored
May 11, 2020
by
单韦乔
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
第一章,第四章排版调整
parent
695abcea
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
31 行增加
和
6 行删除
+31
-6
Book/Chapter1/chapter1.tex
+1
-1
Book/Chapter4/chapter4.tex
+30
-5
没有找到文件。
Book/Chapter1/chapter1.tex
查看文件 @
79689dc0
...
...
@@ -222,7 +222,7 @@
\centering
\input
{
./Chapter1/Figures/figure-comparison-mt-ht-1
}
\end{figure}
\begin{figure}
[
htp
]
\begin{figure}
[
t
]
\centering
\input
{
./Chapter1/Figures/figure-comparison-mt-ht-2
}
\caption
{
机器翻译与人工翻译实例结果对比
}
...
...
Book/Chapter4/chapter4.tex
查看文件 @
79689dc0
...
...
@@ -1435,7 +1435,7 @@ span\textrm{[0,4]}&=&\textrm{``猫} \quad \textrm{喜欢} \quad \textrm{吃} \qu
\caption
{
基于句法的机器翻译中常用概念
}
\label
{
tab:4-2
}
{
\begin{tabular}
{
l
| l
}
\begin{tabular}
{
p
{
6.5em
}
| l
}
术语
&
说明
\\
\hline
\rule
{
0pt
}{
15pt
}
翻译规则
&
翻译的最小单元(或步骤)
\\
...
...
@@ -1454,6 +1454,18 @@ span\textrm{[0,4]}&=&\textrm{``猫} \quad \textrm{喜欢} \quad \textrm{吃} \qu
\rule
{
0pt
}{
15pt
}
基于树
&
(源语言)使用树结构(大多指句法树)
\\
\rule
{
0pt
}{
15pt
}
基于串
&
(源语言)使用词串,比如串到树翻译系统的解码器一般
\\
&
都是基于串的解码方法
\\
\end{tabular}
}
\end{center}
}
\end{table}
\vspace
{
3em
}
\begin{table}
[htp]
{
\begin{center}
\vspace
{
1em
}
{
\begin{tabular}
{
p
{
6.5em
}
| l
}
术语
&
说明
\\
\hline
\rule
{
0pt
}{
15pt
}
基于森林
&
(源语言)使用句法森林,这里森林只是对多个句法树的一
\\
&
种压缩表示
\\
\rule
{
0pt
}{
15pt
}
词汇化规则
&
含有终结符的规则
\\
...
...
@@ -1638,7 +1650,9 @@ r_9: \quad \textrm{IP(}\textrm{NN}_1\ \textrm{VP}_2) \rightarrow \textrm{S(}\tex
&
&
\ \ \textrm
{
S(NP(DT(the) NNS(imports))
}
\ \textrm
{
VP(VBP
}^{
[6]
}
\ \textrm
{
ADVP(RB(drastically)
}
\ \textrm
{
VBN
}^{
[5]
}
)))
\ \rangle
\nonumber
\\
&
\xrightarrow
[r_4]
{
\textrm
{
VV
}^{
[5]
}
\Leftrightarrow
\textrm
{
VBN
}^{
[5]
}}
&
\langle\ \textrm
{
IP(NN(进口)
}
\ \textrm
{
VP(AD(大幅度)
}
\ \textrm
{
VP(VV(减少)
}
\ \textrm
{
AS
}^{
[6]
}
))),
\hspace
{
10em
}
\nonumber
\\
&
&
\ \ \textrm
{
S(NP(DT(the) NNS(imports))
}
\ \textrm
{
VP(VBP
}^{
[6]
}
\ \nonumber
\\
&
&
\ \ \textrm
{
ADVP(RB(drastically)
}
\ \textrm
{
VBN(fallen)
}
)))
\ \rangle
\nonumber
\\
&
&
\ \ \textrm
{
ADVP(RB(drastically)
}
\ \textrm
{
VBN(fallen)
}
)))
\ \rangle
\nonumber
\end{eqnarray}
\begin{eqnarray}
&
\xrightarrow
[r_6]
{
\textrm
{
AS
}^{
[6]
}
\Leftrightarrow
\textrm
{
VBP
}^{
[6]
}}
&
\langle\ \textrm
{
IP(NN(进口)
}
\ \textrm
{
VP(AD(大幅度)
}
\ \textrm
{
VP(VV(减少)
}
\ \textrm
{
AS(了)
}
))),
\nonumber
\\
&
&
\ \ \textrm
{
S(NP(DT(the) NNS(imports))
}
\ \textrm
{
VP(VBP(have)
}
\ \nonumber
\\
&
&
\ \ \textrm
{
ADVP(RB(drastically)
}
\ \textrm
{
VBN(fallen)
}
)))
\ \rangle
\hspace
{
15em
}
\nonumber
...
...
@@ -2007,7 +2021,7 @@ r_9: \quad \textrm{IP(}\textrm{NN}_1\ \textrm{VP}_2) \rightarrow \textrm{S(}\tex
\parinterval
换一个角度来看,词对齐实际上只是帮助模型找到两种语言句法树中节点的对应关系。如果能够直接得到句法树节点的对应,就可以避免掉词对齐的错误。也就是,可以直接使用节点对齐来进行树到树规则的抽取。首先,利用外部的节点对齐工具获得两棵句法树节点之间的对齐关系。之后,将每个对齐的节点看作是树片段的根节点,再进行规则抽取。图
\ref
{
fig:4-62
}
展示了基于节点对齐的规则抽取结果。
%----------------------------------------------
\begin{figure}
[ht
p
]
\begin{figure}
[ht
b
]
\centering
\input
{
./Chapter4/Figures/tree-to-tree-rule-extraction-base-node-alignment
}
\caption
{
基于节点对齐的树到树规则抽取
}
...
...
@@ -2205,11 +2219,22 @@ d_1 = {d'} \circ {r_5}
\caption
{
基于串的解码 vs 基于树的解码
}
\label
{
tab:4-4
}
{
\begin{tabular}
{
l |
l
l
}
\begin{tabular}
{
l |
p
{
15.5em
}
l
}
对比
&
基于树的解码
&
基于串的解码
\\
\hline
\rule
{
0pt
}{
15pt
}
解码方法
&
$
\hat
{
d
}
=
\arg\max
_{
d
\in
D
_{
\textrm
{
tree
}}}
\textrm
{
score
}
(
d
)
$
&
$
\hat
{
d
}
=
\arg\max
_{
d
\in
D
}
\textrm
{
score
}
(
d
)
$
\\
\rule
{
0pt
}{
15pt
}
搜索空间
&
与输入的源语句法树兼容的推导
$
D
_{
\textrm
{
tree
}}$
&
所有的推导
$
D
$
\\
\rule
{
0pt
}{
15pt
}
搜索空间
&
与输入的源语句法树兼容的推导
$
D
_{
\textrm
{
tree
}}$
&
所有的推导
$
D
$
\end{tabular}
}
\end{center}
}
\end{table}
\begin{table}
[htp]
{
\begin{center}
\vspace
{
1em
}
{
\begin{tabular}
{
l | p
{
15.5em
}
l
}
对比
&
基于树的解码
&
基于串的解码
\\
\hline
\rule
{
0pt
}{
15pt
}
适用模型
&
树到串、树到树
&
所有的句法模型
\\
\rule
{
0pt
}{
15pt
}
解码算法
&
Chart解码
&
CKY + 规则二叉化
\\
\rule
{
0pt
}{
15pt
}
速度
&
快
&
一般较慢
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论