Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
d17f4b26
Commit
d17f4b26
authored
Dec 20, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
wording (sec 15)
parent
243a41c0
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
3 行增加
和
3 行删除
+3
-3
Chapter15/chapter15.tex
+3
-3
没有找到文件。
Chapter15/chapter15.tex
查看文件 @
d17f4b26
...
...
@@ -859,7 +859,7 @@ lr &=& d_{model}^{-0.5}\cdot step\_num^{-0.5}
\sectionnewpage
\section
{
基于树结构的模型
}
\parinterval
在统计机器翻译时代,使用句法树是一种非常有效的机器翻译建模手段(见
{
\chaptereight
}
)。由于句法树是人类运用语言的高级抽象结果,使用句法树可以非常有效地帮助机器翻译系统捕捉句子的结构。将这种知识引入到机器翻译中,能使得翻译系统在译文语法正确性以及流畅度等方面获得进一步的提升,同时也可以消除译文中的歧义,进而得到更准确的译文。在神经机器翻译中,虽然标准的框架
并没有使用句法结构信息,但是引入句法树结构仍然能够进一步提升翻译的质量
\upcite
{
DBLP:conf/acl/LiXTZZZ17
}
。具体来说,由于神经机器翻译模型缺少对于句子结构的理解,会导致一些明显的翻译问题:
\parinterval
在统计机器翻译时代,使用句法树是一种非常有效的机器翻译建模手段(见
{
\chaptereight
}
)。由于句法树是人类运用语言的高级抽象结果,使用句法树可以非常有效地帮助机器翻译系统捕捉句子的结构。将这种知识引入到机器翻译中,能使得翻译系统在译文语法正确性以及流畅度等方面获得进一步的提升,同时也可以消除译文中的歧义,进而得到更准确的译文。在神经机器翻译中,虽然标准的框架
大多基于词串,但是引入句法树结构仍然很有潜力
\upcite
{
DBLP:conf/acl/LiXTZZZ17
}
。具体来说,由于神经机器翻译模型缺少对于句子结构的理解,会导致一些明显的翻译问题:
\begin{itemize}
\vspace
{
0.5em
}
...
...
@@ -877,9 +877,9 @@ lr &=& d_{model}^{-0.5}\cdot step\_num^{-0.5}
\vspace
{
0.5em
}
\end{itemize}
\parinterval
显然,神经机器翻译系统并没有按照合理的句法结构生成译文。也就是说,模型并没有理解句子的结构
\upcite
{
DBLP:conf/acl/LiXTZZZ17
}
。甚至对于一些语言差异很大的语言对,会出现将介词短语翻译成一个词的情况
,这时引入句法结构能够更好地将源语言与目标语言的句法片段进行对应,进而生成符合句法的翻译结果
\upcite
{
DBLP:conf/acl/EriguchiHT16
}
。
\parinterval
显然,神经机器翻译系统并没有按照合理的句法结构生成译文。也就是说,模型并没有理解句子的结构
\upcite
{
DBLP:conf/acl/LiXTZZZ17
}
。甚至对于一些语言差异很大的语言对,会出现将介词短语翻译成一个词的情况
。虽然可以通过不同的手段对上述问题进行求解,但是使用句法树是最直接的一种解决问题的方法
\upcite
{
DBLP:conf/acl/EriguchiHT16
}
。
\parinterval
那么在神经机器翻译中,如何将
树这种离散化的
结构融入到基于分布式表示的翻译模型中呢?目前主流的神经机器翻译模型由编码器和解码器构成,有以下两种策略:
\parinterval
那么在神经机器翻译中,如何将
这种离散化的树
结构融入到基于分布式表示的翻译模型中呢?目前主流的神经机器翻译模型由编码器和解码器构成,有以下两种策略:
\begin{itemize}
\vspace
{
0.5em
}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论