Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
d34cb762
Commit
d34cb762
authored
Nov 16, 2020
by
曹润柘
Browse files
Options
Browse Files
Download
Plain Diff
合并分支 'caorunzhe' 到 'master'
bug fix 查看合并请求
!416
parents
ed12a0aa
396f2f07
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
3 行增加
和
3 行删除
+3
-3
Chapter16/chapter16.tex
+3
-3
没有找到文件。
Chapter16/chapter16.tex
查看文件 @
d34cb762
...
@@ -176,7 +176,7 @@
...
@@ -176,7 +176,7 @@
\parinterval
融合目标语言端的语言模型是一种最直接的使用单语数据的方法。实际上,神经机器翻译模型本身也具备了语言模型的作用,因为在解码器本质上也是一个语言模型,用于描述生成译文词串的规律。类似于语言模型,神经机器翻译模型可以自回归地生成翻译结果。对于一个双语句对
$
(
x, y
)
$
,神经机器翻译模型根据源语言句子
$
x
$
和前面生成的词来预测当前位置词的概率分布:
\parinterval
融合目标语言端的语言模型是一种最直接的使用单语数据的方法。实际上,神经机器翻译模型本身也具备了语言模型的作用,因为在解码器本质上也是一个语言模型,用于描述生成译文词串的规律。类似于语言模型,神经机器翻译模型可以自回归地生成翻译结果。对于一个双语句对
$
(
x, y
)
$
,神经机器翻译模型根据源语言句子
$
x
$
和前面生成的词来预测当前位置词的概率分布:
\begin{eqnarray}
\begin{eqnarray}
\log
_{
P(y | x;
\theta
)
}
=
\sum
_{
t
}{
\log
_
{
P(y
_
t | x, y
_{
<t
}
;
\theta
)
}}
\log
{
P(y | x;
\theta
)
}
=
\sum
_{
t
}{
\log
{
P(y
_
t | x, y
_{
<t
}
;
\theta
)
}}
\label
{
eq:16-1-xc
}
\label
{
eq:16-1-xc
}
\end{eqnarray}
\end{eqnarray}
...
@@ -195,7 +195,7 @@
...
@@ -195,7 +195,7 @@
\parinterval
浅融合通过对神经机器翻译模型和语言模型的预测概率进行插值来得到最终的预测概率:
\parinterval
浅融合通过对神经机器翻译模型和语言模型的预测概率进行插值来得到最终的预测概率:
\begin{eqnarray}
\begin{eqnarray}
\log
_{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
)
}
=
\log
_{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
;
\theta
_{
TM
}
)
}
+
\beta
\log
_
{
\funp
{
P
}
(y
_
t | y
_{
<t
}
;
\theta
_{
LM
}
)
}
\log
{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
)
}
=
\log
{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
;
\theta
_{
TM
}
)
}
+
\beta
\log
{
\funp
{
P
}
(y
_
t | y
_{
<t
}
;
\theta
_{
LM
}
)
}
\label
{
eq:16-2-xc
}
\label
{
eq:16-2-xc
}
\end{eqnarray}
\end{eqnarray}
...
@@ -207,7 +207,7 @@
...
@@ -207,7 +207,7 @@
\parinterval
深融合的预测方式为:
\parinterval
深融合的预测方式为:
\begin{eqnarray}
\begin{eqnarray}
\log
_{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
)
}
=
\log
_
{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
; s
_{
t
}
)
}
\log
{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
)
}
=
\log
{
\funp
{
P
}
(y
_
t | x, y
_{
<t
}
; s
_{
t
}
)
}
\label
{
eq:16-3-xc
}
\label
{
eq:16-3-xc
}
\end{eqnarray}
\end{eqnarray}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论