Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
5103b423
Commit
5103b423
authored
Sep 23, 2020
by
曹润柘
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
更新 chapter7.tex
parent
d72e97b7
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
2 行增加
和
2 行删除
+2
-2
Chapter7/chapter7.tex
+2
-2
没有找到文件。
Chapter7/chapter7.tex
查看文件 @
5103b423
...
...
@@ -579,11 +579,11 @@ dr = start_i-end_{i-1}-1
\parinterval
对于每种调序类型,都可以定义一个调序概率,如下:
\begin{eqnarray}
\funp
{
P
}
(
\
mathbf
{
o
}
|
\seq
{
s
}
,
\seq
{
t
}
,
\seq
{
a
}
) =
\prod
_{
i=1
}^{
K
}
\funp
{
P
}
(o
_
i|
\bar
{
s
}_{
a
_
i
}
,
\bar
{
t
}_
i, a
_{
i-1
}
, a
_
i)
\funp
{
P
}
(
\
seq
{
o
}
|
\seq
{
s
}
,
\seq
{
t
}
,
\seq
{
a
}
) =
\prod
_{
i=1
}^{
K
}
\funp
{
P
}
(o
_
i|
\bar
{
s
}_{
a
_
i
}
,
\bar
{
t
}_
i, a
_{
i-1
}
, a
_
i)
\label
{
eq:7-16
}
\end{eqnarray}
\noindent
其中,
$
o
_
i
$
表示(目标语言)第
$
i
$
个短语的调序方向,
$
\
mathbf
{
o
}
=
\{
o
_
i
\}
$
表示短语序列的调序方向,
$
K
$
表示短语的数量。短语之间的调序概率是由双语短语以及短语对齐决定的,
$
o
$
表示调序的种类,可以取M、S、D 中的任意一种。而整个句子调序的好坏就是把相邻的短语之间的调序概率相乘(对应取log后的加法)。这样,公式
\eqref
{
eq:7-16
}
把调序的好坏定义为新的特征,对于M、S、D总共就有三个特征。除了当前短语和前一个短语的调序特征,还可以定义当前短语和后一个短语的调序特征,即将上述公式中的
$
a
_{
i
-
1
}$
换成
$
a
_{
i
+
1
}$
。 于是,又可以得到三个特征。因此在MSD调序中总共可以有6个特征。
\noindent
其中,
$
o
_
i
$
表示(目标语言)第
$
i
$
个短语的调序方向,
$
\
seq
{
o
}
=
\{
o
_
i
\}
$
表示短语序列的调序方向,
$
K
$
表示短语的数量。短语之间的调序概率是由双语短语以及短语对齐决定的,
$
o
$
表示调序的种类,可以取M、S、D 中的任意一种。而整个句子调序的好坏就是把相邻的短语之间的调序概率相乘(对应取log后的加法)。这样,公式
\eqref
{
eq:7-16
}
把调序的好坏定义为新的特征,对于M、S、D总共就有三个特征。除了当前短语和前一个短语的调序特征,还可以定义当前短语和后一个短语的调序特征,即将上述公式中的
$
a
_{
i
-
1
}$
换成
$
a
_{
i
+
1
}$
。 于是,又可以得到三个特征。因此在MSD调序中总共可以有6个特征。
\parinterval
具体实现时,通常使用词对齐对两个短语间的调序关系进行判断。图
\ref
{
fig:7-22
}
展示了这个过程。先判断短语的左上角和右上角是否存在词对齐,再根据其位置对调序类型进行划分。每个短语对应的调序概率都可以用相对频次估计进行计算。而MSD调序模型也相当于在短语表中的每个双语短语后添加6个特征。不过,调序模型一般并不会和短语表一起存储,因此在系统中通常会看到两个独立的模型文件,分别保存短语表和调序模型。
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论