Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
2cb7736f
Commit
2cb7736f
authored
5 years ago
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
bug fixes (section 3, book)
parent
29e17635
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
4 行增加
和
4 行删除
+4
-4
Book/Chapter3/Chapter3.tex
+4
-4
没有找到文件。
Book/Chapter3/Chapter3.tex
查看文件 @
2cb7736f
...
@@ -1208,7 +1208,7 @@ p_0+p_1 & = & 1 \label{eqC3.62-new}
...
@@ -1208,7 +1208,7 @@ p_0+p_1 & = & 1 \label{eqC3.62-new}
\label
{
eqC3.67-new
}
\label
{
eqC3.67-new
}
\end{eqnarray}
\end{eqnarray}
\parinterval
我们用图
\ref
{
fig:3-34
}
的例子来进行公式说明。在IBM模型1-2中,词语的对齐都是与单词所在的绝对位置有关。但在HMM词对齐模型中,``你''对齐到``you''被形式化为
$
\textrm
{
P
}
(
a
_{
j
}
│a
_{
j
-
1
}
,l
)=
P
(
5
|
4
,
5
)
$
,意思是对于源文位置
$
3
(
j
=
3
)
$
的词,如果它的目标译文是5个词,上一个对齐位置是
$
4
(
a
_{
2
}
=
4
)
$
,对齐到目标语译文位置
$
5
(
a
_{
j
}
=
5
)
$
的概率是多少?理想的情况下,通过
$
P
(
a
_{
j
}
|a
_{
j
-
1
}
,l
)
$
,``你''对齐到``you''应该得到更高的概率,并且由于源语词``对''和``你''距离很近,因此其对应的对齐位置``with''和``you''的距离也应该很近。
\parinterval
我们用图
\ref
{
fig:3-34
}
的例子来进行公式说明。在IBM模型1-2中,词语的对齐都是与单词所在的绝对位置有关。但在HMM词对齐模型中,``你''对齐到``you''被形式化为
$
\textrm
{
P
}
(
a
_{
j
}
|a
_{
j
-
1
}
,l
)=
P
(
5
|
4
,
5
)
$
,意思是对于源文位置
$
3
(
j
=
3
)
$
的词,如果它的目标译文是5个词,上一个对齐位置是
$
4
(
a
_{
2
}
=
4
)
$
,对齐到目标语译文位置
$
5
(
a
_{
j
}
=
5
)
$
的概率是多少?理想的情况下,通过
$
\textrm
{
P
}
(
a
_{
j
}
|a
_{
j
-
1
}
,l
)
$
,``你''对齐到``you''应该得到更高的概率,并且由于源语词``对''和``你''距离很近,因此其对应的对齐位置``with''和``you''的距离也应该很近。
\parinterval
因此,把公式
\ref
{
eqC3.23-new
}
和
\ref
{
eqC3.67-new
}
重新带入公式1.19和1.18,可得HMM词对齐模型的数学描述:
\parinterval
因此,把公式
\ref
{
eqC3.23-new
}
和
\ref
{
eqC3.67-new
}
重新带入公式1.19和1.18,可得HMM词对齐模型的数学描述:
\begin{eqnarray}
\begin{eqnarray}
...
@@ -1216,13 +1216,13 @@ p_0+p_1 & = & 1 \label{eqC3.62-new}
...
@@ -1216,13 +1216,13 @@ p_0+p_1 & = & 1 \label{eqC3.62-new}
\label
{
eqC3.68-new
}
\label
{
eqC3.68-new
}
\end{eqnarray}
\end{eqnarray}
\parinterval
此外,为了使得HMM的对齐概率
$
\textrm
{
P
}
(
a
_{
j
}
│a
_{
j
-
1
}
,l
)
$
满足归一化的条件,这里还假设其对齐概率只取决于
$
(
a
_{
j
}
-
a
_{
j
-
1
}
)
$
,即:
\parinterval
此外,为了使得HMM的对齐概率
$
\textrm
{
P
}
(
a
_{
j
}
|a
_{
j
-
1
}
,l
)
$
满足归一化的条件,这里还假设其对齐概率只取决于
$
a
_{
j
}
-
a
_{
j
-
1
}
$
,即:
\begin{eqnarray}
\begin{eqnarray}
\textrm
{
P
}
(a
_{
j
}
|a
_{
j-1
}
,l)=
\frac
{
\mathbf
{
s
}
(a
_{
j
}
-a
_{
j-1
}
)
}{
\sum
_{
i=1
}^{
l
}{
s(i-a
_{
j-1
}
)
}}
\textrm
{
P
}
(a
_{
j
}
|a
_{
j-1
}
,l)=
\frac
{
s
(a
_{
j
}
-a
_{
j-1
}
)
}{
\sum
_{
i=1
}^{
l
}{
s(i-a
_{
j-1
}
)
}}
\label
{
eqC3.69-new
}
\label
{
eqC3.69-new
}
\end{eqnarray}
\end{eqnarray}
\
parinterval
其中,
$
s
(
\cdot
)
$
是一个非线性变换,其取值不小于0。
\
noindent
其中,
$
s
(
\cdot
)
$
是一个非线性变换,其取值不小于0。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\subsection
{
解码和训练
}
\index
{
Chapter3.5.5
}
\subsection
{
解码和训练
}
\index
{
Chapter3.5.5
}
...
...
This diff is collapsed.
Click to expand it.
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论