Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
a0890aa2
Commit
a0890aa2
authored
Jan 13, 2021
by
曹润柘
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
5 6排版
parent
46922787
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
36 行增加
和
27 行删除
+36
-27
Chapter5/chapter5.tex
+35
-23
Chapter6/chapter6.tex
+1
-4
没有找到文件。
Chapter5/chapter5.tex
查看文件 @
a0890aa2
...
...
@@ -469,13 +469,14 @@ g(\seq{s},\seq{t}) & \equiv & \prod_{j,i \in \widehat{A}}{\funp{P}(s_j,t_i)} \ti
%----------------------------------------------
\parinterval
已经有工作证明机器翻译问题是NP难的
\upcite
{
knight1999decoding
}
。对于如此巨大的搜索空间,需要一种十分高效的搜索算法才能实现机器翻译的解码。在
{
\chaptertwo
}
已经介绍一些常用的搜索方法。这里使用一种贪婪的搜索方法实现机器翻译的解码。它把解码分成若干步骤,每步只翻译一个单词,并保留当前“ 最好”的结果,直至所有源语言单词都被翻译完毕。
\vspace
{
0.3em
}
%----------------------------------------------
\begin{figure}
[htp]
\centering
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-pseudo-code
}
\caption
{
贪婪的机器翻译解码算法的伪代码
}
\label
{
fig:5-10
}
\subfigure
{
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-process-1
}}
\subfigure
{
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-process-3
}}
\caption
{
贪婪的机器翻译解码过程实例
}
\label
{
fig:5-11
}
\end{figure}
%----------------------------------------------
...
...
@@ -484,14 +485,13 @@ g(\seq{s},\seq{t}) & \equiv & \prod_{j,i \in \widehat{A}}{\funp{P}(s_j,t_i)} \ti
%----------------------------------------------
\begin{figure}
[htp]
\centering
\subfigure
{
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-process-1
}}
\subfigure
{
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-process-3
}}
\caption
{
贪婪的机器翻译解码过程实例
}
\label
{
fig:5-11
}
\input
{
./Chapter5/Figures/figure-greedy-mt-decoding-pseudo-code
}
\caption
{
贪婪的机器翻译解码算法的伪代码
}
\label
{
fig:5-10
}
\end{figure}
%----------------------------------------------
该算法的核心在于,系统一直维护一个当前最好的结果,之后每一步考虑扩展这个结果的所有可能,并计算模型得分,然后再保留扩展后的最好结果。注意,在每一步中,只有排名第一的结果才会被保留,其他结果都会被丢弃。这也体现了贪婪的思想。显然这个方法不能保证搜索到全局最优的结果,但是由于每次扩展只考虑一个最好的结果,因此该方法速度很快。图
\ref
{
fig:5-11
}
给出了算法执行过程的简单示例。当然,机器翻译的解码方法有很多,这里仅仅使用简单的贪婪搜索方法来解决机器翻译的解码问题,在后续章节会对更加优秀的解码方法进行介绍。
\parinterval
该算法的核心在于,系统一直维护一个当前最好的结果,之后每一步考虑扩展这个结果的所有可能,并计算模型得分,然后再保留扩展后的最好结果。注意,在每一步中,只有排名第一的结果才会被保留,其他结果都会被丢弃。这也体现了贪婪的思想。显然这个方法不能保证搜索到全局最优的结果,但是由于每次扩展只考虑一个最好的结果,因此该方法速度很快。图
\ref
{
fig:5-11
}
给出了算法执行过程的简单示例。当然,机器翻译的解码方法有很多,这里仅仅使用简单的贪婪搜索方法来解决机器翻译的解码问题,在后续章节会对更加优秀的解码方法进行介绍。
%----------------------------------------------------------------------------------------
% NEW SECTION
...
...
@@ -875,7 +875,7 @@ g(\seq{s},\seq{t}) & \equiv & \prod_{j,i \in \widehat{A}}{\funp{P}(s_j,t_i)} \ti
\begin{eqnarray}
&
&
\textrm
{
max
}
\Big
(
\frac
{
\varepsilon
}{
(l+1)
^
m
}
\prod
_{
j=1
}^{
m
}
\sum
_{
i=0
}^{
l
}{
f(
{
s
_
j|t
_
i
}
)
}
\Big
)
\nonumber
\\
&
\textrm
{
s.t.
}
&
\textrm
{
任意单词
}
t
_{
y
}
:
\;\sum
_{
s
_
x
}{
f(s
_
x|t
_
y)
}
= 1
\nonumber
\label
{
eq:5-
31
}
\label
{
eq:5-
29-30
}
\end{eqnarray}
\noindent
其中,
$
\textrm
{
max
}
(
\cdot
)
$
表示最大化,
$
\frac
{
\varepsilon
}{
(
l
+
1
)
^
m
}
\prod
_{
j
=
1
}^{
m
}
\sum
_{
i
=
0
}^{
l
}{
f
(
{
s
_
j|t
_
i
}
)
}$
是目标函数,
$
f
(
{
s
_
j|t
_
i
}
)
$
是模型的参数,
$
\sum
_{
s
_
x
}{
f
(
s
_
x|t
_
y
)
}
=
1
$
是优化的约束条件,以保证翻译概率满足归一化的要求。需要注意的是
$
\{
f
(
s
_
x |t
_
y
)
\}
$
对应了很多参数,每个源语言单词和每个目标语单词的组合都对应一个参数
$
f
(
s
_
x |t
_
y
)
$
。
...
...
@@ -916,42 +916,42 @@ L(f,\lambda)&=&\frac{\varepsilon}{(l+1)^m}\prod_{j=1}^{m}\sum_{i=0}^{l}{f(s_j|t_
\noindent
这里
$
s
_
u
$
和
$
t
_
v
$
分别表示源语言和目标语言词表中的某一个单词。为了求
$
\frac
{
\partial
\big
[
\prod\limits
_{
j
=
1
}^{
m
}
\sum\limits
_{
i
=
0
}^{
l
}
f
(
s
_
j|t
_
i
)
\big
]
}{
\partial
f
(
s
_
u|t
_
v
)
}$
,这里引入一个辅助函数。令
$
g
(
z
)=
\alpha
z
^{
\beta
}$
为变量
$
z
$
的函数,显然,
$
\frac
{
\partial
g
(
z
)
}{
\partial
z
}
=
\alpha
\beta
z
^{
\beta
-
1
}
=
\frac
{
\beta
}{
z
}
\alpha
z
^{
\beta
}
=
\frac
{
\beta
}{
z
}
g
(
z
)
$
。这里可以把
$
\prod
_{
j
=
1
}^{
m
}
\sum
_{
i
=
0
}^{
l
}
f
(
s
_
j|t
_
i
)
$
看做
$
g
(
z
)=
\alpha
z
^{
\beta
}$
的实例。首先,令
$
z
=
\sum
_{
i
=
0
}^{
l
}
f
(
s
_
u|t
_
i
)
$
,注意
$
s
_
u
$
为给定的源语单词。然后,把
$
\beta
$
定义为
$
\sum
_{
i
=
0
}^{
l
}
f
(
s
_
u|t
_
i
)
$
在
$
\prod
_{
j
=
1
}^{
m
}
\sum
_{
i
=
0
}^{
l
}
f
(
s
_
j|t
_
i
)
$
中出现的次数,即源语句子中与
$
s
_
u
$
相同的单词的个数。
\vspace
{
-1em
}
\begin{eqnarray}
\beta
&
=
&
\sum
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
\label
{
eq:5-32
}
\end{eqnarray}
\noindent
其中,当
$
x
=
y
$
时,
$
\delta
(
x,y
)=
1
$
,否则为0。
\parinterval
根据
$
\frac
{
\partial
g
(
z
)
}{
\partial
z
}
=
\frac
{
\beta
}{
z
}
g
(
z
)
$
,可以得到
\vspace
{
-0.5em
}
\begin{eqnarray}
\frac
{
\partial
g(z)
}{
\partial
z
}&
=
&
\frac
{
\partial
\big
[ \prod\limits_{j=1}^{m} \sum\limits_{i=0}^{l} f(s_j|t_i) \big]
}{
\partial
\big
[ \sum\limits_{i=0}^{l}f(s_u|t_i) \big]
}
\nonumber
\\
&
=
&
\frac
{
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i)
\frac
{
\partial
g(z)
}{
\partial
z
}&
=
&
\frac
{
\partial
\big
[ \prod\limits_{j=1}^{m} \sum\limits_{i=0}^{l} f(s_j|t_i) \big]
}{
\partial
\big
[ \sum\limits_{i=0}^{l}f(s_u|t_i) \big]
}
\nonumber
\\
&
=
&
\frac
{
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i)
\label
{
eq:5-33
}
\end{eqnarray}
\parinterval
根据
$
\frac
{
\partial
g
(
z
)
}{
\partial
z
}$
和
$
\frac
{
\partial
z
}{
\partial
f
}$
计算的结果,可以得到
\vspace
{
-0.5em
}
\begin{eqnarray}
{
\frac
{
\partial
\big
[ \prod_{j=1}^{m} \sum_{i=0}^{l} f(s_j|t_i) \big]
}{
\partial
f(s
_
u|t
_
v)
}}&
=
&
{{
\frac
{
\partial
\big
[ \prod\limits_{j=1}^{m} \sum\limits_{i=0}^{l} f(s_j|t_i) \big]
}{
\partial
\big
[ \sum\limits_{i=0}^{l}f(s_u|t_i) \big]
}}
\cdot
{
\frac
{
\partial
\big
[ \sum\limits_{i=0}^{l}f(s_u|t_i) \big]
}{
\partial
f(s
_
u|t
_
v)
}}}
\nonumber
\\
&
=
&{
\frac
{
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i)
\cdot
\sum\limits
_{
i=0
}^{
l
}
\delta
(t
_
i,t
_
v)
}
\label
{
eq:5-34
}
\end{eqnarray}
\parinterval
将
$
\frac
{
\partial
\big
[
\prod
_{
j
=
1
}^{
m
}
\sum
_{
i
=
0
}^{
l
}
f
(
s
_
j|t
_
i
)
\big
]
}{
\partial
f
(
s
_
u|t
_
v
)
}$
进一步代入
$
\frac
{
\partial
L
(
f,
\lambda
)
}{
\partial
f
(
s
_
u|t
_
v
)
}$
,得到
$
L
(
f,
\lambda
)
$
的导数
\vspace
{
-0.5em
}
\begin{eqnarray}
&
&{
\frac
{
\partial
L(f,
\lambda
)
}{
\partial
f(s
_
u|t
_
v)
}}
\nonumber
\\
&
=
&{
\frac
{
\varepsilon
}{
(l+1)
^{
m
}}
\cdot
\frac
{
\partial
\big
[ \prod\limits_{j=1}^{m} \sum\limits_{i=0}^{l} f(s_j|t_{a_j}) \big]
}{
\partial
f(s
_
u|t
_
v)
}
-
\lambda
_{
t
_
v
}}
\nonumber
\\
{
\frac
{
\partial
L(f,
\lambda
)
}{
\partial
f(s
_
u|t
_
v)
}}
&
=
&{
\frac
{
\varepsilon
}{
(l+1)
^{
m
}}
\cdot
\frac
{
\partial
\big
[ \prod\limits_{j=1}^{m} \sum\limits_{i=0}^{l} f(s_j|t_{a_j}) \big]
}{
\partial
f(s
_
u|t
_
v)
}
-
\lambda
_{
t
_
v
}}
\nonumber
\\
&
=
&{
\frac
{
\varepsilon
}{
(l+1)
^{
m
}}
\frac
{
\sum
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
\cdot
\sum
_{
i=0
}^{
l
}
\delta
(t
_
i,t
_
v)
}{
\sum
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i) -
\lambda
_{
t
_
v
}}
\label
{
eq:5-35
}
\end{eqnarray}
\parinterval
令
$
\frac
{
\partial
L
(
f,
\lambda
)
}{
\partial
f
(
s
_
u|t
_
v
)
}
=
0
$
,有
\vspace
{
-1em
}
\begin{eqnarray}
f(s
_
u|t
_
v)
&
=
&
\frac
{
\lambda
_{
t
_
v
}^{
-1
}
\varepsilon
}{
(l+1)
^{
m
}}
\cdot
\frac
{
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
\cdot
\sum\limits
_{
i=0
}^{
l
}
\delta
(t
_
i,t
_
v)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i)
\cdot
f(s
_
u|t
_
v)
\label
{
eq:5-36
}
\end{eqnarray}
\parinterval
将上式稍作调整得到下式:
\vspace
{
-1em
}
\begin{eqnarray}
f(s
_
u|t
_
v)
&
=
&
\lambda
_{
t
_
v
}^{
-1
}
\frac
{
\varepsilon
}{
(l+1)
^{
m
}}
\prod\limits
_{
j=1
}^{
m
}
\sum\limits
_{
i=0
}^{
l
}
f(s
_
j|t
_
i)
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
\sum\limits
_{
i=0
}^{
l
}
\delta
(t
_
i,t
_
v)
\frac
{
f(s
_
u|t
_
v)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\label
{
eq:5-37
}
...
...
@@ -980,11 +980,13 @@ f(s_u|t_v) &=& \lambda_{t_v}^{-1} \frac{\varepsilon}{(l+1)^{m}} \prod\limits_{j=
%----------------------------------------------
\parinterval
期望频次是事件在其分布下出现次数的期望。另
$
c
_{
\mathbb
{
E
}}
(
X
)
$
为事件
$
X
$
的期望频次,其计算公式为:
\vspace
{
-0.5em
}
\begin{eqnarray}
c
_{
\mathbb
{
E
}}
(X)
&
=
&
\sum
_
i c(x
_
i)
\cdot
\funp
{
P
}
(x
_
i)
\label
{
eq:5-38
}
\end{eqnarray}
\vspace
{
-0.5em
}
\noindent
其中
$
c
(
x
_
i
)
$
表示
$
X
$
取
$
x
_
i
$
时出现的次数,
$
\funp
{
P
}
(
x
_
i
)
$
表示
$
X
=
x
_
i
$
出现的概率。图
\ref
{
fig:5-26
}
展示了事件
$
X
$
的期望频次的详细计算过程。其中
$
x
_
1
$
、
$
x
_
2
$
和
$
x
_
3
$
分别表示事件
$
X
$
出现2次、1次和5次的情况。
%----------------------------------------------
...
...
@@ -997,38 +999,50 @@ c_{\mathbb{E}}(X)&=&\sum_i c(x_i) \cdot \funp{P}(x_i)
\end{figure}
%----------------------------------------------
\vspace
{
-0.5em
}
\parinterval
因为在
$
\funp
{
P
}
(
\seq
{
s
}
|
\seq
{
t
}
)
$
中,
$
t
_
v
$
翻译(连接)到
$
s
_
u
$
的期望频次为:
\vspace
{
-0.5em
}
\begin{eqnarray}
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
&
\equiv
&
\sum\limits
_{
j=1
}^{
m
}
\delta
(s
_
j,s
_
u)
\cdot
\sum\limits
_{
i=0
}^{
l
}
\delta
(t
_
i,t
_
v)
\cdot
\frac
{
f(s
_
u|t
_
v)
}{
\sum\limits
_{
i=0
}^{
l
}
f(s
_
u|t
_
i)
}
\label
{
eq:5-39
}
\end{eqnarray}
\vspace
{
-0.5em
}
\parinterval
所以公式
\ref
{
eq:5-37
}
可重写为:
\vspace
{
-0.5em
}
\begin{eqnarray}
f(s
_
u|t
_
v)
&
=
&
\lambda
_{
t
_
v
}^{
-1
}
\cdot
\funp
{
P
}
(
\seq
{
s
}
|
\seq
{
t
}
)
\cdot
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
\label
{
eq:5-40
}
\end{eqnarray}
\vspace
{
-0.5em
}
\parinterval
在此如果令
$
\lambda
_{
t
_
v
}^{
'
}
=
\frac
{
\lambda
_{
t
_
v
}}{
\funp
{
P
}
(
\seq
{
s
}
|
\seq
{
t
}
)
}$
,可得:
\vspace
{
-0.5em
}
\begin{eqnarray}
f(s
_
u|t
_
v)
&
=
&
\lambda
_{
t
_
v
}^{
-1
}
\cdot
\funp
{
P
}
(
\seq
{
s
}
|
\seq
{
t
}
)
\cdot
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
\nonumber
\\
&
=
&{
(
\lambda
_{
t
_
v
}^{
'
}
)
}^{
-1
}
\cdot
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
\label
{
eq:5-41
}
\end{eqnarray}
\vspace
{
-0.5em
}
\parinterval
又因为IBM模型对
$
f
(
\cdot
|
\cdot
)
$
的约束如下:
\vspace
{
-0.5em
}
\begin{eqnarray}
\forall
t
_
y :
\sum\limits
_{
s
_
x
}
f(s
_
x|t
_
y)
&
=
&
1
\label
{
eq:5-42
}
\end{eqnarray}
\vspace
{
-0.5em
}
\parinterval
为了满足
$
f
(
\cdot
|
\cdot
)
$
的概率归一化约束,易得
$
\lambda
_{
t
_
v
}^{
'
}$
为:
\vspace
{
-0.5em
}
\begin{eqnarray}
\lambda
_{
t
_
v
}^{
'
}&
=
&
\sum\limits
_{
s'
_
u
}
c
_{
\mathbb
{
E
}}
(s'
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
\label
{
eq:5-43
}
\end{eqnarray}
\vspace
{
-0.5em
}
\parinterval
因此,
$
f
(
s
_
u|t
_
v
)
$
的计算式可再一步变换成下式:
\vspace
{
-0.5em
}
\begin{eqnarray}
f(s
_
u|t
_
v)
&
=
&
\frac
{
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
}
{
\sum\limits
_{
s'
_
u
}
c
_{
\mathbb
{
E
}}
(s'
_
u|t
_
v;
\seq
{
s
}
,
\seq
{
t
}
)
}
\label
{
eq:5-44
}
...
...
@@ -1042,7 +1056,9 @@ f(s_u|t_v)&=&\frac{c_{\mathbb{E}}(s_u|t_v;\seq{s},\seq{t})} { \sum\limits_{s'_u
\end{figure}
%----------------------------------------------
\vspace
{
-0.5em
}
\parinterval
进一步,假设有
$
K
$
个互译的句对(称作平行语料):
\vspace
{
-0.5em
}
$
\{
(
\seq
{
s
}^{
[
1
]
}
,
\seq
{
t
}^{
[
1
]
}
)
,...,
(
\seq
{
s
}^{
[
K
]
}
,
\seq
{
t
}^{
[
K
]
}
)
\}
$
,
$
f
(
s
_
u|t
_
v
)
$
的期望频次为:
\begin{eqnarray}
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v)
&
=
&
\sum\limits
_{
k=1
}^{
K
}
c
_{
\mathbb
{
E
}}
(s
_
u|t
_
v;s
^{
[k]
}
,t
^{
[k]
}
)
...
...
@@ -1062,10 +1078,6 @@ c_{\mathbb{E}}(s_u|t_v)&=&\sum\limits_{k=1}^{K} c_{\mathbb{E}}(s_u|t_v;s^{[k]},
\parinterval
至此,本章完成了对IBM模型1训练方法的介绍。其可以通过图
\ref
{
fig:5-27
}
所示的算法进行实现。算法最终的形式并不复杂,因为只需要遍历每个句对,之后计算
$
f
(
\cdot
|
\cdot
)
$
的期望频次,最后估计新的
$
f
(
\cdot
|
\cdot
)
$
,这个过程迭代直至
$
f
(
\cdot
|
\cdot
)
$
收敛至稳定状态。
\vspace
{
-1.5em
}
%----------------------------------------------------------------------------------------
% NEW SECTION
%----------------------------------------------------------------------------------------
...
...
Chapter6/chapter6.tex
查看文件 @
a0890aa2
...
...
@@ -229,7 +229,6 @@
%----------------------------------------------
\begin{itemize}
\vspace
{
0.5em
}
\item
第一部分:对每个
$
i
\in
[
1
,l
]
$
的目标语单词的产出率建模(
{
\color
{
red!70
}
红色
}
),即
$
\varphi
_
i
$
的生成概率。它依赖于
$
\seq
{
t
}$
和区间
$
[
1
,i
-
1
]
$
的目标语单词的产出率
$
\varphi
_
1
^{
i
-
1
}$
。
\footnote
{
这里约定,当
$
i
=
1
$
时,
$
\varphi
_
1
^
0
$
表示空。
}
\vspace
{
0.5em
}
\item
第二部分:对
$
i
=
0
$
时的产出率建模(
{
\color
{
blue!70
}
蓝色
}
),即空标记
$
t
_
0
$
的产出率生成概率。它依赖于
$
\seq
{
t
}$
和区间
$
[
1
,i
-
1
]
$
的目标语单词的产出率
$
\varphi
_
1
^
l
$
。
...
...
@@ -248,7 +247,7 @@
\subsection
{
IBM 模型3
}
\parinterval
IBM模型3通过一些假设对图
\ref
{
fig:6-7
}
所表示的基本模型进行了化简。具体来说,对于每个
$
i
\in
[
1
,l
]
$
,假设
$
\funp
{
P
}
(
\varphi
_
i |
\varphi
_
1
^{
i
-
1
}
,
\seq
{
t
}
)
$
仅依赖于
$
\varphi
_
i
$
和
$
t
_
i
$
,
$
\funp
{
P
}
(
\pi
_{
ik
}
|
\pi
_{
i
1
}^{
k
-
1
}
,
\pi
_
1
^{
i
-
1
}
,
\tau
_
0
^
l,
\varphi
_
0
^
l,
\seq
{
t
}
)
$
仅依赖于
$
\pi
_{
ik
}$
、
$
i
$
、
$
m
$
和
$
l
$
。而对于所有的
$
i
\in
[
0
,l
]
$
,假设
$
\funp
{
P
}
(
\tau
_{
ik
}
|
\tau
_{
i
1
}^{
k
-
1
}
,
\tau
_
1
^{
i
-
1
}
,
\varphi
_
0
^
l,
\seq
{
t
}
)
$
仅依赖于
$
\tau
_{
ik
}$
和
$
t
_
i
$
。这些假设的形式化描述为:
\vspace
{
-0.5em
}
\begin{eqnarray}
\funp
{
P
}
(
\varphi
_
i|
\varphi
_
1
^{
i-1
}
,
\seq
{
t
}
)
&
=
&{
\funp
{
P
}
(
\varphi
_
i|t
_
i)
}
\label
{
eq:6-10
}
\\
\funp
{
P
}
(
\tau
_{
ik
}
= s
_
j |
\tau
_{
i1
}^{
k-1
}
,
\tau
_{
1
}^{
i-1
}
,
\varphi
_
0
^
t,
\seq
{
t
}
)
&
=
&
t(s
_
j|t
_
i)
\label
{
eq:6-11
}
\\
...
...
@@ -265,7 +264,6 @@
\end{eqnarray}
否则
\begin{eqnarray}
\funp
{
P
}
(
\pi
_{
0k
}
=j|
\pi
_{
01
}^{
k-1
}
,
\pi
_
1
^
l,
\tau
_
0
^
l,
\varphi
_
0
^
l,
\seq
{
t
}
)
&
=
&
0
\label
{
eq:6-14
}
...
...
@@ -308,7 +306,6 @@ m-\varphi_0\\
p
_
0+p
_
1
&
=
&
1
\label
{
eq:6-21
}
\end{eqnarray}
}
%----------------------------------------------------------------------------------------
% NEW SUB-SECTION
%----------------------------------------------------------------------------------------
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论