Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
单韦乔
Toy-MT-Introduction
Commits
3146f0ea
Commit
3146f0ea
authored
Mar 15, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
updates (section4, slides)
parent
f8580d8f
显示空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
6 行增加
和
6 行删除
+6
-6
Section04-Phrasal-and-Syntactic-Models/section04.tex
+6
-6
没有找到文件。
Section04-Phrasal-and-Syntactic-Models/section04.tex
查看文件 @
3146f0ea
...
@@ -2527,7 +2527,7 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
...
@@ -2527,7 +2527,7 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
\item
把每个子模型当作一个特征,为每个模型添加一个权重,然后使用对数线性模型对这些子模型进行建模,对数线性模型的形式如下:
\item
把每个子模型当作一个特征,为每个模型添加一个权重,然后使用对数线性模型对这些子模型进行建模,对数线性模型的形式如下:
\vspace
{
-0.8em
}
\vspace
{
-0.8em
}
\begin{displaymath}
\begin{displaymath}
\textrm
{
P
}
(d,
\textbf
{
t
}
|
\textbf
{
s
}
)
\propto
\exp
(
\sum
_{
i=1
}^{
M
}
\lambda
_
i
\cdot
h
_
i(d,
\textbf
{
s
}
,
\textbf
{
t
}
))
\textrm
{
P
}
(d,
\textbf
{
t
}
|
\textbf
{
s
}
)
\propto
\
textrm
{
mscore
}
(d,
\textbf
{
s
}
|
\textbf
{
t
}
) =
\
exp
(
\sum
_{
i=1
}^{
M
}
\lambda
_
i
\cdot
h
_
i(d,
\textbf
{
s
}
,
\textbf
{
t
}
))
\end{displaymath}
\end{displaymath}
\vspace
{
-1.2em
}
\vspace
{
-1.2em
}
\begin{itemize}
\begin{itemize}
...
@@ -2535,7 +2535,7 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
...
@@ -2535,7 +2535,7 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
\end{itemize}
\end{itemize}
\vspace
{
0.8em
}
\vspace
{
0.8em
}
\begin{displaymath}
\begin{displaymath}
\textrm
{
P
}
(d,
\textbf
{
t
}
|
\textbf
{
s
}
) =
\prod
_{
(
\bar
{
s
}
,
\bar
{
t
}
)
\in
d
}
\Pr
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
1
}}
\times
f(d)
^{
\lambda
_{
2
}}
\times
\Pr\nolimits
_{
\textrm
{
lm
}}
(
\mathbf
{
t
}
)
^{
\lambda
_{
lm
}}
\textrm
{
mscore
}
(d,
\textbf
{
t
}
|
\textbf
{
s
}
) =
\prod
_{
(
\bar
{
s
}
,
\bar
{
t
}
)
\in
d
}
\Pr
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
1
}}
\times
f(d)
^{
\lambda
_{
2
}}
\times
\Pr\nolimits
_{
\textrm
{
lm
}}
(
\mathbf
{
t
}
)
^{
\lambda
_{
lm
}}
\end{displaymath}
\end{displaymath}
\item
可以引入更多的特征来提高翻译质量(下面介绍)
\item
可以引入更多的特征来提高翻译质量(下面介绍)
\end{itemize}
\end{itemize}
...
@@ -2567,9 +2567,9 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
...
@@ -2567,9 +2567,9 @@ f_{\textrm{ME}}(d) = \prod_{<o,X_1,X_2> \in d} \Pr(o|X_1, X_2)
\begin{center}
\begin{center}
\begin{tikzpicture}
\begin{tikzpicture}
\begin{scope}
[minimum height = 15pt]
\begin{scope}
[minimum height = 15pt]
\node
[anchor=west,minimum width=3em]
(x1) at (0, 0)
{
\footnotesize
{$
\textrm
{
P
}
(
d,
\textbf
{
t
}
|
\textbf
{
s
}
)
=
\prod
_{
(
\bar
{
s
}
,
\bar
{
t
}
)
\in
d
}
score
(
\bar
{
s
}
,
\bar
{
t
}
)
\times
f
_{
\textrm
{
ME
}}
(
d
)
^{
\lambda
_{
ME
}}
\times
f
_{
\textrm
{
MSD
}}
(
d
)
^{
\lambda
_{
MSD
}}
\times
$}}
;
\node
[anchor=west,minimum width=3em]
(x1) at (0, 0)
{
\footnotesize
{$
\textrm
{
mscore
}
(
d,
\textbf
{
t
}
|
\textbf
{
s
}
)
=
\prod
_{
(
\bar
{
s
}
,
\bar
{
t
}
)
\in
d
}
\textrm
{
pscore
}
(
\bar
{
s
}
,
\bar
{
t
}
)
\times
f
_{
\textrm
{
ME
}}
(
d
)
^{
\lambda
_{
ME
}}
\times
f
_{
\textrm
{
MSD
}}
(
d
)
^{
\lambda
_{
MSD
}}
\times
$}}
;
\node
[anchor=north west]
(x2) at ([xshift=4em,yshift=0.1em]x1.south west)
{
\footnotesize
{$
\Pr\nolimits
_{
\textrm
{
lm
}}
(
\mathbf
{
t
}
)
^{
\lambda
_{
lm
}}
\times
\exp
(
\lambda
_{
TWB
}
\cdot
length
(
\mathbf
{
t
}
))
/
Z
(
\mathbf
{
s
}
)
$}}
;
\node
[anchor=north west]
(x2) at ([xshift=4em,yshift=0.1em]x1.south west)
{
\footnotesize
{$
\Pr\nolimits
_{
\textrm
{
lm
}}
(
\mathbf
{
t
}
)
^{
\lambda
_{
lm
}}
\times
\exp
(
\lambda
_{
TWB
}
\cdot
length
(
\mathbf
{
t
}
))
/
Z
(
\mathbf
{
s
}
)
$}}
;
\node
[anchor=north west]
(x3) at ([yshift=-1.8em]x1.south west)
{
\footnotesize
{$
score
(
\bar
{
s
}
,
\bar
{
t
}
)
=
\Pr
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
1
}}
\times
\Pr
(
\bar
{
s
}
|
\bar
{
t
}
)
^{
\lambda
_{
2
}}
\times
\Pr\nolimits
_{
\textrm
{
lex
}}
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
3
}}
\times
\Pr\nolimits
_{
\textrm
{
lex
}}
(
\bar
{
s
}
|
\bar
{
t
}
)
^{
\lambda
_{
4
}}
\times
$}}
;
\node
[anchor=north west]
(x3) at ([yshift=-1.8em]x1.south west)
{
\footnotesize
{$
\textrm
{
pscore
}
(
\bar
{
s
}
,
\bar
{
t
}
)
=
\Pr
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
1
}}
\times
\Pr
(
\bar
{
s
}
|
\bar
{
t
}
)
^{
\lambda
_{
2
}}
\times
\Pr\nolimits
_{
\textrm
{
lex
}}
(
\bar
{
t
}
|
\bar
{
s
}
)
^{
\lambda
_{
3
}}
\times
\Pr\nolimits
_{
\textrm
{
lex
}}
(
\bar
{
s
}
|
\bar
{
t
}
)
^{
\lambda
_{
4
}}
\times
$}}
;
\node
[anchor=north west]
(x4) at ([xshift=5em,yshift=0.1em]x3.south west)
{
\footnotesize
{$
\exp
(
\lambda
_{
PB
}
)
\times
\exp
(
\lambda
_{
WDB
}
\cdot
\delta
(
\bar
{
s
}
\to
null
))
$}}
;
\node
[anchor=north west]
(x4) at ([xshift=5em,yshift=0.1em]x3.south west)
{
\footnotesize
{$
\exp
(
\lambda
_{
PB
}
)
\times
\exp
(
\lambda
_{
WDB
}
\cdot
\delta
(
\bar
{
s
}
\to
null
))
$}}
;
\end{scope}
\end{scope}
\end{tikzpicture}
\end{tikzpicture}
...
@@ -2616,11 +2616,11 @@ d_{i}^{*} = \argmax_{d_{ij}} \sum_{k=1}^{M} \lambda_k \cdot h_k(d_{ij})
...
@@ -2616,11 +2616,11 @@ d_{i}^{*} = \argmax_{d_{ij}} \sum_{k=1}^{M} \lambda_k \cdot h_k(d_{ij})
\item
如何得到最优的
$
\lambda
^
*
$
\item
如何得到最优的
$
\lambda
^
*
$
\begin{itemize}
\begin{itemize}
\item
最简单的方法是枚举所有可能的
$
\lambda
$
值,但是这样做效率很低。可以只考虑最优译文发生变化的点:)
\item
最简单的方法是枚举所有可能的
$
\lambda
$
值,但是这样做效率很低。可以只考虑最优译文发生变化的点:)
\item
对于每个训练样本,假设有2-best个推导
$
\mathbf
{
d
}
=
\{
d
_
1
,d
_
2
\}
$
,每个推导
$
d
$
的得分
model
score(
$
d
$
)可以表示成关于权重
$
\lambda
_
i
$
的函数
\item
对于每个训练样本,假设有2-best个推导
$
\mathbf
{
d
}
=
\{
d
_
1
,d
_
2
\}
$
,每个推导
$
d
$
的得分score(
$
d
$
)可以表示成关于权重
$
\lambda
_
i
$
的函数
\end{itemize}
\end{itemize}
\vspace
{
0.2em
}
\vspace
{
0.2em
}
\begin{displaymath}
\begin{displaymath}
\textrm
{
model
score
}
(d) =
\lambda
_
i
\cdot
h
_
i(d) +
\sum
_{
k
{
\ne
}
i
}^{
M
}
\lambda
_
k
\cdot
h
_
k(d) = a
\cdot
\lambda
_
i + b
\textrm
{
score
}
(d) =
\lambda
_
i
\cdot
h
_
i(d) +
\sum
_{
k
{
\ne
}
i
}^{
M
}
\lambda
_
k
\cdot
h
_
k(d) = a
\cdot
\lambda
_
i + b
\end{displaymath}
\end{displaymath}
\vspace
{
-0.7em
}
\vspace
{
-0.7em
}
\begin{center}
\begin{center}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论