Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
单韦乔
Toy-MT-Introduction
Commits
9934acaf
Commit
9934acaf
authored
Feb 17, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
updates
parent
12fe746f
全部展开
隐藏空白字符变更
内嵌
并排
正在显示
6 个修改的文件
包含
4 行增加
和
3 行删除
+4
-3
Book/Chapter1/Figures/figure-results-zh-to-en-news-field-translation.tex
+0
-0
Book/Chapter1/chapter1.tex
+0
-0
Book/Chapter2/chapter2.tex
+0
-0
Book/Chapter3/Chapter3.tex
+1
-1
Book/mt-book.bbl
+0
-0
Book/mt-book.tex
+3
-2
没有找到文件。
Book/Chapter1/Figures/figure-results-zh-to-en
news-field-translation.tex
→
Book/Chapter1/Figures/figure-results-zh-to-en
-
news-field-translation.tex
查看文件 @
9934acaf
File moved
Book/Chapter1/chapter1.tex
查看文件 @
9934acaf
差异被折叠。
点击展开。
Book/Chapter2/chapter2.tex
查看文件 @
9934acaf
This source diff could not be displayed because it is too large. You can
view the blob
instead.
Book/Chapter3/Chapter3.tex
查看文件 @
9934acaf
...
...
@@ -1203,7 +1203,7 @@ p_0+p_1 & = & 1 \label{eqC3.5.12}
\subsection
{
其它问题
}
\index
{
Chapter3.6.5
}
\noindent\hspace
{
2em
}
模型5的意义?模型5的提出是为了消除了模型3和模型4的Deficiency问题。
\\
Deficiency问题的本质是,
$
\textrm
{
P
}
(
s,a|t
)
$
在所有合理的对齐上概率和不为1。但是,在统计机器翻译中我们更关心是哪个对齐
$
a
$
使
$
\textrm
{
P
}
(
s,a|t
)
$
达到最大,即使
$
P
(
s,a|t
)
$
不符合概率分布的定义,也并不影响我们寻找理想的对齐
$
a
$
。从这个工程的角度说,
$
\textrm
{
P
}
(
s,a|t
)
$
不归一并不是一个十分严重的问题。遗憾的是,实际上至今也太多对IBM模型3和模型4中的
d
eficiency问题进行过系统的实验和分析,这个问题到底有多严重并没有定论。当然用模型5是可以解决这个问题。但是如果用一个非常复杂的模型去解决了一个并不产生严重后果的问题,那这个模型也就没有太大意义了(从实践的角度)。
\noindent\hspace
{
2em
}
模型5的意义?模型5的提出是为了消除了模型3和模型4的Deficiency问题。
\\
Deficiency问题的本质是,
$
\textrm
{
P
}
(
s,a|t
)
$
在所有合理的对齐上概率和不为1。但是,在统计机器翻译中我们更关心是哪个对齐
$
a
$
使
$
\textrm
{
P
}
(
s,a|t
)
$
达到最大,即使
$
P
(
s,a|t
)
$
不符合概率分布的定义,也并不影响我们寻找理想的对齐
$
a
$
。从这个工程的角度说,
$
\textrm
{
P
}
(
s,a|t
)
$
不归一并不是一个十分严重的问题。遗憾的是,实际上至今也太多对IBM模型3和模型4中的
D
eficiency问题进行过系统的实验和分析,这个问题到底有多严重并没有定论。当然用模型5是可以解决这个问题。但是如果用一个非常复杂的模型去解决了一个并不产生严重后果的问题,那这个模型也就没有太大意义了(从实践的角度)。
\noindent\hspace
{
2em
}
概念(Cept.)的意义?经过前面的分析可知,IBM模型的词对齐模型是使用了cept.这个概念。但是实质上,在IBM模型中使用的cept.最多只能对应一个目标语言单词(模型并没有用到源语言cept.的概念)。因此可以直接用单词代替cept.。这样,即使不引入cept.的概念,也并不影响IBM模型的建模。实际上,cept.的引入确实可以帮助我们从语法和语义的角度解释词对齐过程。不过,这个方法在IBM模型中的效果究竟如何也没有定论。
...
...
Book/mt-book.bbl
deleted
100644 → 0
查看文件 @
12fe746f
差异被折叠。
点击展开。
Book/mt-book.tex
查看文件 @
9934acaf
...
...
@@ -54,7 +54,8 @@
%----------------------------------------------------------------------------------------
\IfFileExists
{
C:/WINDOWS/win.ini
}
{
\newcommand
{
\mycfont
}{
song
}}
{
\newcommand
{
\mycfont
}{
you
}}
{
\newcommand
{
\mycfont
}{
gbsn
}}
\begin{CJK}
{
UTF8
}{
\mycfont
}
\end{CJK}
...
...
@@ -117,7 +118,7 @@
%\chapter*{Bibliography}
%\addcontentsline{toc}{chapter}{\textcolor{ocre}{Bibliography}} % 增加一个标题
%\printbibliography[heading=bibempty]
\printbibliography
%
\printbibliography
%------------------------------------------------
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论