Commit 9934acaf by xiaotong

updates

parent 12fe746f
This source diff could not be displayed because it is too large. You can view the blob instead.
......@@ -1203,7 +1203,7 @@ p_0+p_1 & = & 1 \label{eqC3.5.12}
\subsection{其它问题}\index{Chapter3.6.5}
\noindent\hspace{2em}模型5的意义?模型5的提出是为了消除了模型3和模型4的Deficiency问题。\\Deficiency问题的本质是,$\textrm{P}(s,a|t)$在所有合理的对齐上概率和不为1。但是,在统计机器翻译中我们更关心是哪个对齐$a$使$\textrm{P}(s,a|t)$达到最大,即使$P(s,a|t)$不符合概率分布的定义,也并不影响我们寻找理想的对齐$a$。从这个工程的角度说,$\textrm{P}(s,a|t)$不归一并不是一个十分严重的问题。遗憾的是,实际上至今也太多对IBM模型3和模型4中的deficiency问题进行过系统的实验和分析,这个问题到底有多严重并没有定论。当然用模型5是可以解决这个问题。但是如果用一个非常复杂的模型去解决了一个并不产生严重后果的问题,那这个模型也就没有太大意义了(从实践的角度)。
\noindent\hspace{2em}模型5的意义?模型5的提出是为了消除了模型3和模型4的Deficiency问题。\\Deficiency问题的本质是,$\textrm{P}(s,a|t)$在所有合理的对齐上概率和不为1。但是,在统计机器翻译中我们更关心是哪个对齐$a$使$\textrm{P}(s,a|t)$达到最大,即使$P(s,a|t)$不符合概率分布的定义,也并不影响我们寻找理想的对齐$a$。从这个工程的角度说,$\textrm{P}(s,a|t)$不归一并不是一个十分严重的问题。遗憾的是,实际上至今也太多对IBM模型3和模型4中的Deficiency问题进行过系统的实验和分析,这个问题到底有多严重并没有定论。当然用模型5是可以解决这个问题。但是如果用一个非常复杂的模型去解决了一个并不产生严重后果的问题,那这个模型也就没有太大意义了(从实践的角度)。
\noindent\hspace{2em}概念(Cept.)的意义?经过前面的分析可知,IBM模型的词对齐模型是使用了cept.这个概念。但是实质上,在IBM模型中使用的cept.最多只能对应一个目标语言单词(模型并没有用到源语言cept.的概念)。因此可以直接用单词代替cept.。这样,即使不引入cept.的概念,也并不影响IBM模型的建模。实际上,cept.的引入确实可以帮助我们从语法和语义的角度解释词对齐过程。不过,这个方法在IBM模型中的效果究竟如何也没有定论。
......
......@@ -54,7 +54,8 @@
%----------------------------------------------------------------------------------------
\IfFileExists{C:/WINDOWS/win.ini}
{\newcommand{\mycfont}{song}}
{\newcommand{\mycfont}{you}}
{\newcommand{\mycfont}{gbsn}}
\begin{CJK}{UTF8}{\mycfont}
\end{CJK}
......@@ -117,7 +118,7 @@
%\chapter*{Bibliography}
%\addcontentsline{toc}{chapter}{\textcolor{ocre}{Bibliography}} % 增加一个标题
%\printbibliography[heading=bibempty]
\printbibliography
%\printbibliography
%------------------------------------------------
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论