Commit cd2d7ccf by zengxin

合并分支 'master' 到 'zengxin'

Master

查看合并请求 !281
parents ac98a9da 1e077ac7
...@@ -454,8 +454,7 @@ Candidate:the the the the ...@@ -454,8 +454,7 @@ Candidate:the the the the
\label{eq:1-2} \label{eq:1-2}
\end{eqnarray} \end{eqnarray}
\parinterval 但是,该方法更倾向于对短句子打出更高的分数。一个极端的例子是译文只有很少的几个词,但是都命中答案,准确率很高可显然不是好的译文。因此,BLEU引入{\small\bfnew{短句惩罚因子}}\index{短句惩罚因子}(Brevity Penalty\index{Brevity Penalty}, BP)的概念,对短句进行惩罚, \parinterval 但是,该方法更倾向于对短句子打出更高的分数。一个极端的例子是译文只有很少的几个词,但是都命中答案,准确率很高可显然不是好的译文。因此,BLEU引入{\small\bfnew{短句惩罚因子}}\index{短句惩罚因子}(Brevity Penalty\index{Brevity Penalty}, BP)的概念,对短句进行惩罚:
\begin{eqnarray} \begin{eqnarray}
\textrm{BP}= \textrm{BP}=
\begin{cases} \begin{cases}
...@@ -466,7 +465,6 @@ e^{(1-\frac{r}{c})}& c \le r ...@@ -466,7 +465,6 @@ e^{(1-\frac{r}{c})}& c \le r
\end{eqnarray} \end{eqnarray}
\noindent 其中$c$表示译文的句子长度,$r$表示参考译文的句子长度。最终BLEU的计算公式为: \noindent 其中$c$表示译文的句子长度,$r$表示参考译文的句子长度。最终BLEU的计算公式为:
\begin{eqnarray} \begin{eqnarray}
\textrm{BLEU}=\textrm{BP} \cdot \exp(\sum_{i=1}^{N}w_n \cdot \log{\textrm{P}_n}) \textrm{BLEU}=\textrm{BP} \cdot \exp(\sum_{i=1}^{N}w_n \cdot \log{\textrm{P}_n})
\label{eq:1-4} \label{eq:1-4}
......
\definecolor{ublue}{rgb}{0.152,0.250,0.545} \definecolor{ublue}{rgb}{0.152,0.250,0.545}
\definecolor{ugreen}{rgb}{0,0.5,0} \definecolor{ugreen}{rgb}{0,0.5,0}
......
%%% outline %%% outline
%------------------------------------------------------------------------- %-------------------------------------------------------------------------
\begin{tikzpicture} \begin{tikzpicture}
......
...@@ -37,7 +37,7 @@ ...@@ -37,7 +37,7 @@
% NEW SECTION % NEW SECTION
%---------------------------------------------------------------------------------------- %----------------------------------------------------------------------------------------
\section{什么是基于词的翻译模型} \section{词在翻译中的作用}
\parinterval 在机器翻译中,我们希望得到一个源语言到目标语言的翻译。对于人类来说这个问题很简单,但是让计算机做这样的工作却很困难,因为我们需要把翻译``描述''成计算机可以计算的形式。这里面临的第一个问题是:如何对翻译进行建模?从计算机的角度来看,这就需要把自然语言的翻译问题转换为计算机可计算的问题。 \parinterval 在机器翻译中,我们希望得到一个源语言到目标语言的翻译。对于人类来说这个问题很简单,但是让计算机做这样的工作却很困难,因为我们需要把翻译``描述''成计算机可以计算的形式。这里面临的第一个问题是:如何对翻译进行建模?从计算机的角度来看,这就需要把自然语言的翻译问题转换为计算机可计算的问题。
...@@ -82,7 +82,7 @@ ...@@ -82,7 +82,7 @@
%---------------------------------------------------------------------------------------- %----------------------------------------------------------------------------------------
\sectionnewpage \sectionnewpage
\section{构建一个简单的机器翻译系统} \section{一个简单的翻译系统}
\label{sec:simple-mt-example} \label{sec:simple-mt-example}
\parinterval 本节首先对比人工翻译和机器翻译过程的异同点,从中归纳出构建机器翻译系统的两个主要步骤:训练和解码。之后,会从学习翻译知识和运用翻译知识两个方面描述如何构建一个简单的机器翻译系统。 \parinterval 本节首先对比人工翻译和机器翻译过程的异同点,从中归纳出构建机器翻译系统的两个主要步骤:训练和解码。之后,会从学习翻译知识和运用翻译知识两个方面描述如何构建一个简单的机器翻译系统。
......
...@@ -2,7 +2,7 @@ ...@@ -2,7 +2,7 @@
%%% 引入短语翻译 %%% 引入短语翻译
{\small {\small
\begin{tabular}{l | l} \begin{tabular}{l | l}
{{\red{\sout{单词}}}词串翻译表} & P \\ \hline {\red{词串}}翻译表 & P \\ \hline
$\to$ I & 0.6 \\ $\to$ I & 0.6 \\
喜欢 $\to$ like & 0.3 \\ 喜欢 $\to$ like & 0.3 \\
$\to$ red & 0.8 \\ $\to$ red & 0.8 \\
......
...@@ -48,7 +48,7 @@ ...@@ -48,7 +48,7 @@
\vspace{0.5em} \vspace{0.5em}
\end{itemize} \end{itemize}
其中,第一章是对机器翻译的整体介绍。第二章和第五章是对统计建模和深度学习方法的介绍,分别建立了两个机器翻译范式的基础知识体系 \ \dash \ 统计机器翻译和神经机器翻译。统计机器翻译部分(第三、四章)涉及早期的基于单词的翻译模型,以及本世纪初流行的基于短语和句法的翻译模型。神经机器翻译(第六、七章)代表了当今机器翻译的前沿,内容主要涉及了基于端到端表示学习的机器翻译建模方法。特别地,第七章对一些最新的神经机器翻译方法进行了讨论,为相关科学问题的研究和实用系统的开发提供了可落地的思路。\ref{fig:preface}展示了本书各个章节及核心概念之间的关系。 其中,第一章是对机器翻译的整体介绍。第二章和第五章是对统计建模和深度学习方法的介绍,分别建立了两个机器翻译范式的基础知识体系 \ \dash \ 统计机器翻译和神经机器翻译。统计机器翻译部分(第三、四章)涉及早期的基于单词的翻译模型,以及本世纪初流行的基于短语和句法的翻译模型。神经机器翻译(第六、七章)代表了当今机器翻译的前沿,内容主要涉及了基于端到端表示学习的机器翻译建模方法。特别地,第七章对一些最新的神经机器翻译方法进行了讨论,为相关科学问题的研究和实用系统的开发提供了可落地的思路。下图展示了本书各个章节及核心概念之间的关系。
{\red 用最简单的方式阐述机器翻译的基本思想}是笔者所期望达到的目标。但是,书中不可避免会使用一些形式化定义和算法的抽象描述,因此,笔者尽所能通过图例进行解释(本书共320张插图)。不过,本书所包含的内容较为广泛,难免会有疏漏,望读者海涵,并指出不当之处。 {\red 用最简单的方式阐述机器翻译的基本思想}是笔者所期望达到的目标。但是,书中不可避免会使用一些形式化定义和算法的抽象描述,因此,笔者尽所能通过图例进行解释(本书共320张插图)。不过,本书所包含的内容较为广泛,难免会有疏漏,望读者海涵,并指出不当之处。
......
...@@ -1308,10 +1308,10 @@ ...@@ -1308,10 +1308,10 @@
pages = {224--233}, pages = {224--233},
publisher = {{ACL}}, publisher = {{ACL}},
year = {2008}, year = {2008},
url = {https://www.aclweb.org/anthology/D08-1024/}, //url = {https://www.aclweb.org/anthology/D08-1024/},
timestamp = {Fri, 13 Sep 2019 13:08:45 +0200}, //timestamp = {Fri, 13 Sep 2019 13:08:45 +0200},
biburl = {https://dblp.org/rec/conf/emnlp/ChiangMR08.bib}, //biburl = {https://dblp.org/rec/conf/emnlp/ChiangMR08.bib},
bibsource = {dblp computer science bibliography, https://dblp.org} //bibsource = {dblp computer science bibliography, https://dblp.org}
} }
@inproceedings{dreyer2015apro, @inproceedings{dreyer2015apro,
...@@ -1820,10 +1820,10 @@ year ={2008}, ...@@ -1820,10 +1820,10 @@ year ={2008},
pages = {1086--1090}, pages = {1086--1090},
publisher = {Morgan Kaufmann}, publisher = {Morgan Kaufmann},
year = {2000}, year = {2000},
url = {https://www.aclweb.org/anthology/C00-2163/}, //url = {https://www.aclweb.org/anthology/C00-2163/},
timestamp = {Mon, 16 Sep 2019 17:08:53 +0200}, //timestamp = {Mon, 16 Sep 2019 17:08:53 +0200},
biburl = {https://dblp.org/rec/conf/coling/OchN00.bib}, //biburl = {https://dblp.org/rec/conf/coling/OchN00.bib},
bibsource = {dblp computer science bibliography, https://dblp.org} //bibsource = {dblp computer science bibliography, https://dblp.org}
} }
@article{powell1964an, @article{powell1964an,
...@@ -1964,10 +1964,10 @@ year ={2008}, ...@@ -1964,10 +1964,10 @@ year ={2008},
booktitle = {{COLING} 2004, 20th International Conference on Computational Linguistics, booktitle = {{COLING} 2004, 20th International Conference on Computational Linguistics,
Proceedings of the Conference, 23-27 August 2004, Geneva, Switzerland}, Proceedings of the Conference, 23-27 August 2004, Geneva, Switzerland},
year = {2004}, year = {2004},
url = {https://www.aclweb.org/anthology/C04-1154/}, //url = {https://www.aclweb.org/anthology/C04-1154/},
timestamp = {Mon, 16 Sep 2019 17:08:53 +0200}, //timestamp = {Mon, 16 Sep 2019 17:08:53 +0200},
biburl = {https://dblp.org/rec/conf/coling/GrovesHW04.bib}, //biburl = {https://dblp.org/rec/conf/coling/GrovesHW04.bib},
bibsource = {dblp computer science bibliography, https://dblp.org} //bibsource = {dblp computer science bibliography, https://dblp.org}
} }
@inproceedings{DBLP:conf/coling/SunZT10, @inproceedings{DBLP:conf/coling/SunZT10,
...@@ -1983,10 +1983,10 @@ year ={2008}, ...@@ -1983,10 +1983,10 @@ year ={2008},
pages = {1047--1055}, pages = {1047--1055},
publisher = {Tsinghua University Press}, publisher = {Tsinghua University Press},
year = {2010}, year = {2010},
url = {https://www.aclweb.org/anthology/C10-1118/}, //url = {https://www.aclweb.org/anthology/C10-1118/},
timestamp = {Mon, 16 Sep 2019 17:08:53 +0200}, //timestamp = {Mon, 16 Sep 2019 17:08:53 +0200},
biburl = {https://dblp.org/rec/conf/coling/SunZT10.bib}, //biburl = {https://dblp.org/rec/conf/coling/SunZT10.bib},
bibsource = {dblp computer science bibliography, https://dblp.org} //bibsource = {dblp computer science bibliography, https://dblp.org}
} }
@inproceedings{Tong2009Better, @inproceedings{Tong2009Better,
...@@ -2019,10 +2019,10 @@ year ={2008}, ...@@ -2019,10 +2019,10 @@ year ={2008},
pages = {423--430}, pages = {423--430},
publisher = {{ACL}}, publisher = {{ACL}},
year = {2003}, year = {2003},
url = {https://www.aclweb.org/anthology/P03-1054/}, //url = {https://www.aclweb.org/anthology/P03-1054/},
timestamp = {Mon, 19 Aug 2019 18:09:53 +0200}, //timestamp = {Mon, 19 Aug 2019 18:09:53 +0200},
biburl = {https://dblp.org/rec/conf/acl/KleinM03.bib}, //biburl = {https://dblp.org/rec/conf/acl/KleinM03.bib},
bibsource = {dblp computer science bibliography, https://dblp.org} //bibsource = {dblp computer science bibliography, https://dblp.org}
} }
@inproceedings{charniak2006multilevel, @inproceedings{charniak2006multilevel,
...@@ -2030,7 +2030,7 @@ year ={2008}, ...@@ -2030,7 +2030,7 @@ year ={2008},
author="Eugene {Charniak} and Mark {Johnson} and Micha {Elsner} and Joseph {Austerweil} and David {Ellis} and Isaac {Haxton} and Catherine {Hill} and R. {Shrivaths} and Jeremy {Moore} and Michael {Pozar} and Theresa {Vu}", author="Eugene {Charniak} and Mark {Johnson} and Micha {Elsner} and Joseph {Austerweil} and David {Ellis} and Isaac {Haxton} and Catherine {Hill} and R. {Shrivaths} and Jeremy {Moore} and Michael {Pozar} and Theresa {Vu}",
booktitle="Proceedings of the Human Language Technology Conference of the NAACL, Main Conference", booktitle="Proceedings of the Human Language Technology Conference of the NAACL, Main Conference",
pages="168--175", pages="168--175",
notes="Sourced from Microsoft Academic - https://academic.microsoft.com/paper/2101714644", //notes="Sourced from Microsoft Academic - https://academic.microsoft.com/paper/2101714644",
year="2006" year="2006"
} }
......
...@@ -588,7 +588,7 @@ addtohook={% ...@@ -588,7 +588,7 @@ addtohook={%
% Chapter 4 % Chapter 4
%---------------------------------------------------------------------------------------- %----------------------------------------------------------------------------------------
\usepackage{pgffor}%图片中使用\foreach语句 \usepackage{pgffor}%图片中使用\foreach语句
\usepackage{ulem}%使用/sout %\usepackage{ulem}%使用/sout
%---------------------------------------------------------------------------------------- %----------------------------------------------------------------------------------------
% Chapter 6 % Chapter 6
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论