Commit f6024d46 by zengxin

slide 1 change gbk to utf8

parent cd2d7ccf
% !Mode:: "TeX:GBK"
% !TEX encoding = GBK
% !Mode:: "TeX:UTF-8"
% !TEX encoding = UTF-8 Unicode
\def\CTeXPreproc{Created by ctex v0.2.13, don't edit!}
\documentclass[cjk,t,compress,12pt]{beamer}
\documentclass[CJKutf8,t,compress,12pt]{beamer}
%\documentclass{article}
%\usepackage{beamerarticle}
\usepackage{pstricks}
......@@ -12,7 +12,7 @@
\usepackage{amsmath,amssymb}
\usepackage{setspace}
\usepackage{xcolor}
\usepackage{CJK}
\usepackage{CJKutf8}
\usepackage{tikz}
\usepackage{tikz-qtree}
\usepackage{hyperref}
......@@ -58,11 +58,11 @@
\usefonttheme[onlylarge]{structurebold}
\begin{CJK}{GBK}{song}
\begin{CJK}{UTF8}{song}
\end{CJK}
\setbeamerfont*{frametitle}{size=\large,series=\bfseries}
\setbeamertemplate{navigation symbols}{\begin{CJK}{GBK}{hei} 第一章 机器翻译简介 \hspace*{2em} 肖桐\&朱靖波 \end{CJK} \hspace*{2em} \today \hspace*{2em} \insertframenumber{}/\inserttotalframenumber}
\setbeamertemplate{navigation symbols}{\begin{CJK}{UTF8}{hei} 第一章 机器翻译简介 \hspace*{2em} 肖桐\&朱靖波 \end{CJK} \hspace*{2em} \today \hspace*{2em} \insertframenumber{}/\inserttotalframenumber}
\setbeamertemplate{itemize items}[circle] % if you want a circle
\setbeamertemplate{itemize subitem}[triangle] % if you wnat a triangle
......@@ -70,16 +70,16 @@
\begin{document}
\begin{CJK}{GBK}{you}
\begin{CJK}{UTF8}{you}
\title{\LARGE{机器翻译简介}}
\subtitle{背景 + 概念 + 方法概述}
\author{\large{\textbf{肖桐\ \ 朱靖波}}}
\title{\LARGE{机器翻译简介}}
\subtitle{背景 + 概念 + 方法概述}
\author{\large{\textbf{肖桐\ \ 朱靖波}}}
\institute{
\blue{\url{xiaotong@mail.neu.edu.cn}} \black{} \\
\blue{\url{zhujingbo@mail.neu.edu.cn}} \black{} \\
\vspace{1.0em}
东北大学 自然语言处理实验室 \\
东北大学 自然语言处理实验室 \\
\blue{\underline{\url{http://www.nlplab.com}}} \black{} \\
\vspace{0.2cm}
\hspace{0.1cm} \includegraphics[scale=0.1]{../Figures/logo.pdf}
......@@ -92,38 +92,38 @@
\setlength{\leftmarginii}{1em}
%%%------------------------------------------------------------------------------------------------------------
\section{机器翻译}
\section{机器翻译}
%%%------------------------------------------------------------------------------------------------------------
\subsection{基本概念}
\subsection{基本概念}
%%%------------------------------------------------------------------------------------------------------------
%%% 啥是翻译
\begin{frame}{翻译}
%%% 啥是翻译
\begin{frame}{翻译}
广义上来说,"翻译"是指把一个事物转化为另一个事物的过程。这个概念多使用在\alert{对可序列化的符号串的转化}上,比如
广义上来说,"翻译"是指把一个事物转化为另一个事物的过程。这个概念多使用在\alert{对可序列化的符号串的转化}上,比如
\begin{itemize}
\item \textbf{程序编译}\\
从一种编程语言的代码转化到另外一种语言的代码
\item \textbf{文字翻译}\\
从一种语言文字转化到另一种语言文字
\item \textbf{蛋白质生物合成第一步}\\
从一种RNA分子序列转化到特定氨基酸序列
\item \textbf{程序编译}\\
从一种编程语言的代码转化到另外一种语言的代码
\item \textbf{文字翻译}\\
从一种语言文字转化到另一种语言文字
\item \textbf{蛋白质生物合成第一步}\\
从一种RNA分子序列转化到特定氨基酸序列
\end{itemize}
\vspace{1em}
\visible<2>{
这里我们只关注从一种语言的文字序列\alert{翻译}到另外一种语言的文字序列的过程,即\alert{自然语言的翻译}
这里我们只关注从一种语言的文字序列\alert{翻译}到另外一种语言的文字序列的过程,即\alert{自然语言的翻译}
\vspace{-2em}
\begin{center}
\begin{tikzpicture}
\node [fill=blue!50] (s) at (0,0) {我们在翻译一段文字};
\node [fill=blue!50] (s) at (0,0) {我们在翻译一段文字};
\node [anchor=west,fill=red!50] (t) at ([xshift=0.3in]s.east) {We are translating a piece of text};
\node [anchor=south west] (slabel) at (s.north west) {\small{中文}};
\node [anchor=south west] (tlabel) at (t.north west) {\small{英文}};
\node [anchor=south west] (slabel) at (s.north west) {\small{中文}};
\node [anchor=south west] (tlabel) at (t.north west) {\small{英文}};
%\draw[->,thick] (s.east)--(t.west) node[pos=0.5, above,yshift=1em] {\small{translation}};
\draw[->,thick] (s.east)--(t.west);
\end{tikzpicture}
......@@ -134,13 +134,13 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 啥是机器翻译
\begin{frame}{啥是机器翻译}
%%% 啥是机器翻译
\begin{frame}{啥是机器翻译}
\begin{minipage}[c][5cm][t]{0.46\textwidth}
传统观念中,翻译是由\alert{人工}完成
传统观念中,翻译是由\alert{人工}完成
\begin{itemize}
\item 精度高
\item \textbf{但是},费时费力
\item 精度高
\item \textbf{但是},费时费力
\end{itemize}
\vspace{1em}
\includegraphics[scale=0.5]{./Figures/human.jpg}
......@@ -148,10 +148,10 @@
\hfill
\visible<2>{
\begin{minipage}[c][5cm][t]{0.48\textwidth}
\alert{机器翻译}是指由计算机完成自动翻译,而非人工
\alert{机器翻译}是指由计算机完成自动翻译,而非人工
\begin{itemize}
\item 精度有限,有时非常差
\item \textbf{但是},速度快成本极低
\item 精度有限,有时非常差
\item \textbf{但是},速度快成本极低
\end{itemize}
\vspace{1em}
\includegraphics[scale=0.58]{./Figures/machine.jpg}
......@@ -160,28 +160,28 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{机器翻译发展简史}
\subsection{机器翻译发展简史}
%%%------------------------------------------------------------------------------------------------------------
%%% 最早的翻译 - 实例
\begin{frame}{早期的(人工)翻译}
%%% 最早的翻译 - 实例
\begin{frame}{早期的(人工)翻译}
\begin{minipage}{0.55\textwidth}
\vspace{1em}
\begin{itemize}
\item 人类文明最早的翻译记录
\item 人类文明最早的翻译记录
\begin{itemize}
\item 罗塞塔石碑(Rosetta Stone)
\item 刻有埃及国王诏书
\item 石碑上用希腊文字、古埃及文字和当时的通俗体文字刻了同样的内容
\item 罗塞塔石碑(Rosetta Stone)
\item 刻有埃及国王诏书
\item 石碑上用希腊文字、古埃及文字和当时的通俗体文字刻了同样的内容
\end{itemize}
\item 宗教文献翻译
\item 宗教文献翻译
\begin{itemize}
\item 中国的邻国在很长时间内都没有自己的文字,直到佛教传入
\item 在西方,一项最早被记录的翻译活动是将旧约圣经译成希腊语
\item 罗马圣哲杰罗姆将圣经翻译成拉丁语
\item 中国的邻国在很长时间内都没有自己的文字,直到佛教传入
\item 在西方,一项最早被记录的翻译活动是将旧约圣经译成希腊语
\item 罗马圣哲杰罗姆将圣经翻译成拉丁语
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -194,12 +194,12 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 机器翻译如何开始
\begin{frame}{机器翻译的开始}
%%% 机器翻译如何开始
\begin{frame}{机器翻译的开始}
\begin{itemize}
\item 20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法
\item 40年代,美国科学家W. Weaver 和英国工程师A. D. Booth提出了利用计算机进行语言自动翻译的想法
\item 1949年,W. Weaver 发表《翻译备忘录》 ,正式提出机器翻译的思想
\item 20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法
\item 40年代,美国科学家W. Weaver 和英国工程师A. D. Booth提出了利用计算机进行语言自动翻译的想法
\item 1949年,W. Weaver 发表《翻译备忘录》 ,正式提出机器翻译的思想
\end{itemize}
\begin{center}
\includegraphics[scale=0.45]{./Figures/eniac.jpg}
......@@ -207,18 +207,18 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 进入低谷
\begin{frame}{受挫期}
%%% 进入低谷
\begin{frame}{受挫期}
\vspace{-0.5em}
\begin{minipage}{0.60\textwidth}
{\footnotesize
\begin{itemize}
\item 从20世纪50、60年代,美国和苏联两个超级大国由于政治和经济的需要也对机器翻译研究给予了相当大的重视
\item \alert{不幸的是}
\item 从20世纪50、60年代,美国和苏联两个超级大国由于政治和经济的需要也对机器翻译研究给予了相当大的重视
\item \alert{不幸的是}
\begin{itemize}
\item 1964年,美国科学院成立了语言自动处理咨询委员会(ALPAC委员会),开始了为期两年的综合调查分析和测试
\item 1966年11月,该委员会公布了一个题为《语言与机器》的报告(简称ALPAC报告)
\item 该报告全面否定了机器翻译的可行性,并建议停止对机器翻译项目的资金支持
\item 1964年,美国科学院成立了语言自动处理咨询委员会(ALPAC委员会),开始了为期两年的综合调查分析和测试
\item 1966年11月,该委员会公布了一个题为《语言与机器》的报告(简称ALPAC报告)
\item 该报告全面否定了机器翻译的可行性,并建议停止对机器翻译项目的资金支持
\end{itemize}
\end{itemize}
}
......@@ -230,16 +230,16 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 重新崛起
\begin{frame}{快速成长期}
%%% 重新崛起
\begin{frame}{快速成长期}
\begin{itemize}
\item 进入70年代后,国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求
\item 特别是90年代后期,随着 Internet 的普遍应用,机器翻译迎来了一个新的发展机遇
\item 进入70年代后,国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求
\item 特别是90年代后期,随着 Internet 的普遍应用,机器翻译迎来了一个新的发展机遇
\begin{itemize}
\item 有关机器翻译研究的会议频繁召开
\item 各种机器翻译公司的成立
\item 有关机器翻译研究的会议频繁召开
\item 各种机器翻译公司的成立
\end{itemize}
\item 互联网巨头的免费自动翻译服务更是把机器翻译带进新时代
\item 互联网巨头的免费自动翻译服务更是把机器翻译带进新时代
\end{itemize}
\begin{center}
\includegraphics[scale=0.30]{./Figures/google.jpg}
......@@ -247,16 +247,16 @@
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 爆发
\begin{frame}{进一步爆发}
%%% 爆发
\begin{frame}{进一步爆发}
\begin{itemize}
\item 2013年深度学习被应用于机器翻译,受到广泛关注
\item 2013年深度学习被应用于机器翻译,受到广泛关注
\begin{itemize}
\item 端到端学习不依赖过多的先验假设
\item 神经网络的连续空间模型有更强的表示能力
\item 深度网络学习算法的发展和GPU等并行计算模式为训练大规模神经网络提供了可能
\item 端到端学习不依赖过多的先验假设
\item 神经网络的连续空间模型有更强的表示能力
\item 深度网络学习算法的发展和GPU等并行计算模式为训练大规模神经网络提供了可能
\end{itemize}
\item<2-> 时至今日,神经机器翻译已经成为新的范式,大有全面替代统计机器翻译之势 \\
\item<2-> 时至今日,神经机器翻译已经成为新的范式,大有全面替代统计机器翻译之势 \\
\vspace{0.5em}
\begin{tabular}{c c}
\includegraphics[scale=0.19]{./Figures/wmt-participation.jpg}
......@@ -269,33 +269,33 @@
\vspace{-1em}
\begin{center}
{\footnotesize
机器翻译已经成为巨头们的必争之地(图:WMT19参赛队伍)
机器翻译已经成为巨头们的必争之地(图:WMT19参赛队伍)
}
\end{center}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{今天的机器翻译}
\subsection{今天的机器翻译}
%%%------------------------------------------------------------------------------------------------------------
%%% 翻译质量如何
\begin{frame}{翻译质量}
%%% 翻译质量如何
\begin{frame}{翻译质量}
\begin{itemize}
\item 到了今天,机器翻译的质量究竟如何?\alert{客气地说}
\item 到了今天,机器翻译的质量究竟如何?\alert{客气地说}
\begin{itemize}
\item 受限条件下,机器翻译的结果可以接近人工翻译的结果
\item 开放式翻译任务,机器翻译的结果并不理想
\item 受限条件下,机器翻译的结果可以接近人工翻译的结果
\item 开放式翻译任务,机器翻译的结果并不理想
\end{itemize}
\item<2-> \alert{不客气地说},机器翻译的质量远没有达到人们的期望
\item<2-> \alert{不客气地说},机器翻译的质量远没有达到人们的期望
\begin{itemize}
\item 高精度同声传译 - 还需要打磨
\item 小说的翻译 - 可以想一想
\item 古代诗词 - ??? 不要开玩笑
\item 高精度同声传译 - 还需要打磨
\item 小说的翻译 - 可以想一想
\item 古代诗词 - ??? 不要开玩笑
\end{itemize}
\item<3-> 真实的结果 - 汉英新闻领域翻译
\item<3-> 真实的结果 - 汉英新闻领域翻译
\end{itemize}
\vspace{-0.4em}
......@@ -304,15 +304,15 @@
\visible<3->{
\begin{center}
\begin{tikzpicture}
\node [anchor=south west, fill=red!50, minimum width=1.5cm, minimum height=2.3cm] (mt) at (1,0) {{\color{white} \textbf{机器}}};
\node [anchor=south west, fill=blue!50, minimum width=1.5cm, minimum height=2.7cm] (human) at ([xshift=0.5cm]mt.south east) {{\color{white} \textbf{}}};
\node [anchor=south west, fill=red!50, minimum width=1.5cm, minimum height=2.3cm] (mt) at (1,0) {{\color{white} \textbf{机器}}};
\node [anchor=south west, fill=blue!50, minimum width=1.5cm, minimum height=2.7cm] (human) at ([xshift=0.5cm]mt.south east) {{\color{white} \textbf{}}};
\node [anchor=south] (mtscore) at (mt.north) {3.9};
\node [anchor=south] (humanscore) at (human.north) {4.7};
\draw [->,thick] ([xshift=-0.5cm]mt.south west) -- ([xshift=0.5cm]human.south east);
\draw [->,thick] ([xshift=-0.5cm]mt.south west) -- ([xshift=-0.5cm,yshift=3.2cm]mt.south west);
\end{tikzpicture}
\end{center}
\footnotesize{人工评价(5分满)}
\footnotesize{人工评价(5分满)}
}
\end{center}
\end{minipage}
......@@ -321,33 +321,33 @@
\visible<4->{
\begin{center}
\begin{tikzpicture}
\node [anchor=south west, fill=red!50, minimum width=1.5cm, minimum height=1.5cm] (mt) at (1,0) {{\color{white} \textbf{机器}}};
\node [anchor=south west, fill=blue!50, minimum width=1.5cm, minimum height=2.7cm] (human) at ([xshift=0.5cm]mt.south east) {{\color{white} \textbf{}}};
\node [anchor=south west, fill=red!50, minimum width=1.5cm, minimum height=1.5cm] (mt) at (1,0) {{\color{white} \textbf{机器}}};
\node [anchor=south west, fill=blue!50, minimum width=1.5cm, minimum height=2.7cm] (human) at ([xshift=0.5cm]mt.south east) {{\color{white} \textbf{}}};
\node [anchor=south] (mtscore) at (mt.north) {47\%};
\node [anchor=south] (humanscore) at (human.north) {100\%};
\draw [->,thick] ([xshift=-0.5cm]mt.south west) -- ([xshift=0.5cm]human.south east);
\draw [->,thick] ([xshift=-0.5cm]mt.south west) -- ([xshift=-0.5cm,yshift=3.2cm]mt.south west);
\end{tikzpicture}
\end{center}
\footnotesize{自动评价}
\footnotesize{自动评价}
}
\end{center}
\end{minipage}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 一个翻译实例
\begin{frame}{机器翻译没有用?}
%%% 一个翻译实例
\begin{frame}{机器翻译没有用?}
\begin{itemize}
\item 机器翻译一点儿用都没有?
\item 机器翻译一点儿用都没有?
\begin{itemize}
\item<4-> 确实,二者有差距
\item<5-> 如果考虑速度 - 哦?
\item<6-> 换个情况:如果我们要翻译100万篇这样的文档
\item<4-> 确实,二者有差距
\item<5-> 如果考虑速度 - 哦?
\item<6-> 换个情况:如果我们要翻译100万篇这样的文档
\begin{itemize}
\item 人工的成本无法想象,消耗的时间更是难以计算
\item 而计算机集群只需要1天,而且只有电力消耗
\item 人工的成本无法想象,消耗的时间更是难以计算
\item 而计算机集群只需要1天,而且只有电力消耗
\end{itemize}
\end{itemize}
\end{itemize}
......@@ -357,21 +357,21 @@
\begin{minipage}[t]{0.47\textwidth}
\visible<2->{
\only<2>{
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{源文(约500字)}
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{源文(约500字)}
{\scriptsize
\begin{spacing}{0.9}
过去,曾经有一个小岛,上面住着喜悦,悲伤,知识,爱,等各种情绪。
一天,这些情绪发现这个小岛即将沉没,所以大家都陆续准备船只,打算离开小岛。
只有爱留了下来。她要坚持到最后一刻。
过了几天,小岛真的要沉没了,爱想找别人帮助。
此时,财富正好乘着一艘大船经过。
爱说:“财富,你能不能带我离开?”...
过去,曾经有一个小岛,上面住着喜悦,悲伤,知识,爱,等各种情绪。
一天,这些情绪发现这个小岛即将沉没,所以大家都陆续准备船只,打算离开小岛。
只有爱留了下来。她要坚持到最后一刻。
过了几天,小岛真的要沉没了,爱想找别人帮助。
此时,财富正好乘着一艘大船经过。
爱说:“财富,你能不能带我离开?”...
\end{spacing}
}
\end{beamerboxesrounded}
}
\only<3->{
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{人工翻译 \only<5->{- 耗时20分钟}}
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{人工翻译 \only<5->{- 耗时20分钟}}
{\scriptsize
\begin{spacing}{0.9}
Once upon a time there was a small island where lived all kinds of emotions like JOY, SADNESS, KNOWLEDGE and LOVE.
......@@ -388,7 +388,7 @@ At that moment, WEALTH was ...
\hfill
\begin{minipage}[t]{0.47\textwidth}
\visible<2->{
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{机器翻译 \only<5->{- 耗时2秒钟}}
\begin{beamerboxesrounded}[upper=uppercolblue,lower=lowercolblue,shadow=true]{机器翻译 \only<5->{- 耗时2秒钟}}
{\scriptsize
\begin{spacing}{0.9}
In the past, there has been a small island, \only<2-3>{on top of}\only<4->{\alert{\underline{on top of}}} joy, sadness, knowledge, love, all kinds of emotions.
......@@ -406,16 +406,16 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 可能的应用
\begin{frame}{真的很有用!}
%%% 可能的应用
\begin{frame}{真的很有用!}
% 例子1 - 专利翻译
% 例子1 - 专利翻译
\begin{minipage}[b]{0.70\textwidth}
\begin{enumerate}
\item 专利翻译
\item 专利翻译
\begin{itemize}
\item 对上千万专利文档进行翻译的人工代价几乎为天文数字
\item 机器翻译(集群)仅需几天
\item 对上千万专利文档进行翻译的人工代价几乎为天文数字
\item 机器翻译(集群)仅需几天
\end{itemize}
\end{enumerate}
\end{minipage}
......@@ -428,14 +428,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\vspace{0.3em}
\visible<2->{
% 例子2 - 网络数据侦测
% 例子2 - 网络数据侦测
\begin{minipage}[b]{0.70\textwidth}
\begin{enumerate}
\setcounter{enumi}{1}
\item 网络环境海量数据的翻译
\item 网络环境海量数据的翻译
\begin{itemize}
\item 情报部门对信息的截获与侦测
\item 数据量超大,机器翻译几乎是唯一的选择
\item 情报部门对信息的截获与侦测
\item 数据量超大,机器翻译几乎是唯一的选择
\end{itemize}
\end{enumerate}
\end{minipage}
......@@ -449,14 +449,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\vspace{0.3em}
\visible<3->{
% 例子3 - 翻译结果后编辑
% 例子3 - 翻译结果后编辑
\begin{minipage}[b]{0.70\textwidth}
\begin{enumerate}
\setcounter{enumi}{2}
\item 翻译结果后编辑
\item 翻译结果后编辑
\begin{itemize}
\item 在机器翻译的结果上人工修改,生成可交付的翻译结果
\item 市场很大
\item 在机器翻译的结果上人工修改,生成可交付的翻译结果
\item 市场很大
\end{itemize}
\end{enumerate}
\end{minipage}
......@@ -470,14 +470,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\vspace{0.3em}
\visible<4->{
% 例子4 - 全球化
% 例子4 - 全球化
\begin{minipage}[b]{0.70\textwidth}
\begin{enumerate}
\setcounter{enumi}{3}
\item 全球化
\item 全球化
\begin{itemize}
\item 一个公司的产品,在各个国家推广
\item 文档翻译的人工成本很高,而机器翻译可以很好的完成这个工作
\item 一个公司的产品,在各个国家推广
\item 文档翻译的人工成本很高,而机器翻译可以很好的完成这个工作
\end{itemize}
\end{enumerate}
\end{minipage}
......@@ -491,26 +491,26 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 基本内容
\begin{frame}{是否有兴趣?}
%%% 基本内容
\begin{frame}{是否有兴趣?}
\vspace{0.5em}
\begin{spacing}{1.1}
\begin{itemize}
\item 如果你是...,那么你一定会对机器翻译感兴趣
\item 如果你是...,那么你一定会对机器翻译感兴趣
\begin{enumerate}
\item 计算机、语言学、应用数学及相关专业的科研技术人员
\item 翻译人员且能接受利用计算机提高工作效率
\item 所有有翻译需求的企业技术人员
\item 计算机、语言学、应用数学及相关专业的科研技术人员
\item 翻译人员且能接受利用计算机提高工作效率
\item 所有有翻译需求的企业技术人员
\item ...
\end{enumerate}
\item<2-> 这里重点介绍当今主流的机器翻译原理、方法及实现技术(统计/神经机器翻译)
\item<2-> 这里重点介绍当今主流的机器翻译原理、方法及实现技术(统计/神经机器翻译)
\begin{enumerate}
\item \textbf{第一部分:基本概念 (Sections 1-2)}\\
不涉及深入的机器翻译技术 - 面向所有人
\item \textbf{第二部分:统计机器翻译 (Sections 3-4)}\\
统计机器翻译的建模,进一步介绍基于词、短语、句法的模型及实现方法
\item \textbf{第三部分:神经机器翻译 (Sections 5-6)}\\
基于神经网络的机器翻译建模,包括:张量计算基础、基于神经网络的语言模型和翻译模型
\item \textbf{第一部分:基本概念 (Sections 1-2)}\\
不涉及深入的机器翻译技术 - 面向所有人
\item \textbf{第二部分:统计机器翻译 (Sections 3-4)}\\
统计机器翻译的建模,进一步介绍基于词、短语、句法的模型及实现方法
\item \textbf{第三部分:神经机器翻译 (Sections 5-6)}\\
基于神经网络的机器翻译建模,包括:张量计算基础、基于神经网络的语言模型和翻译模型
\end{enumerate}
\end{itemize}
\end{spacing}
......@@ -518,22 +518,22 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\section{基本方法}
\section{基本方法}
%%%------------------------------------------------------------------------------------------------------------
\subsection{框架}
\subsection{框架}
%%%------------------------------------------------------------------------------------------------------------
%%% 机器翻译研究的内容
\begin{frame}{说了半天,机器翻译是个啥东西?}
%%% 机器翻译研究的内容
\begin{frame}{说了半天,机器翻译是个啥东西?}
\vspace{0.5em}
\begin{minipage}[b]{0.65\textwidth}
\begin{itemize}
\item 如果你对自然语言处理技术有了解
\item 如果你对自然语言处理技术有了解
\begin{itemize}
\item 那就不需要解释了
\item 那就不需要解释了
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -552,26 +552,26 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\begin{itemize}
% 软件定义
\item<2-> 如果你使用过Baidu翻译且对软件技术有些了解
% 软件定义
\item<2-> 如果你使用过Baidu翻译且对软件技术有些了解
\begin{itemize}
\item 机器翻译系统实际就是一个软件,输入是待翻译句子/文本,输出是译文句子/文本
\item 机器翻译系统实际就是一个软件,输入是待翻译句子/文本,输出是译文句子/文本
\end{itemize}
% 对于外行人,避免误解
\item<3-> \alert{}对没听说过机器翻译的同学\alert{注意}
% 对于外行人,避免误解
\item<3-> \alert{}对没听说过机器翻译的同学\alert{注意}
\begin{itemize}
\item<3-> 机器翻译系统和QQ类似,就是可以在计算机上运行的工具 \\
机器翻译系统 = 软件工具
\item<4-> 但是,机器翻译系统\alert{不是QQ} \\
机器翻译系统 $\ne$ 好看的按钮 \\
机器翻译系统 $\ne$ 美丽的图标 \\
\item<5-> 机器翻译是完成自动翻译所执行的"不可见的程序"\\
\item<3-> 机器翻译系统和QQ类似,就是可以在计算机上运行的工具 \\
机器翻译系统 = 软件工具
\item<4-> 但是,机器翻译系统\alert{不是QQ} \\
机器翻译系统 $\ne$ 好看的按钮 \\
机器翻译系统 $\ne$ 美丽的图标 \\
\item<5-> 机器翻译是完成自动翻译所执行的"不可见的程序"\\
\vspace{0.5em}
\begin{tikzpicture}
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20] (s) at (0,0) {输入文字};
\node [thick,draw=red!50!black!50,top color=white,bottom color=red!50!black!20,anchor=west] (mt) at ([xshift=0.3in]s.east) {\begin{tabular}{c}机器翻译\\???\end{tabular}};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20,anchor=west] (t) at ([xshift=0.3in]mt.east) {输出译文};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20] (s) at (0,0) {输入文字};
\node [thick,draw=red!50!black!50,top color=white,bottom color=red!50!black!20,anchor=west] (mt) at ([xshift=0.3in]s.east) {\begin{tabular}{c}机器翻译\\???\end{tabular}};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20,anchor=west] (t) at ([xshift=0.3in]mt.east) {输出译文};
\draw[-latex,thick] (s.east)--(mt.west);
\draw[-latex,thick] (mt.east)--(t.west);
\end{tikzpicture}
......@@ -580,13 +580,13 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 机器翻译 = 数据 + 系统
\begin{frame}{又说了半天,机器翻译到底是个啥东西?}
%%% 机器翻译 = 数据 + 系统
\begin{frame}{又说了半天,机器翻译到底是个啥东西?}
\begin{center}
\begin{tikzpicture}
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20] (s) at (0,0) {输入文字};
\node [thick,minimum width=6em,draw=red!50!black!50,top color=white,bottom color=red!50!black!20,anchor=west] (mt) at ([xshift=0.3in]s.east) {\begin{tabular}{c}机器翻译\\???\end{tabular}};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20,anchor=west] (t) at ([xshift=0.3in]mt.east) {输出译文};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20] (s) at (0,0) {输入文字};
\node [thick,minimum width=6em,draw=red!50!black!50,top color=white,bottom color=red!50!black!20,anchor=west] (mt) at ([xshift=0.3in]s.east) {\begin{tabular}{c}机器翻译\\???\end{tabular}};
\node [thick,rounded corners=3mm,draw=blue!50!black!50,top color=white,bottom color=blue!50!black!20,anchor=west] (t) at ([xshift=0.3in]mt.east) {输出译文};
\visible<2->{
\node [draw=ugreen,fill=ugreen,minimum width=3.1em,minimum height=1.5em,anchor=south west] (part1) at (mt.south west) {{\color{white} 1}};
\node [draw=ublue,fill=ublue,minimum width=3.1em,minimum height=1.5em,anchor=south east] (part2) at (mt.south east) {{\color{white} 2}};
......@@ -597,14 +597,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\visible<3->{
\begin{scope}[yshift=-0.8in]
\node [] (part1label) at (0,0) {\includegraphics[scale=0.07]{./Figures/oil.jpg}};
\node [anchor=north west] (part1text) at ([xshift=-2em,yshift=0.5em]part1label.south west) {\begin{tabular}{l}\alert{资源}:可以使机器翻译\\系统运行的"汽油"\end{tabular}};
\node [anchor=north west] (part1text) at ([xshift=-2em,yshift=0.5em]part1label.south west) {\begin{tabular}{l}\alert{资源}:可以使机器翻译\\系统运行的"汽油"\end{tabular}};
\end{scope}
}
\visible<4->{
\begin{scope}[yshift=-0.8in,xshift=2.2in]
\node [] (part2label) at (0,0.3em) {\includegraphics[scale=0.22]{./Figures/truck.jpg}};
\node [anchor=north west] (part2text) at ([xshift=-2em,yshift=0em]part2label.south west) {\begin{tabular}{l}\alert{系统}:利用资源完成\\自动翻译的程序\end{tabular}};
\node [anchor=north west] (part2text) at ([xshift=-2em,yshift=0em]part2label.south west) {\begin{tabular}{l}\alert{系统}:利用资源完成\\自动翻译的程序\end{tabular}};
\end{scope}
}
......@@ -622,48 +622,48 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\vspace{-1.0em}
\begin{itemize}
\item<5-> 可以说,所有机器翻译系统都是由两部分组成
\item<5-> 可以说,所有机器翻译系统都是由两部分组成
\begin{enumerate}
\item 资源是指翻译\alert{规则}、双(单)语\alert{数据}\alert{知识库}等等翻译知识,且这些'知识'是计算机可读的
\item 系统是各种机器翻译算法的\alert{程序实现}
\item 资源是指翻译\alert{规则}、双(单)语\alert{数据}\alert{知识库}等等翻译知识,且这些'知识'是计算机可读的
\item 系统是各种机器翻译算法的\alert{程序实现}
\end{enumerate}
\end{itemize}
\visible<6->{
\begin{tikzpicture}
\node [draw,thick,red] (note) at (0,0) {\alert{\textbf{注意:任何机器翻译系统没有翻译资源的支持都是白搭!}}};
\node [draw,thick,red] (note) at (0,0) {\alert{\textbf{注意:任何机器翻译系统没有翻译资源的支持都是白搭!}}};
\end{tikzpicture}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{基于规则的机器翻译}
\subsection{基于规则的机器翻译}
%%%------------------------------------------------------------------------------------------------------------
%%% 基于规则的机器翻译
\begin{frame}{如何进行机器翻译? - 基于规则的方法}
%%% 基于规则的机器翻译
\begin{frame}{如何进行机器翻译? - 基于规则的方法}
\alert{基于规则的机器翻译}:以词典和(人工书写的)规则库构成知识源,用一系列规则的组合完成翻译
\alert{基于规则的机器翻译}:以词典和(人工书写的)规则库构成知识源,用一系列规则的组合完成翻译
\begin{itemize}
\item 规则的形式:\textbf{If} ..., \textbf{then} ...
\item 规则的形式:\textbf{If} ..., \textbf{then} ...
\end{itemize}
\begin{tikzpicture}
\begin{scope}
\visible<2->{
{\small
\node [anchor=north west] (rule1) at (0,0) {\textbf{1: If} 源='我', \textbf{then}='I'};
\node [anchor=north west] (rule2) at ([yshift=0.1em]rule1.south west) {\textbf{2: If} 源='你', \textbf{then}='you'};
\node [anchor=north west] (rule3) at ([yshift=0.1em]rule2.south west) {\textbf{3: If} 源='感到 满意',};
\node [anchor=north west] (rule3part2) at ([yshift=0.5em]rule3.south west) {\textbf{\hspace{0.95em} then} ='be satisfied with'};
\node [anchor=north west] (rule4) at ([yshift=0.1em]rule3part2.south west) {\textbf{4: If} 源='对 ... 动词[表态度]'};
\node [anchor=north west] (rule4part2) at ([yshift=0.5em]rule4.south west) {\textbf{\hspace{0.95em} then} 调序[动词 + 对象]};
\node [anchor=north west] (rule5) at ([yshift=0.1em]rule4part2.south west) {\textbf{5: If} 译文主语是'I'};
\node [anchor=north west] (rule5part2) at ([yshift=0.5em]rule5.south west) {\textbf{\hspace{0.95em} then} be动词为'am/was'};
\node [anchor=north west] (rule6) at ([yshift=0.1em]rule5part2.south west) {\textbf{6: If} 源语是主谓结构};
\node [anchor=north west] (rule6part2) at ([yshift=0.5em]rule6.south west) {\textbf{\hspace{0.95em} then} 译文为主谓结构};
\node [anchor=south west] (rulebaselabel) at (rule1.north west) {{\color{ublue} 资源:规则库}};
\node [anchor=north west] (rule1) at (0,0) {\textbf{1: If} 源='我', \textbf{then}='I'};
\node [anchor=north west] (rule2) at ([yshift=0.1em]rule1.south west) {\textbf{2: If} 源='你', \textbf{then}='you'};
\node [anchor=north west] (rule3) at ([yshift=0.1em]rule2.south west) {\textbf{3: If} 源='感到 满意',};
\node [anchor=north west] (rule3part2) at ([yshift=0.5em]rule3.south west) {\textbf{\hspace{0.95em} then} ='be satisfied with'};
\node [anchor=north west] (rule4) at ([yshift=0.1em]rule3part2.south west) {\textbf{4: If} 源='对 ... 动词[表态度]'};
\node [anchor=north west] (rule4part2) at ([yshift=0.5em]rule4.south west) {\textbf{\hspace{0.95em} then} 调序[动词 + 对象]};
\node [anchor=north west] (rule5) at ([yshift=0.1em]rule4part2.south west) {\textbf{5: If} 译文主语是'I'};
\node [anchor=north west] (rule5part2) at ([yshift=0.5em]rule5.south west) {\textbf{\hspace{0.95em} then} be动词为'am/was'};
\node [anchor=north west] (rule6) at ([yshift=0.1em]rule5part2.south west) {\textbf{6: If} 源语是主谓结构};
\node [anchor=north west] (rule6part2) at ([yshift=0.5em]rule6.south west) {\textbf{\hspace{0.95em} then} 译文为主谓结构};
\node [anchor=south west] (rulebaselabel) at (rule1.north west) {{\color{ublue} 资源:规则库}};
}
\begin{pgfonlayer}{background}
......@@ -677,30 +677,30 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\begin{scope}[xshift=2.3in]
\visible<3->{
\node [anchor=north west,inner sep=1mm] (w1) at (0,1.7em) {};
\node [anchor=north west,inner sep=1mm] (w2) at ([xshift=0.3em]w1.north east) {};
\node [anchor=north west,inner sep=1mm] (w3) at ([xshift=0.3em]w2.north east) {};
\node [anchor=north west,inner sep=1mm] (w4) at ([xshift=0.3em]w3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (w5) at ([xshift=0.3em]w4.north east) {满意};
\node [anchor=north west,inner sep=1mm] (w1) at (0,1.7em) {};
\node [anchor=north west,inner sep=1mm] (w2) at ([xshift=0.3em]w1.north east) {};
\node [anchor=north west,inner sep=1mm] (w3) at ([xshift=0.3em]w2.north east) {};
\node [anchor=north west,inner sep=1mm] (w4) at ([xshift=0.3em]w3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (w5) at ([xshift=0.3em]w4.north east) {满意};
}
\end{scope}
\visible<4>{
\draw[->,dotted,thick,red] (rule1.east)..controls +(east:0.6) and +(west:0.6)..(w1.west) node[pos=0.25,below,xshift=0.3em,yshift=0.0em] (applyr1) {\alert{\tiny{\textbf{规则1}}}};}
\draw[->,dotted,thick,red] (rule1.east)..controls +(east:0.6) and +(west:0.6)..(w1.west) node[pos=0.25,below,xshift=0.3em,yshift=0.0em] (applyr1) {\alert{\tiny{\textbf{规则1}}}};}
\visible<4->{
\node [anchor=north,inner sep=1mm] (t1) at ([yshift=-0.6em]w1.south) {I};
\draw[->,thick,ublue] (w1.south)--(t1.north);
}
\visible<5>{
\draw[->,dotted,thick,red] (rule2.east)..controls +(east:2.5) and +(south west:0.5)..([yshift=0.3em]w3.south west) node[pos=0.2,below,xshift=0.3em,yshift=0.0em] (applyr2) {\alert{\tiny{\textbf{规则2}}}};}
\draw[->,dotted,thick,red] (rule2.east)..controls +(east:2.5) and +(south west:0.5)..([yshift=0.3em]w3.south west) node[pos=0.2,below,xshift=0.3em,yshift=0.0em] (applyr2) {\alert{\tiny{\textbf{规则2}}}};}
\visible<5->{
\node [anchor=north,inner sep=1mm] (t3) at ([yshift=-0.6em]w3.south) {you};
\draw[->,thick,ublue] (w3.south)--(t3.north);
}
\visible<6>{
\draw[->,dotted,thick,red] ([xshift=-0.5em]rule3part2.east)..controls +(east:4.1) and +(south west:0.5)..([yshift=0.1em,xshift=0.2em]w4.south west) node[pos=0.2,below,xshift=0.3em,yshift=0.0em] (applyr3) {\alert{\tiny{\textbf{规则3}}}};
\draw[->,dotted,thick,red] ([xshift=-0.5em]rule3part2.east)..controls +(east:4.1) and +(south west:0.5)..([yshift=0.1em,xshift=0.2em]w4.south west) node[pos=0.2,below,xshift=0.3em,yshift=0.0em] (applyr3) {\alert{\tiny{\textbf{规则3}}}};
}
\visible<6->{
\draw[-] ([yshift=0.2em]w4.south west)--([yshift=0.2em]w5.south east);
......@@ -714,7 +714,7 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\draw[->,thick,ublue] (t45.south)..controls +(south:1.0) and +(north:0.5)..([xshift=3em]t35.north west);
}
\visible<7>{
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule4part2.east)..controls +(east:1.5) and +( west:1.5)..(t35.west) node[pos=0.8,above,xshift=0.3em,yshift=0.0em] (applyr4) {\alert{\tiny{\textbf{规则4}}}};
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule4part2.east)..controls +(east:1.5) and +( west:1.5)..(t35.west) node[pos=0.8,above,xshift=0.3em,yshift=0.0em] (applyr4) {\alert{\tiny{\textbf{规则4}}}};
}
\visible<8->{
......@@ -723,7 +723,7 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\draw[->,thick,ublue] (t1.south)..controls +(south:1.5) and +(north:1.5)..([xshift=0.5em]t15.north west);
}
\visible<8>{
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule6part2.east)..controls +(east:1.5) and +( west:1.5)..(t15.west) node[pos=0.9,above,xshift=0.3em,yshift=0.0em] (applyr6) {\alert{\tiny{\textbf{规则6}}}};
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule6part2.east)..controls +(east:1.5) and +( west:1.5)..(t15.west) node[pos=0.9,above,xshift=0.3em,yshift=0.0em] (applyr6) {\alert{\tiny{\textbf{规则6}}}};
}
\visible<9->{
......@@ -732,43 +732,43 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\draw[->,thick,ublue] (be1.south)..controls +(south:0.6) and +(north:0.6)..([xshift=1.8em,yshift=-0.0em]t15final.north west);
}
\visible<9>{
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule5part2.east)..controls +(east:1.5) and +( west:1.5)..(t15final.west) node[pos=0.9,below,xshift=0.3em,yshift=0.0em] (applyr6) {\alert{\tiny{\textbf{规则5}}}};
\draw[->,dotted,thick,red] ([xshift=-0.2em]rule5part2.east)..controls +(east:1.5) and +( west:1.5)..(t15final.west) node[pos=0.9,below,xshift=0.3em,yshift=0.0em] (applyr6) {\alert{\tiny{\textbf{规则5}}}};
}
\begin{pgfonlayer}{background}
\visible<10->{
\node[rectangle,thick,draw=red, inner sep=0mm] [fit = (t15final)] {};
\node[] (finaloutput) at ([yshift=0.5em]t15final.north) {\alert{\footnotesize{输出翻译结果}}};
\node[] (finaloutput) at ([yshift=0.5em]t15final.north) {\alert{\footnotesize{输出翻译结果}}};
}
\end{pgfonlayer}
\end{tikzpicture}
\end{frame} %基于规则的机器翻译
\end{frame} %基于规则的机器翻译
%%%------------------------------------------------------------------------------------------------------------
\subsection{基于实例的机器翻译}
\subsection{基于实例的机器翻译}
%%%------------------------------------------------------------------------------------------------------------
%%% 基于实例的机器翻译
\begin{frame}{如何进行机器翻译? - 基于实例的方法}
\alert{基于实例的机器翻译}:在双语句库中找到与待翻译句子相似的实例,之后对其译文进行必要修改,得到最终的译文
%%% 基于实例的机器翻译
\begin{frame}{如何进行机器翻译? - 基于实例的方法}
\alert{基于实例的机器翻译}:在双语句库中找到与待翻译句子相似的实例,之后对其译文进行必要修改,得到最终的译文
\begin{itemize}
\item 特例:翻译记忆(TM)只查找能够精确匹配的例句输出
\item 特例:翻译记忆(TM)只查找能够精确匹配的例句输出
\end{itemize}
\begin{tikzpicture}
\begin{scope}
\visible<2->{
{\small
\node [anchor=north west] (example1) at (0,0) {\textbf{1:} 源='什么 时候 开始 ?'};
\node [anchor=north west] (example1part2) at ([yshift=0.5em]example1.south west) {\hspace{1em} ='When will it start ?'};
\node [anchor=north west] (example2) at ([yshift=0.1em]example1part2.south west) {\textbf{2:} 源='我 对 他 感到 高兴'};
\node [anchor=north west] (example2part2) at ([yshift=0.5em]example2.south west) {\hspace{1em} ='I am happy with him'};
\node [anchor=north west] (example1) at (0,0) {\textbf{1:} 源='什么 时候 开始 ?'};
\node [anchor=north west] (example1part2) at ([yshift=0.5em]example1.south west) {\hspace{1em} ='When will it start ?'};
\node [anchor=north west] (example2) at ([yshift=0.1em]example1part2.south west) {\textbf{2:} 源='我 对 他 感到 高兴'};
\node [anchor=north west] (example2part2) at ([yshift=0.5em]example2.south west) {\hspace{1em} ='I am happy with him'};
\node [anchor=north west] (example3) at ([yshift=0.1em]example2part2.south west) {\hspace{1em} ...};
\node [anchor=south west] (examplebaselabel) at (example1.north west) {{\color{ublue} 资源1:翻译实例库}};
\node [anchor=south west] (examplebaselabel) at (example1.north west) {{\color{ublue} 资源1:翻译实例库}};
}
}
......@@ -783,11 +783,11 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\begin{scope} [yshift=-1.3in]
{\small
\visible<2->{
\node [anchor=north west] (entry1) at (0,0) {\textbf{1:} $\to$ I $\mid$ me};
\node [anchor=north west] (entry2) at ([yshift=0.1em]entry1.south west) {\textbf{2:} $\to$ you};
\node [anchor=north west] (entry3) at ([yshift=0.1em]entry2.south west) {\textbf{3:} 满意 \hspace{-0.5em} $\to$ \hspace{-0.5em} satisfy \hspace{-0.2em}$\mid$\hspace{-0.1em} satisfied ... };
\node [anchor=north west] (entry1) at (0,0) {\textbf{1:} $\to$ I $\mid$ me};
\node [anchor=north west] (entry2) at ([yshift=0.1em]entry1.south west) {\textbf{2:} $\to$ you};
\node [anchor=north west] (entry3) at ([yshift=0.1em]entry2.south west) {\textbf{3:} 满意 \hspace{-0.5em} $\to$ \hspace{-0.5em} satisfy \hspace{-0.2em}$\mid$\hspace{-0.1em} satisfied ... };
\node [anchor=north west] (entry4) at ([yshift=0.1em]entry3.south west) {\hspace{1em} ...};
\node [anchor=south west] (dictionarylabel) at (entry1.north west) {{\color{ublue} 资源2:翻译词典}};
\node [anchor=south west] (dictionarylabel) at (entry1.north west) {{\color{ublue} 资源2:翻译词典}};
}
}
......@@ -801,29 +801,29 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\begin{scope}[xshift=2.3in]
\visible<3->{
\node [anchor=north west,inner sep=1mm] (w1) at (0,1.7em) {};
\node [anchor=north west,inner sep=1mm] (w2) at ([xshift=0.3em]w1.north east) {};
\node [anchor=north west,inner sep=1mm] (w3) at ([xshift=0.3em]w2.north east) {};
\node [anchor=north west,inner sep=1mm] (w4) at ([xshift=0.3em]w3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (w5) at ([xshift=0.3em]w4.north east) {满意};
\node [anchor=north west,inner sep=1mm] (w1) at (0,1.7em) {};
\node [anchor=north west,inner sep=1mm] (w2) at ([xshift=0.3em]w1.north east) {};
\node [anchor=north west,inner sep=1mm] (w3) at ([xshift=0.3em]w2.north east) {};
\node [anchor=north west,inner sep=1mm] (w4) at ([xshift=0.3em]w3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (w5) at ([xshift=0.3em]w4.north east) {满意};
}
\end{scope}
\visible<4>{
\draw[<->,dotted,thick,red] (example1.east)..controls +(east:0.8) and +(west:0.8)..(w1.west) node[pos=0.4,below,xshift=1em,yshift=0.2em] (sim1) {\alert{\tiny{\textbf{相似度=0}}}};
\draw[<->,dotted,thick,red] (example1.east)..controls +(east:0.8) and +(west:0.8)..(w1.west) node[pos=0.4,below,xshift=1em,yshift=0.2em] (sim1) {\alert{\tiny{\textbf{相似度=0}}}};
}
\visible<5>{
\draw[<->,dotted,thick,red] (example2.east)..controls +(east:0.8) and +(west:0.8)..(w1.west) node[pos=0.4,right,xshift=0em,yshift=0.2em] (sim2) {\alert{\tiny{\textbf{相似度=0.6}}}};
\draw[<->,dotted,thick,red] (example2.east)..controls +(east:0.8) and +(west:0.8)..(w1.west) node[pos=0.4,right,xshift=0em,yshift=0.2em] (sim2) {\alert{\tiny{\textbf{相似度=0.6}}}};
}
\begin{scope}[xshift=2.3in,yshift=-0.2in]
\visible<6->{
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {高兴};
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {高兴};
}
\end{scope}
......@@ -838,33 +838,33 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{scope}
\visible<6->{
\draw[<->,dotted,thick,red] (example2.east)..controls +(east:0.6) and +(west:0.6)..(c1.west) node[pos=0.9,left,xshift=0.6em,yshift=0.4em] (simexample) {\alert{\tiny{\textbf{相似实例}}}};
\draw[<->,dotted,thick,red] (example2.east)..controls +(east:0.6) and +(west:0.6)..(c1.west) node[pos=0.9,left,xshift=0.6em,yshift=0.4em] (simexample) {\alert{\tiny{\textbf{相似实例}}}};
\draw[<->,dotted,thick,red] ([xshift=-0.2em]example2part2.east)..controls +(east:0.5) and +(west:0.5)..(e1.west);
}
\visible<7->{
\draw[<->,dotted,thick,ublue] (w3.south)--(c3.north) node[pos=0.5,right] (mismatch1) {\alert{\tiny{\textbf{不匹配}}}};
\draw[<->,dotted,thick,ublue] (w3.south)--(c3.north) node[pos=0.5,right] (mismatch1) {\alert{\tiny{\textbf{不匹配}}}};
\draw[dotted,thick,ublue] ([yshift=0.4em]c3.south east)..controls +(south:0.3) and +(north:0.4)..([yshift=-0.4em]e5.north west);
}
\visible<8->{
\draw[<->,dotted,thick,ublue] (w5.south)--(c5.north) node[pos=0.5,right] (mismatch1) {\alert{\tiny{\textbf{不匹配}}}};
\draw[<->,dotted,thick,ublue] (w5.south)--(c5.north) node[pos=0.5,right] (mismatch1) {\alert{\tiny{\textbf{不匹配}}}};
\draw[dotted,thick,ublue] ([xshift=0.5em,yshift=0.2em]c5.south west)--([xshift=-0.5em,yshift=-0.2em]e3.north);
}
\visible<9->{
\draw[double,->,thick,ublue] (e3.south)--([yshift=-1.2em]e3.south) node[pos=0.5,right,xshift=0.2em] (step1) {\alert{\tiny{\textbf{用'你'替换'他'}}}};
\draw[double,->,thick,ublue] (e3.south)--([yshift=-1.2em]e3.south) node[pos=0.5,right,xshift=0.2em] (step1) {\alert{\tiny{\textbf{用'你'替换'他'}}}};
\draw[->,dotted,thick,red] (entry2.east)..controls +(east:4) and +(west:4)..([yshift=-0.6em,xshift=-0.5em]e3.south) ;
}
\begin{scope}[xshift=2.3in,yshift=-0.9in]
\visible<9->{
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {\textbf{{\color{ublue} }}};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {高兴};
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {\textbf{{\color{ublue} }}};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {高兴};
}
\end{scope}
......@@ -883,18 +883,18 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
}
\visible<10->{
\draw[double,->,thick,ublue] (e3.south)--([yshift=-1.2em]e3.south) node[pos=0.5,right,xshift=0.2em] (step1) {\alert{\tiny{\textbf{用'满意'替换'高兴'}}}};
\draw[double,->,thick,ublue] (e3.south)--([yshift=-1.2em]e3.south) node[pos=0.5,right,xshift=0.2em] (step1) {\alert{\tiny{\textbf{用'满意'替换'高兴'}}}};
\draw[->,dotted,thick,red] ([xshift=-1.3em,yshift=-0.5em]entry3.north east)..controls +(east:2) and +(west:3)..([yshift=-0.6em,xshift=-0.5em]e3.south) ;
}
\begin{scope}[xshift=2.3in,yshift=-1.6in]
\visible<10->{
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {\textbf{{\color{ublue} 满意}}};
\node [anchor=north west,inner sep=1mm] (c1) at (0,0) {};
\node [anchor=north west,inner sep=1mm] (c2) at ([xshift=0.3em]c1.north east) {};
\node [anchor=north west,inner sep=1mm] (c3) at ([xshift=0.3em]c2.north east) {};
\node [anchor=north west,inner sep=1mm] (c4) at ([xshift=0.3em]c3.north east) {感到};
\node [anchor=north west,inner sep=1mm] (c5) at ([xshift=0.3em]c4.north east) {\textbf{{\color{ublue} 满意}}};
}
\end{scope}
......@@ -915,7 +915,7 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\begin{pgfonlayer}{background}
\visible<11->{
\node[rectangle,draw=red,thick,inner sep=0mm] [fit = (e1) (e2) (e3) (e4) (e5)] {};
\node[anchor=north] (outputlabel) at (e3.south) {\small{\textbf{\alert{输出翻译结果}}}};
\node[anchor=north] (outputlabel) at (e3.south) {\small{\textbf{\alert{输出翻译结果}}}};
}
\end{pgfonlayer}
......@@ -924,14 +924,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{统计机器翻译}
\subsection{统计机器翻译}
%%%------------------------------------------------------------------------------------------------------------
%%% 统计机器翻译
\begin{frame}{如何进行机器翻译? - 基于统计的方法}
\alert{统计机器翻译}:利用统计模型从双/单语语料中自动学习翻译知识,之后这些知识对新句子进行翻译
%%% 统计机器翻译
\begin{frame}{如何进行机器翻译? - 基于统计的方法}
\alert{统计机器翻译}:利用统计模型从双/单语语料中自动学习翻译知识,之后这些知识对新句子进行翻译
\begin{itemize}
\item 建模 + 学习知识 + 利用这些知识进行翻译
\item 建模 + 学习知识 + 利用这些知识进行翻译
\end{itemize}
\begin{tikzpicture}
......@@ -939,14 +939,14 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\visible<2->{
\begin{scope}
{\footnotesize
\node [anchor=north west] (example1) at (0,0) {\textbf{1:} 源='他 在 哪 ?'};
\node [anchor=north west] (example1part2) at ([yshift=0.5em]example1.south west) {\hspace{1em} ='Where is he ?'};
\node [anchor=north west] (example2) at ([yshift=0.1em]example1part2.south west) {\textbf{2:} 源='我 真高兴'};
\node [anchor=north west] (example2part2) at ([yshift=0.5em]example2.south west) {\hspace{1em} ='I'm so happy'};
\node [anchor=north west] (example3) at ([yshift=0.1em]example2part2.south west) {\textbf{3:} 源='出发 !'};
\node [anchor=north west] (example3part2) at ([yshift=0.5em]example3.south west) {\hspace{1em} ='Let's go!'};
\node [anchor=north west] (example1) at (0,0) {\textbf{1:} 源='他 在 哪 ?'};
\node [anchor=north west] (example1part2) at ([yshift=0.5em]example1.south west) {\hspace{1em} ='Where is he ?'};
\node [anchor=north west] (example2) at ([yshift=0.1em]example1part2.south west) {\textbf{2:} 源='我 真高兴'};
\node [anchor=north west] (example2part2) at ([yshift=0.5em]example2.south west) {\hspace{1em} ='I'm so happy'};
\node [anchor=north west] (example3) at ([yshift=0.1em]example2part2.south west) {\textbf{3:} 源='出发 !'};
\node [anchor=north west] (example3part2) at ([yshift=0.5em]example3.south west) {\hspace{1em} ='Let's go!'};
\node [anchor=north west] (example4) at ([yshift=0.1em]example3part2.south west) {\hspace{1em} ...};
\node [anchor=south west] (bidatalabel) at (example1.north west) {{\color{ublue} 资源1:双语平行语料}};
\node [anchor=south west] (bidatalabel) at (example1.north west) {{\color{ublue} 资源1:双语平行语料}};
}
\begin{pgfonlayer}{background}
......@@ -965,7 +965,7 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\node [anchor=north west] (entry2) at ([yshift=0.1em]entry1.south west) {\textbf{2:} Are you fulfilled ?};
\node [anchor=north west] (entry3) at ([yshift=0.1em]entry2.south west) {\textbf{3:} Yes, you are right .};
\node [anchor=north west] (entry4) at ([yshift=0.1em]entry3.south west) {\hspace{1em} ...};
\node [anchor=south west] (monodatalabel) at (entry1.north west) {{\color{ublue} 资源2:单语语料}};
\node [anchor=south west] (monodatalabel) at (entry1.north west) {{\color{ublue} 资源2:单语语料}};
}
\begin{pgfonlayer}{background}
......@@ -980,15 +980,15 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\visible<3->{
\begin{scope}[xshift=1.7in]
{\scriptsize
\node [anchor=north west] (phrase1) at (0,0) {$\textrm{Pr}(\textrm{} \to \textrm{I}) = 0.7$};
\node [anchor=north west] (phrase2) at ([yshift=0.1em]phrase1.south west) {$\textrm{Pr}(\textrm{} \to \textrm{me}) = 0.3$};
\node [anchor=north west] (phrase3) at ([yshift=0.1em]phrase2.south west) {$\textrm{Pr}(\textrm{} \to \textrm{you}) = 0.9$};
\node [anchor=north west] (phrase4) at ([yshift=0.1em]phrase3.south west) {$\textrm{Pr}(\textrm{开心} \to \textrm{happy})$};
\node [anchor=north west] (phrase1) at (0,0) {$\textrm{Pr}(\textrm{} \to \textrm{I}) = 0.7$};
\node [anchor=north west] (phrase2) at ([yshift=0.1em]phrase1.south west) {$\textrm{Pr}(\textrm{} \to \textrm{me}) = 0.3$};
\node [anchor=north west] (phrase3) at ([yshift=0.1em]phrase2.south west) {$\textrm{Pr}(\textrm{} \to \textrm{you}) = 0.9$};
\node [anchor=north west] (phrase4) at ([yshift=0.1em]phrase3.south west) {$\textrm{Pr}(\textrm{开心} \to \textrm{happy})$};
\node [anchor=north west] (phrase4part2) at ([yshift=0.5em]phrase4.south west) {$ = 0.5$};
\node [anchor=north west] (phrase5) at ([yshift=0.1em]phrase4part2.south west) {$\textrm{Pr}(\textrm{满意} \to \textrm{satisfied})$};
\node [anchor=north west] (phrase5) at ([yshift=0.1em]phrase4part2.south west) {$\textrm{Pr}(\textrm{满意} \to \textrm{satisfied})$};
\node [anchor=north west] (phrase5part2) at ([yshift=0.5em]phrase5.south west) {$ = 0.4$};
\node [anchor=north west] (phrase6) at ([yshift=0.0em]phrase5part2.south west) {...\vspace{2em}};
\node [anchor=south west] (phrasetablelabel) at (phrase1.north west) {{\color{ublue} \small{翻译模型}}};
\node [anchor=south west] (phrasetablelabel) at (phrase1.north west) {{\color{ublue} \small{翻译模型}}};
}
\begin{pgfonlayer}{background}
......@@ -1007,7 +1007,7 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
\node [anchor=north west] (ngram2) at ([yshift=0.0em]ngram1.south west) {$\textrm{Pr}(\textrm{I} \to \textrm{am}) = 0.623$};
\node [anchor=north west] (ngram3) at ([yshift=0.0em]ngram2.south west) {$\textrm{Pr}(\textrm{I} \to \textrm{was}) = 0.21$};
\node [anchor=north west] (ngram4) at ([yshift=-0.2em]ngram3.south west) {...};
\node [anchor=south west] (lmlabel) at (ngram1.north west) {{\color{ublue} \small{语言模型}}};
\node [anchor=south west] (lmlabel) at (ngram1.north west) {{\color{ublue} \small{语言模型}}};
}
\begin{pgfonlayer}{background}
......@@ -1020,24 +1020,24 @@ At that time, \only<2-3>{the wealth by a boat}\only<4->{\alert{\underline{the we
}
\visible<3->{
\draw[->,thick,ublue] (bidata.east)--([xshift=1.7em]bidata.east) node[pos=0.5,above] (simexample) {\alert{\scriptsize{\textbf{学习}}}};
\draw[->,thick,ublue] (bidata.east)--([xshift=1.7em]bidata.east) node[pos=0.5,above] (simexample) {\alert{\scriptsize{\textbf{学习}}}};
}
\visible<5->{
\draw[->,thick,ublue] (monodata.east)--([xshift=1.7em]monodata.east) node[pos=0.5,above] (simexample) {\alert{\scriptsize{\textbf{学习}}}};
\draw[->,thick,ublue] (monodata.east)--([xshift=1.7em]monodata.east) node[pos=0.5,above] (simexample) {\alert{\scriptsize{\textbf{学习}}}};
}
\begin{scope}[xshift=3.6in]
{\footnotesize
\visible<7->{
\node[anchor=center] (srcsentence) at (0,0) {我 对 你 感到 满意};
\node[anchor=center] (srcsentence) at (0,0) {我 对 你 感到 满意};
}
\visible<8->{
\node[anchor=north west] (translations) at ([xshift=-1em,yshift=-1em]srcsentence.south west) {
{\scriptsize
\begin{tabular}{l | l}
翻译假设 & \visible<9->{概率} \\
翻译假设 & \visible<9->{概率} \\
\hline
I to you happy & \visible<9->{0.01}\\
You satisfied & \visible<9->{0.02}\\
......@@ -1052,23 +1052,23 @@ You and me & \visible<9->{0.02}\\
}
\visible<6->{
\node[anchor=west,double,draw=ublue,thick] (decoder) at ([xshift=1em,yshift=-12em]srcsentence.south west) {翻译引擎};
\node[anchor=west,double,draw=ublue,thick] (decoder) at ([xshift=1em,yshift=-12em]srcsentence.south west) {翻译引擎};
\draw[->,thick,ublue] ([yshift=1em]phrasetable.south east) .. controls +(east:1.0em) and +(west:2.5em) .. (decoder.west);
\draw[->,thick,ublue] ([yshift=-2em]langaugemodel.east) .. controls +(east:1.0em) and +(west:1.5em) .. (decoder.west);
}
\visible<8->{
\draw[->,thick,double,ublue] (decoder.north) -- ([yshift=2em]decoder.north) node[pos=0.5,right] (decodinglabel) {\alert{\tiny{\textbf{枚举所有可能}}}};
\draw[->,thick,double,ublue] (decoder.north) -- ([yshift=2em]decoder.north) node[pos=0.5,right] (decodinglabel) {\alert{\tiny{\textbf{枚举所有可能}}}};
}
\visible<9->{
\draw[->,thick,double,ublue] (decoder.east) .. controls +(east:3.5em) .. ([xshift=3.5em,yshift=2.8em]decoder.east) node[pos=0.3,below] (decodinglabel) {\alert{\tiny{\textbf{计算翻译可能性}}}};
\draw[->,thick,double,ublue] (decoder.east) .. controls +(east:3.5em) .. ([xshift=3.5em,yshift=2.8em]decoder.east) node[pos=0.3,below] (decodinglabel) {\alert{\tiny{\textbf{计算翻译可能性}}}};
}
\visible<10->{
\node[anchor=west,draw,thick,red,minimum width=11em,minimum height=1em] (outputlabel) at ([xshift=-0.5em,yshift=-5.5em]srcsentence.south west){};
\node[anchor=west] (outputlabel2) at ([xshift=-0.3em]outputlabel.east) {\alert{\tiny{\textbf{输出}}}};
\node[anchor=west] (outputlabel2) at ([xshift=-0.3em]outputlabel.east) {\alert{\tiny{\textbf{输出}}}};
}
}
......@@ -1079,19 +1079,19 @@ You and me & \visible<9->{0.02}\\
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{神经机器翻译}
\subsection{神经机器翻译}
%%%------------------------------------------------------------------------------------------------------------
%%% 神经机器翻译
\begin{frame}{如何进行机器翻译? - 基于神经网络的方法}
\alert{神经机器翻译}:把字符串表示成实数向量,翻译被看做序列到序列转化。这个过程由\alert{编码器-解码器}网络计算,不需要依赖人工先验或者语言学规则 \\
%%% 神经机器翻译
\begin{frame}{如何进行机器翻译? - 基于神经网络的方法}
\alert{神经机器翻译}:把字符串表示成实数向量,翻译被看做序列到序列转化。这个过程由\alert{编码器-解码器}网络计算,不需要依赖人工先验或者语言学规则 \\
\vspace{0.5em}
\begin{tikzpicture}
\begin{scope}
\small{
\node [anchor=south west,minimum width=15em] (source) at (0,0) {\textbf{source}: \ \ \ \ \ \ \ \ \ \ \ \ 感到\ \ \ \ 满意};
\node [anchor=south west,minimum width=15em] (source) at (0,0) {\textbf{source}: \ \ \ \ \ \ \ \ \ \ \ \ 感到\ \ \ \ 满意};
\visible<3->{
\node [anchor=south west,minimum width=15em] (target) at ([yshift=12em]source.north west) {\textbf{target}: I\ \ am\ \ \ satisfied\ \ \ with\ \ \ you};
}
......@@ -1192,27 +1192,27 @@ You and me & \visible<9->{0.02}\\
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{对比}
\subsection{对比}
%%%------------------------------------------------------------------------------------------------------------
%%% 不同方法的简单对比
\begin{frame}{对比}
%%% 不同方法的简单对比
\begin{frame}{对比}
不同机器翻译方法
不同机器翻译方法
\vspace{-1em}
\begin{center}
\begin{tabular}{l | l l l l}
& \parbox{3.8em}{\textbf{规则}} & \parbox{3.8em}{\textbf{实例}} & \parbox{3.8em}{\textbf{统计}} & \parbox{3.8em}{\textbf{神经}} \\
& \parbox{3.8em}{\textbf{规则}} & \parbox{3.8em}{\textbf{实例}} & \parbox{3.8em}{\textbf{统计}} & \parbox{3.8em}{\textbf{神经}} \\
\hline
人工写规则 &&&&\\
人工代价 && 一般 & 几乎无 & 几乎无 \pause \\
数据驱动 &&&&\\
依赖数据质量 & N/A &&& 较低\\
抗噪声能力 &&&& 较高 \pause \\
使用范围 & 受限 & 受限 & 通用 & 通用 \\
翻译质量 & 较高(受限) & 较高(受限) && 很高 \\
人工写规则 &&&&\\
人工代价 && 一般 & 几乎无 & 几乎无 \pause \\
数据驱动 &&&&\\
依赖数据质量 & N/A &&& 较低\\
抗噪声能力 &&&& 较高 \pause \\
使用范围 & 受限 & 受限 & 通用 & 通用 \\
翻译质量 & 较高(受限) & 较高(受限) && 很高 \\
\end{tabular}
\end{center}
......@@ -1220,39 +1220,39 @@ You and me & \visible<9->{0.02}\\
\visible<4->{
\begin{itemize}
\item 基于规则和实例的机器翻译是\alert{傻子}:依赖一定人工,规则和模板能够匹配的情况下翻译质量高,但是系统泛化能力有限
\item 统计和神经机器翻译是\alert{疯子}:只依赖数据,不依赖人工,系统健壮性强,但是精度不稳定且翻译过程难以人工干预
\item 基于规则和实例的机器翻译是\alert{傻子}:依赖一定人工,规则和模板能够匹配的情况下翻译质量高,但是系统泛化能力有限
\item 统计和神经机器翻译是\alert{疯子}:只依赖数据,不依赖人工,系统健壮性强,但是精度不稳定且翻译过程难以人工干预
\end{itemize}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\section{机器翻译课程学习}
\section{机器翻译课程学习}
%%%------------------------------------------------------------------------------------------------------------
\subsection{动机}
\subsection{动机}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译
\begin{frame}{学习机器翻译 - 理由}
%%% 学习机器翻译
\begin{frame}{学习机器翻译 - 理由}
\begin{spacing}{1.2}
\begin{itemize}
\item 为啥要学习机器翻译(MT)?
\item 为啥要学习机器翻译(MT)?
\begin{itemize}
\item 当今自然语言处理乃至人工智能领域的热点
\item 应用机器学习框架,数据驱动,不需人工
\item 技术受到广泛关注,已经商用,如Google翻译、Baidu翻译
\item 当今自然语言处理乃至人工智能领域的热点
\item 应用机器学习框架,数据驱动,不需人工
\item 技术受到广泛关注,已经商用,如Google翻译、Baidu翻译
\end{itemize}
\item<2-> 如果上面的理由还不够充分,我们可以换个说法
\item<2-> 如果上面的理由还不够充分,我们可以换个说法
\begin{itemize}
\item<3-> MT是很cool的technology - 什么big data、什么deep learning都可以往上扯
\item<4-> MT能帮你找个好job - 看看最近互联网公司的招聘广告?
\item<4-> MT是你paper work的很好的题目 - 看看ACL的论文
\item<4-> MT是你拿project非常好的选题 - 看看做SMT的老师
\item<5-> MT能帮你找个girlfriend - 这个还得靠自己
\item<3-> MT是很cool的technology - 什么big data、什么deep learning都可以往上扯
\item<4-> MT能帮你找个好job - 看看最近互联网公司的招聘广告?
\item<4-> MT是你paper work的很好的题目 - 看看ACL的论文
\item<4-> MT是你拿project非常好的选题 - 看看做SMT的老师
\item<5-> MT能帮你找个girlfriend - 这个还得靠自己
\end{itemize}
\end{itemize}
......@@ -1260,7 +1260,7 @@ You and me & \visible<9->{0.02}\\
\visible<6->{
\begin{tikzpicture}
\node [draw,thick,red] (note) at (0,0) {\alert{\textbf{总之,机器翻译可以帮助你成家立业、改变世界!}}};
\node [draw,thick,red] (note) at (0,0) {\alert{\textbf{总之,机器翻译可以帮助你成家立业、改变世界!}}};
\end{tikzpicture}
}
\end{spacing}
......@@ -1268,22 +1268,22 @@ You and me & \visible<9->{0.02}\\
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection{课程学习}
\subsection{课程学习}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译 - 推荐书籍
\begin{frame}{学习机器翻译 - 参考资料}
%%% 学习机器翻译 - 推荐书籍
\begin{frame}{学习机器翻译 - 参考资料}
\vspace{0.5em}
\begin{minipage}[b]{0.70\textwidth}
\begin{itemize}
\item 推荐教材《Statistical Machine Translation》
\item 推荐教材《Statistical Machine Translation》
\begin{itemize}
\item 经典之作,内容全面
\item 作者是SMT大牛Philipp Koehn
\item 被很多欧美高校和机器翻译研究者使用
\item 建议阅读英文版本,不过也有中文版本
\item 经典之作,内容全面
\item 作者是SMT大牛Philipp Koehn
\item 被很多欧美高校和机器翻译研究者使用
\item 建议阅读英文版本,不过也有中文版本
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -1295,24 +1295,24 @@ You and me & \visible<9->{0.02}\\
\visible<2->{
\begin{itemize}
\item 一个介绍机器翻译研究的网站\\
\item 一个介绍机器翻译研究的网站\\
\url{http://www.statmt.org/}
\item 关于机器翻译和自然语言处理的论文\\
\item 关于机器翻译和自然语言处理的论文\\
\url{http://www.mt-archive.info/}\\
\url{http://anthology.aclweb.org/}\\
\item 关注一些会议,如ACL、NAACL、EMNLP、COLING、WMT、AMTA
\item Google搜索一下machine translation course
\item 关注一些会议,如ACL、NAACL、EMNLP、COLING、WMT、AMTA
\item Google搜索一下machine translation course
\end{itemize}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译 - 系统
\begin{frame}{学习机器翻译 - 开源机器翻译系统}
%%% 学习机器翻译 - 系统
\begin{frame}{学习机器翻译 - 开源机器翻译系统}
机器翻译的发展可以归功于两个重要方面:\\
\alert{\textbf{开源系统 + 评测}}
机器翻译的发展可以归功于两个重要方面:\\
\alert{\textbf{开源系统 + 评测}}
\vspace{0.5em}
......@@ -1322,9 +1322,9 @@ You and me & \visible<9->{0.02}\\
\item \textbf{Moses}\\
\url{http://www.statmt.org/moses/}
\begin{itemize}
\item 做MT的人都知道
\item Philipp Koehn所带领团队开发
\item 历史较长、性能优良、功能最全面
\item 做MT的人都知道
\item Philipp Koehn所带领团队开发
\item 历史较长、性能优良、功能最全面
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -1341,9 +1341,9 @@ You and me & \visible<9->{0.02}\\
\item \textbf{NiuTrans}\\
\url{http://www.nlplab.com/NiuPlan/NiuTrans.html}
\begin{itemize}
\item 东北大学自然语言处理实验室开发
\item 模型完整、性能不差、使用简单
\item 良好的中文技术支持
\item 东北大学自然语言处理实验室开发
\item 模型完整、性能不差、使用简单
\item 良好的中文技术支持
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -1359,24 +1359,24 @@ You and me & \visible<9->{0.02}\\
\visible<4->{
\begin{itemize}
\item 其它一些非常优秀的开源SMT系统: Silkroad、Joshua、cdec、Phrasal、HiFST、Jane等
\item 其它一些非常优秀的开源SMT系统: Silkroad、Joshua、cdec、Phrasal、HiFST、Jane等
\end{itemize}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译 - 系统
\begin{frame}{学习机器翻译 - 开源机器翻译系统(2)}
%%% 学习机器翻译 - 系统
\begin{frame}{学习机器翻译 - 开源机器翻译系统(2)}
\begin{minipage}[t]{0.70\textwidth}
\begin{itemize}
\item \textbf{Tensor2Tensor}\\
\url{https://github.com/tensorflow/tensor2tensor}
\begin{itemize}
\item 最新的基于深度学习的系统
\item 支持Transformer等模型
\item 使用Tensorflow,功能强大
\item 最新的基于深度学习的系统
\item 支持Transformer等模型
\item 使用Tensorflow,功能强大
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -1393,8 +1393,8 @@ You and me & \visible<9->{0.02}\\
\item \textbf{Fairseq}\\
\url{https://github.com/facebookresearch/fairseq}
\begin{itemize}
\item Facebook出品,代码易读
\item 基于Pytorch,简单易用
\item Facebook出品,代码易读
\item 基于Pytorch,简单易用
\end{itemize}
\end{itemize}
\end{minipage}
......@@ -1408,32 +1408,32 @@ You and me & \visible<9->{0.02}\\
\visible<2->{
\begin{itemize}
\item \alert{开源机器翻译系统列表} \url{https://github.com/NiuTrans/MT-paper-lists}
\item \alert{开源机器翻译系统列表} \url{https://github.com/NiuTrans/MT-paper-lists}
\end{itemize}
}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译 - 数据
\begin{frame}{学习机器翻译 - 评测及实验数据}
%%% 学习机器翻译 - 数据
\begin{frame}{学习机器翻译 - 评测及实验数据}
\begin{itemize}
\item 现在研究使用的绝大多数数据都可以从\textbf{LDC}(Linguistic Data Consortium)上找到\\
\item 现在研究使用的绝大多数数据都可以从\textbf{LDC}(Linguistic Data Consortium)上找到\\
\url{https://www.ldc.upenn.edu/}
\item<2-> 很多权威机构也组织各种机器翻译评测(比赛),可以作为研究的benchmark
\item<2-> 很多权威机构也组织各种机器翻译评测(比赛),可以作为研究的benchmark
\begin{itemize}
\item \textbf{NIST评测}:历史悠久,影响力巨大,翻译任务多,难度大,数据使用最广泛\\
\item \textbf{NIST评测}:历史悠久,影响力巨大,翻译任务多,难度大,数据使用最广泛\\
\url{http://www.itl.nist.gov/iad/mig/tests/mt/}
\item \textbf{CWMT评测}:国内评测,发展迅速,翻译语言对丰富\\
\item \textbf{CWMT评测}:国内评测,发展迅速,翻译语言对丰富\\
\url{http://nlp.ict.ac.cn/eval.php}
\item \textbf{WMT评测}:欧洲语系翻译,数据可以免费下载
\item \textbf{WMT评测}:欧洲语系翻译,数据可以免费下载
\url{http://www.statmt.org/wmt14/}
\item \textbf{IWSLT评测}:口语翻译评测
\item \textbf{IWSLT评测}:口语翻译评测
\url{http://workshop2013.iwslt.org/}
\item \textbf{NTCIR PatentMT}:专利翻译评测
\item \textbf{NTCIR PatentMT}:专利翻译评测
\url{http://ntcir.nii.ac.jp/PatentMT-2/}
\end{itemize}
......@@ -1442,29 +1442,29 @@ You and me & \visible<9->{0.02}\\
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 学习机器翻译 - 数据
\begin{frame}{关于课程}
%%% 学习机器翻译 - 数据
\begin{frame}{关于课程}
关于课程有几点需要注意:
关于课程有几点需要注意:
\begin{itemize}
\item 机器翻译的学习需要一些程序开发基础,任意的编程语言都可以
\item 机器翻译的学习需要一些程序开发基础,任意的编程语言都可以
\begin{itemize}
\item C/C++,Python,Perl等
\item 没有编程基础咋办?不耽误课程学习,但是练习无法进行
\item C/C++,Python,Perl等
\item 没有编程基础咋办?不耽误课程学习,但是练习无法进行
\end{itemize}
\item 语言学知识、数学知识多多益善,但不是必须
\item<2-> 这门课程比较适合计算机相关专业的本科及研究生学习
\item 语言学知识、数学知识多多益善,但不是必须
\item<2-> 这门课程比较适合计算机相关专业的本科及研究生学习
\begin{itemize}
\item 国内很多高校和研究机构都开展机器翻译的研究
\item 已经有很多相关的课程(如《自然语言处理》)
\item 课件可以参考
\item 国内很多高校和研究机构都开展机器翻译的研究
\item 已经有很多相关的课程(如《自然语言处理》)
\item 课件可以参考
\end{itemize}
\item<3-> \textbf{\alert{最后,也是最重要的 - \\
课程的所有练习都以NiuTrans为基础!!!!}}
\item<3-> \textbf{\alert{最后,也是最重要的 - \\
课程的所有练习都以NiuTrans为基础!!!!}}
\begin{itemize}
\item 完全自主开发,开源系统,便于学习代码
\item NiuTrans团队维护,交流方便
\item 完全自主开发,开源系统,便于学习代码
\item NiuTrans团队维护,交流方便
\end{itemize}
\end{itemize}
......@@ -1472,13 +1472,13 @@ You and me & \visible<9->{0.02}\\
%%%------------------------------------------------------------------------------------------------------------
%%% Oh, yeh!
\begin{frame}{第一节内容就这么结束了!}
\begin{frame}{第一节内容就这么结束了!}
\vspace{5em}
{\LARGE
\begin{center}
{\color{ublue} \textbf{谢谢! $\Leftrightarrow$ Thank You!}}
{\color{ublue} \textbf{谢谢! $\Leftrightarrow$ Thank You!}}
\end{center}
}
......
Markdown 格式
0%
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论