Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
f504468e
Commit
f504468e
authored
Apr 09, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
updates
parent
dfc7b3c5
全部展开
显示空白字符变更
内嵌
并排
正在显示
3 个修改的文件
包含
4 行增加
和
4 行删除
+4
-4
Book/Chapter1/chapter1.tex
+3
-3
Book/mt-book-xelatex.ptc
+0
-0
Book/mt-book-xelatex.tex
+1
-1
没有找到文件。
Book/Chapter1/chapter1.tex
查看文件 @
f504468e
...
...
@@ -13,19 +13,19 @@
\chapter
{
机器翻译简介
}
\section
{
机器翻译的概念
}
\index
{
Chapter1.1
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\parinterval
广义上来讲,``翻译''是指把一个事物转化为另一个事物的过程。这个概念多使用在对
可序列化符号串的转化上,比如计算机程序的编译、文字翻译和蛋白质生物合成等。在程序编译中,高级语言编写的程序经过一系列的处理后转化为可执行目标程序,这是一种从高级程序语言到低级程序语言的``翻译''。在人类语言的翻译中,一种语言的文字通过某种方式转化为另一种语言表达,这是一种自然语言的``翻译''。在蛋白质生成合成的第一步,RNA分子序列转化到特定
氨基酸序列,这是一种生物学遗传信息的``翻译''。甚至说,给上联对出下联、给一幅图片写出图片的主题等都可以被看作是``翻译''的过程。
\parinterval
广义上来讲,``翻译''是指把一个事物转化为另一个事物的过程。这个概念多使用在对
符号串的转化上,比如计算机程序的编译、文字翻译、蛋白质生物合成等。在程序编译中,高级语言编写的程序经过一系列的处理后转化为可执行的目标程序,这是一种从高级程序语言到低级程序语言的``翻译''。在人类语言的翻译中,一种语言文字通过某种方式转化为另一种语言表达,这是一种自然语言的``翻译''。在蛋白质生成合成的第一步,RNA分子序列转化为特定的
氨基酸序列,这是一种生物学遗传信息的``翻译''。甚至说,给上联对出下联、给一幅图片写出图片的主题等都可以被看作是``翻译''的过程。
\vspace
{
0.5em
}
%----------------------------------------------
% 图1.1
\begin{figure}
[htp]
\centering
\includegraphics
[scale=0.4]
{
./Chapter1/Figures/figure-zh
_
en-example.png
}
\caption
{
在机器翻译中,中文被翻译为英语的例子
}
\caption
{
通过计算机将中文翻译为英文
}
\label
{
fig:zh
_
en-example
}
\end{figure}
%-------------------------------------------
\parinterval
当然,这里我们更加关注人类语言之间的翻译问题,即自然语言的翻译。如图
\ref
{
fig:zh
_
en-example
}
所示,通过计算机可以将一段中文文字自动转化为英文文字,其中中文被称为源语言,英文被称为目标语言,系统的输入是一个源语言(即中文)的文字序列,系统的输出是一个目标语言(即英文)的文字序列
。
\parinterval
这里我们更加关注人类语言之间的翻译问题,即自然语言的翻译。如图
\ref
{
fig:zh
_
en-example
}
所示,通过计算机可以将一段中文文字自动转化为英文文字,其中中文被称为
{
\small\sffamily\bfseries
{
源语言
}}
(Source Language),英文被称为
{
\small\sffamily\bfseries
{
目标语言
}}
(Target Language)
。
\parinterval
一直以来,自然语言文字的翻译往往是由人工完成。让计算机像人一样进行翻译似乎还是电影中的桥段,因为很难想象人类语言的多样性和复杂性可以用计算机语言进行描述。但是时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计算机进行自动翻译也不再是一种想象,它已经深入到人们生活的很多方面,并发挥着重要作用。而这种由计算机进行自动翻译的过程也被称作机器翻译,类似的,自动翻译、智能翻译、多语言自动转换等概念也是指同样的事情。如果将今天的机器翻译和人工翻译进行对比,可以发现机器翻译系统所生成的译文还并不完美,有时翻译质量甚至非常差,但是其优点在于速度快并且成本低,更为重要的是机器翻译系统可以从大量数据中不断学习和进化,随着学习其翻译质量不断得到提升。人工翻译尽管翻译的精度很高,但是费时费力。当需要翻译大量的文本且精度要求不那么高时,比如海量数据的浏览型任务,机器翻译的优势就体现了出来。对于人工作业无法完成的事情,使用机器翻译可能只需花几个小时甚至几分钟就能完成。这就类似于拿着锄头耕地种庄稼和使用现代化机器作业。
...
...
Book/mt-book-xelatex.ptc
查看文件 @
f504468e
差异被折叠。
点击展开。
Book/mt-book-xelatex.tex
查看文件 @
f504468e
...
...
@@ -58,7 +58,7 @@
\node
[inner sep=0pt]
(background) at (current page.center)
{
\includegraphics
[width=\paperwidth]
{
background.pdf
}}
;
\draw
(current page.center) node [fill=ocre!30!white,fill opacity=0.6,text opacity=1,inner sep=1cm]
{
\Huge\centering\bfseries\sffamily\parbox
[c][][t]
{
\paperwidth
}{
\centering
机器翻译:统计建模与深度学习方法
\\
[15pt]
% Book title
%{\Large 副标题是否需要}\\[20pt] % Subtitle
{
\
huge
肖桐
\ \
朱靖波
}}}
;
% Author name
{
\
LARGE
肖桐
\ \
朱靖波
}}}
;
% Author name
\end{tikzpicture}
\vfill
\endgroup
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论