Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
3a1431cd
Commit
3a1431cd
authored
Aug 27, 2020
by
单韦乔
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
删除重复bib
parent
23144b61
全部展开
显示空白字符变更
内嵌
并排
正在显示
3 个修改的文件
包含
3 行增加
和
47 行删除
+3
-47
Chapter1/chapter1.tex
+3
-3
Chapter2/chapter2.tex
+0
-0
bibliography.bib
+0
-44
没有找到文件。
Chapter1/chapter1.tex
查看文件 @
3a1431cd
...
...
@@ -101,7 +101,7 @@
\parinterval
在此之后,更多的翻译工作在文化和知识传播中开展。其中一个典型代表是宗教文献的翻译。宗教是人类意识形态的一个重要载体,为了宣传教义,人们编写了大量的宗教文献。在西方,一项最早被记录的翻译活动是将旧约圣经(希伯来文及埃兰文)翻译为希腊文版本。迄今为止人类历史上翻译版本最多的书就是圣经。在中国唐代,有一位世界性的文化人物
\ \dash
\
玄奘,他不仅是佛学家、旅行家,还是翻译家。玄奘西行求法归来后把全部的心血和智慧奉献给了译经事业,在助手们的帮助下,共翻译佛教经论74部,1335卷,每卷万字左右,合计1335万字,占去整个唐代译经总数的一半以上
\upcite
{
慧立彦宗1983大慈恩寺三藏法师传
}
,树立了我国古代翻译思想的光辉典范。
\parinterval
翻译在人类历史长河中起到了重要的作用。一方面,由于语言文字、文化和地理位置的差异性,使得翻译成为一个重要的需求;另一方面,翻译也加速了不同文明的融会贯通,促进了世界的发展。今天,翻译已经成为重要的行业之一,包括各个高校也都设立了翻译及相关专业,相关人才不断涌现。据《2019年中国语言服务行业发展报告》
\upcite
{
2019cns
}
统计:全球语言服务产值预计将首次接近500亿美元;中国涉及语言服务的在营企业360,000余家,语言服务为主营业务的在营企业近万家,总产值超过300亿元,年增长3
\%
以上;全国开设外语类专业的高校数量多达上千所,其中设立有翻译硕士(MTI)和翻译本科(BTI)专业的院校分别有250余所和280余所,其中仅MTI
得
累计招生数就高达6万余人
\upcite
{
赵军峰2019深化改革
}
。当然,面对着巨大的需求,如何使用机器辅助翻译等技术手段提高人工翻译效率,也是人工翻译和机器翻译领域需要共同探索的方向。
\parinterval
翻译在人类历史长河中起到了重要的作用。一方面,由于语言文字、文化和地理位置的差异性,使得翻译成为一个重要的需求;另一方面,翻译也加速了不同文明的融会贯通,促进了世界的发展。今天,翻译已经成为重要的行业之一,包括各个高校也都设立了翻译及相关专业,相关人才不断涌现。据《2019年中国语言服务行业发展报告》
\upcite
{
2019cns
}
统计:全球语言服务产值预计将首次接近500亿美元;中国涉及语言服务的在营企业360,000余家,语言服务为主营业务的在营企业近万家,总产值超过300亿元,年增长3
\%
以上;全国开设外语类专业的高校数量多达上千所,其中设立有翻译硕士(MTI)和翻译本科(BTI)专业的院校分别有250余所和280余所,其中仅MTI
的
累计招生数就高达6万余人
\upcite
{
赵军峰2019深化改革
}
。当然,面对着巨大的需求,如何使用机器辅助翻译等技术手段提高人工翻译效率,也是人工翻译和机器翻译领域需要共同探索的方向。
%----------------------------------------------------------------------------------------
% NEW SUB-SECTION
...
...
@@ -161,7 +161,7 @@
\parinterval
事物的发展都是螺旋式上升的,机器翻译也是一样。早期基于规则的机器翻译方法需要人来书写规则,虽然对少部分句子具有较高的翻译精度,可是对翻译现象的覆盖度有限,而且对规则或者模板中的噪声非常敏感,系统健壮性差。
\parinterval
上世纪70年代中后期,特别是80年代到90年代初,国家之间往来日益密切,而不同语言之间形成的交流障碍愈发严重,传统的人工作业方式已经远远不能满足需求。与此同时,语料库语言学的发展也为机器翻译提供了新的思路。一方面,随着传统纸质文字资料不断电子化,计算机可读的语料越来越多,这使得人们可以用计算机对语言规律进行统计分析。另一方面,随着可用数据越来越多,用数学模型描述这些数据中的规律并进行推理逐渐成为可能。这也衍生出一类数学建模方法
\ \dash\
{
\small\bfnew
{
数据驱动
}}
\index
{
数据驱动
}
(Data-
Driven)
\index
{
Data-D
riven
}
的方法。同时这类方法也成为了随后出现的统计机器翻译的基础,比如,IBM研究人员提出的基于噪声信道模型的5种统计翻译模型
\upcite
{
brown1990statistical,DBLP:journals/coling/BrownPPM94
}
。
\parinterval
上世纪70年代中后期,特别是80年代到90年代初,国家之间往来日益密切,而不同语言之间形成的交流障碍愈发严重,传统的人工作业方式已经远远不能满足需求。与此同时,语料库语言学的发展也为机器翻译提供了新的思路。一方面,随着传统纸质文字资料不断电子化,计算机可读的语料越来越多,这使得人们可以用计算机对语言规律进行统计分析。另一方面,随着可用数据越来越多,用数学模型描述这些数据中的规律并进行推理逐渐成为可能。这也衍生出一类数学建模方法
\ \dash\
{
\small\bfnew
{
数据驱动
}}
\index
{
数据驱动
}
(Data-
driven)
\index
{
Data-d
riven
}
的方法。同时这类方法也成为了随后出现的统计机器翻译的基础,比如,IBM研究人员提出的基于噪声信道模型的5种统计翻译模型
\upcite
{
brown1990statistical,DBLP:journals/coling/BrownPPM94
}
。
\parinterval
基于数据驱动的方法不依赖于人书写的规则,机器翻译的建模、训练和推断都可以自动地从数据中学习。这使得整个机器翻译的范式发生了翻天覆地的变化,比如,日本学者长尾真提出的基于实例的方法
\upcite
{
nagao1984framework,DBLP:conf/coling/SatoN90
}
和统计机器翻译
\upcite
{
brown1990statistical,DBLP:journals/coling/BrownPPM94
}
就是在此期间兴起的。此外,这样的方法使得机器翻译系统的开发代价大大降低。
...
...
@@ -296,7 +296,7 @@
\subsection
{
转换法
}
\parinterval
通常一个典型的
{
\small\bfnew
{
基于转换规则的机器翻译
}}
\index
{
基于转换规则的机器翻译
}
(Transfer-based Translation)
\index
{
Transfer-based Translation
}
的过程可以被视为“独立分析-独立生成-相关转换”的过程
\upcite
{
jurafsky2000
speech
}
。如图
\ref
{
fig:1-11
}
所示,这些过程可以分成六个步骤,其中每一个步骤都是通过相应的翻译规则来完成。比如,第一个步骤中需要构建源语词法分析规则,第二个步骤中需要构建源语句法分析规则,第三个和第四个步骤中需要构建转换规则,其中包括源语言-目标语言词汇和结构转换规则等等。
\parinterval
通常一个典型的
{
\small\bfnew
{
基于转换规则的机器翻译
}}
\index
{
基于转换规则的机器翻译
}
(Transfer-based Translation)
\index
{
Transfer-based Translation
}
的过程可以被视为“独立分析-独立生成-相关转换”的过程
\upcite
{
parsing2009
speech
}
。如图
\ref
{
fig:1-11
}
所示,这些过程可以分成六个步骤,其中每一个步骤都是通过相应的翻译规则来完成。比如,第一个步骤中需要构建源语词法分析规则,第二个步骤中需要构建源语句法分析规则,第三个和第四个步骤中需要构建转换规则,其中包括源语言-目标语言词汇和结构转换规则等等。
%----------------------------------------------
\begin{figure}
[htp]
...
...
Chapter2/chapter2.tex
查看文件 @
3a1431cd
差异被折叠。
点击展开。
bibliography.bib
查看文件 @
3a1431cd
...
...
@@ -127,16 +127,6 @@
year={2004},
}
@article{jurafsky2000speech,
title={Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition},
author={Daniel {Jurafsky} and James H. {Martin}},
journal={Computational Linguistics},
volume={26},
number={4},
pages={638--641},
year={2000}
}
@article{王宝库1991机器翻译系统中一种规则描述语言,
title={机器翻译系统中一种规则描述语言(CTRDL)},
author={王宝库,张中义,姚天顺},
...
...
@@ -423,16 +413,6 @@
organization={IEEE Computer Society}
}
@article{ney1994on,
title={On structuring probabilistic dependences in stochastic language modelling},
author={Hermann {Ney} and Ute {Essen} and Reinhard {Kneser}},
journal={Computer Speech \& Language},
volume={8},
number={1},
pages={1--38},
year={1994}
}
@inproceedings{stolcke2002srilm,
author = {Andreas Stolcke},
//editor = {John H. L. Hansen and
...
...
@@ -444,20 +424,6 @@
year = {2002}
}
@inproceedings{heafield-2011-kenlm,
author = {Kenneth Heafield},
//editor = {Chris Callison{-}Burch and
Philipp Koehn and
Christof Monz and
Omar Zaidan},
title = {KenLM: Faster and Smaller Language Model Queries},
booktitle = {Proceedings of the Sixth Workshop on Statistical Machine Translation,
WMT@EMNLP 2011, Edinburgh, Scotland, UK, July 30-31, 2011},
pages = {187--197},
publisher = {Association for Computational Linguistics},
year = {2011}
}
@article{chen1999empirical,
author = {Stanley F. Chen and
Joshua Goodman},
...
...
@@ -657,16 +623,6 @@
year={2001}
}
@article{chen1999an,
title={An empirical study of smoothing techniques for language modeling},
author={Stanley F. {Chen} and Joshua {Goodman}},
journal={Computer Speech \& Language},
volume={13},
number={4},
pages={359--394},
year={1999}
}
@inproceedings{kirchhoff2005improved,
title={Improved Language Modeling for Statistical Machine Translation},
author={Katrin {Kirchhoff} and Mei {Yang}},
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论