Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
0b640bc4
Commit
0b640bc4
authored
Jan 14, 2021
by
单韦乔
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
15章文字以及1、2章格式
parent
0485fffa
全部展开
隐藏空白字符变更
内嵌
并排
正在显示
6 个修改的文件
包含
35 行增加
和
32 行删除
+35
-32
Chapter1/chapter1.tex
+10
-10
Chapter15/Figures/figure-introducing-rnn-mechanism-into-transformer.jpg
+0
-0
Chapter15/Figures/figure-relative-position-coding-and-absolute-position-coding.jpg
+0
-0
Chapter15/Figures/figure-relative-position-weight.tex
+2
-2
Chapter15/Figures/figure-weight-visualization-of-convergence-DLCL-network.tex
+23
-20
Chapter15/chapter15.tex
+0
-0
没有找到文件。
Chapter1/chapter1.tex
查看文件 @
0b640bc4
...
...
@@ -54,14 +54,6 @@
\parinterval
从机器翻译系统的组成上来看,通常可以抽象为两个部分,如图
\ref
{
fig:1-2
}
所示:
\begin{itemize}
\vspace
{
0.5em
}
\item
{
\small\bfnew
{
资源
}}
:如果把机器翻译系统比作一辆汽车,资源就好比是可以使汽车运行的“汽油”,它包括很多内容,如翻译规则、双(单)语数据、知识库等翻译知识,且这些“知识”都是计算机可读的。值得一提的是,如果没有翻译资源的支持,任何机器翻译系统都无法运行起来。
\vspace
{
0.5em
}
\item
{
\small\bfnew
{
系统
}}
:机器翻译算法的程序实现被称作系统,也就是机器翻译研究人员开发的软件。无论是翻译规则、翻译模板还是统计模型中的参数都需要通过机器翻译系统进行读取和使用。
\vspace
{
0.5em
}
\end{itemize}
%----------------------------------------------
\begin{figure}
[htp]
\centering
...
...
@@ -71,6 +63,14 @@
\end{figure}
%-------------------------------------------
\begin{itemize}
\vspace
{
0.5em
}
\item
{
\small\bfnew
{
资源
}}
:如果把机器翻译系统比作一辆汽车,资源就好比是可以使汽车运行的“汽油”,它包括很多内容,如翻译规则、双(单)语数据、知识库等翻译知识,且这些“知识”都是计算机可读的。值得一提的是,如果没有翻译资源的支持,任何机器翻译系统都无法运行起来。
\vspace
{
0.5em
}
\item
{
\small\bfnew
{
系统
}}
:机器翻译算法的程序实现被称作系统,也就是机器翻译研究人员开发的软件。无论是翻译规则、翻译模板还是统计模型中的参数都需要通过机器翻译系统进行读取和使用。
\vspace
{
0.5em
}
\end{itemize}
\parinterval
构建一个强大的机器翻译系统需要“资源”和“系统”两方面共同作用。在资源方面,随着语料库语言学的发展,已经有大量的高质量的双语和单语数据(称为语料)被整理并且被电子化存储,因此可以说具备了研发机器翻译系统所需要的语料基础。特别是像英语、汉语等世界主流语种,相关语料资源已经非常丰富,这也大大加速了相关研究的进展。当然,对于一些稀缺资源语种或者特殊的领域,语料库中的语料仍然匮乏,但是这些并不影响机器翻译领域整体的发展速度。因此在现有语料库的基础上,很多研究者把精力集中在“系统”研发上。
%----------------------------------------------------------------------------------------
...
...
@@ -269,6 +269,8 @@
\parinterval
图
\ref
{
fig:1-8
}
展示了一个使用转换法进行翻译的实例。这里,利用一个简单的汉译英规则库完成对句子“我对你感到满意”的翻译。当翻译“我”时,从规则库中找到规则1,该规则表示遇到单词“我”就翻译为“I”;类似地,也可以从规则库中找到规则4,该规则表示翻译调序,即将单词“you”放到“be satisfied with”后面。这种通过规则表示单词之间的对应关系也为统计机器翻译方法提供了思路。如统计机器翻译中,基于短语的翻译模型使用短语对对原文进行替换,详细描述可以参考
{
\chapterseven
}
。
\parinterval
在上述例子中可以发现,规则不仅仅可以翻译句子之间单词的对应,如规则1,还可以表示句法甚至语法之间的对应,如规则6。因此基于规则的方法可以分成多个层次,如图
\ref
{
fig:1-9
}
所示。图中不同的层次表示采用不同的知识来书写规则,进而完成机器翻译过程。对于翻译问题,可以构建不同层次的基于规则的机器翻译系统。这里包括四个层次,分别为:词汇转换、句法转换、语义转换和中间语言层。其中,上层可以继承下层的翻译知识,比如说句法转换层会利用词汇转换层知识。早期基于规则的方法属于词汇转换层。
%----------------------------------------------
\begin{figure}
[htp]
\centering
...
...
@@ -279,8 +281,6 @@
\end{figure}
%-------------------------------------------
\parinterval
在上述例子中可以发现,规则不仅仅可以翻译句子之间单词的对应,如规则1,还可以表示句法甚至语法之间的对应,如规则6。因此基于规则的方法可以分成多个层次,如图
\ref
{
fig:1-9
}
所示。图中不同的层次表示采用不同的知识来书写规则,进而完成机器翻译过程。对于翻译问题,可以构建不同层次的基于规则的机器翻译系统。这里包括四个层次,分别为:词汇转换、句法转换、语义转换和中间语言层。其中,上层可以继承下层的翻译知识,比如说句法转换层会利用词汇转换层知识。早期基于规则的方法属于词汇转换层。
%----------------------------------------------------------------------------------------
% NEW SUB-SECTION
%----------------------------------------------------------------------------------------
...
...
Chapter15/Figures/figure-introducing-rnn-mechanism-into-transformer.jpg
0 → 100644
查看文件 @
0b640bc4
38.4 KB
Chapter15/Figures/figure-relative-position-coding-and-absolute-position-coding.jpg
0 → 100644
查看文件 @
0b640bc4
48.4 KB
Chapter15/Figures/figure-relative-position-weight.tex
查看文件 @
0b640bc4
\begin{tikzpicture}
\tikzstyle
{
node1
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=green!80]
\tikzstyle
{
node2
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=green!
4
0]
\tikzstyle
{
node2
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=green!
5
0]
\tikzstyle
{
node3
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=green!20]
\tikzstyle
{
node4
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt]
\tikzstyle
{
node5
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=red!20]
\tikzstyle
{
node6
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=red!
4
0]
\tikzstyle
{
node6
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=red!
5
0]
\tikzstyle
{
node7
}
= [anchor=center,draw,minimum height=2em,minimum width=2em,inner sep=0pt,fill=red!80]
\begin{scope}
[scale=1.0]
...
...
Chapter15/Figures/figure-weight-visualization-of-convergence-DLCL-network.tex
查看文件 @
0b640bc4
\begin{tikzpicture}
[node distance = 0,scale = 1]
\tikzstyle
{
every node
}
=[scale=1]
\node
[draw=white]
(input) at (0,0)
{
\includegraphics
[width=0.62\textwidth]
{
./Chapter15/Figures/DLCL-picture.png
}}
;(1.9,-1.4);
\node
[scale = 2]
at (4.5,3.6)
{
4
}
;
\node
[scale = 2]
at (4.5,1.8)
{
2
}
;
\node
[scale = 2]
at (4.5,0)
{
0
}
;
\node
[scale = 2]
at (4.5,-1.8)
{
-2
}
;
\node
[scale = 2]
at (4.5,-3.6)
{
-4
}
;
\node
[scale = 1.5]
at (-4.5,3.75)
{$
\rm
x
_{
1
}$}
;
\node
[scale = 1.5]
at (-4.5,2.5)
{$
\rm
x
_{
6
}$}
;
\node
[scale = 1.5]
at (-4.5,1.4)
{$
\rm
x
_{
11
}$}
;
\node
[scale = 1.5]
at (-4.5,0.1)
{$
\rm
x
_{
16
}$}
;
\node
[scale = 1.5]
at (-4.5,-1.1)
{$
\rm
x
_{
21
}$}
;
\node
[scale = 1.5]
at (-4.5,-2.3)
{$
\rm
x
_{
26
}$}
;
\node
[scale = 1.5]
at (-4.5,-3.4)
{$
\rm
x
_{
31
}$}
;
\node
[scale = 1.5]
at (-3.8,-4)
{$
\rm
y
_{
0
}$}
;
\node
[scale = 1.5]
at (-2.7,-4)
{$
\rm
y
_{
5
}$}
;
\node
[scale = 1.5]
at (-1.5,-4)
{$
\rm
y
_{
10
}$}
;
\node
[scale = 1.5]
at (-0.3,-4)
{$
\rm
y
_{
15
}$}
;
\node
[scale = 1.5]
at (0.9,-4)
{$
\rm
y
_{
20
}$}
;
\node
[scale = 1.5]
at (2.1,-4)
{$
\rm
y
_{
25
}$}
;
\node
[scale = 1.5]
at (3.3,-4)
{$
\rm
y
_{
30
}$}
;
\node
[draw=white]
(input) at (0,0)
{
\includegraphics
[width=0.62\textwidth]
{
./Chapter15/Figures/DLCL-picture.png
}}
;
{
\footnotesize
\node
[anchor=center]
at (4.1,3)
{
4
}
;
\node
[anchor=center]
at (4.1,1.5)
{
2
}
;
\node
[anchor=center]
at (4.1,0)
{
0
}
;
\node
[anchor=center]
at (4.1,-1.5)
{
-2
}
;
\node
[anchor=center]
at (4.1,-3)
{
-4
}
;
\node
[anchor=center]
at (-4.2,3.6)
{$
x
_{
1
}$}
;
\node
[anchor=center]
at (-4.2,2.45)
{$
x
_{
6
}$}
;
\node
[anchor=center]
at (-4.2,1.3)
{$
x
_{
11
}$}
;
\node
[anchor=center]
at (-4.2,0.15)
{$
x
_{
16
}$}
;
\node
[anchor=center]
at (-4.2,-1)
{$
x
_{
21
}$}
;
\node
[anchor=center]
at (-4.2,-2.15)
{$
x
_{
26
}$}
;
\node
[anchor=center]
at (-4.2,-3.3)
{$
x
_{
31
}$}
;
\node
[anchor=center]
at (-3.75,-3.8)
{$
y
_{
0
}$}
;
\node
[anchor=center]
at (-2.6,-3.8)
{$
y
_{
5
}$}
;
\node
[anchor=center]
at (-1.45,-3.8)
{$
y
_{
10
}$}
;
\node
[anchor=center]
at (-0.3,-3.8)
{$
y
_{
15
}$}
;
\node
[anchor=center]
at (0.85,-3.8)
{$
y
_{
20
}$}
;
\node
[anchor=center]
at (2,-3.8)
{$
y
_{
25
}$}
;
\node
[anchor=center]
at (3.15,-3.8)
{$
y
_{
30
}$}
;
}
\end{tikzpicture}
\ No newline at end of file
Chapter15/chapter15.tex
查看文件 @
0b640bc4
差异被折叠。
点击展开。
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论