Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
单韦乔
Toy-MT-Introduction
Commits
d2b2d26c
Commit
d2b2d26c
authored
Feb 11, 2020
by
姜雨帆
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
update phrase tabel
parent
ecd06572
隐藏空白字符变更
内嵌
并排
正在显示
1 个修改的文件
包含
28 行增加
和
3 行删除
+28
-3
Section04-Phrasal-and-Syntactic-Models/section04.tex
+28
-3
没有找到文件。
Section04-Phrasal-and-Syntactic-Models/section04.tex
查看文件 @
d2b2d26c
...
...
@@ -1819,10 +1819,10 @@ $d$是一个$(\textbf{s},\textbf{t})$上基于短语的翻译推导,$\textrm{P
%%------------------------------------------------------------------------------------------------------------
%% 改进方法
\begin{frame}
{
更好更多的短语
}
%
\begin{frame}{更好更多的短语}
% 提高词对齐性能 -> 增加短语质量? -> 提高翻译质量?
% 提高Recall,对于不同任务,词对齐的密度更重要?
\end{frame}
%
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
%%% 如何度量短语的好坏
...
...
@@ -1974,9 +1974,34 @@ $d$是一个$(\textbf{s},\textbf{t})$上基于短语的翻译推导,$\textrm{P
%%%------------------------------------------------------------------------------------------------------------
%%% 展示短语表的内容
\begin{frame}
{
短语表实例
}
\begin{itemize}
\item
下面来看一个真实的短语表例子
\vspace
{
-0.5em
}
\begin{center}
\begin{tikzpicture}
\node
[anchor=west] (s1) at (0,0)
{
\scriptsize
{
报告 认为
$
\vert\vert\vert
$
report holds that
$
\vert\vert\vert
$
-2.62 -5.81 -0.91 -2.85 1 0
$
\vert\vert\vert
$
4
$
\vert\vert\vert
$
0-0 1-1 1-2
}}
;
\node
[anchor=west] (s2) at ([yshift=-1.2em]s1.west)
{
\scriptsize
{
,悲伤
$
\vert\vert\vert
$
, sadness
$
\vert\vert\vert
$
-1.946 -3.659 0 -3.709 1 0
$
\vert\vert\vert
$
1
$
\vert\vert\vert
$
0-0 1-1
}}
;
\node
[anchor=west] (s3) at ([yshift=-1.2em]s2.west)
{
\scriptsize
{
,北京 等
$
\vert\vert\vert
$
, beijing , and other
$
\vert\vert\vert
$
0 -7.98 0 -3.84 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
0-0 1-1 2-2 2-3 2-4
}}
;
\node
[anchor=west] (s4) at ([yshift=-1.2em]s3.west)
{
\scriptsize
{
,北京 及
$
\vert\vert\vert
$
, beijing , and
$
\vert\vert\vert
$
-0.69 -1.45 -0.92 -4.80 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
0-0 1-1 2-2
}}
;
\node
[anchor=west] (s5) at ([yshift=-1.2em]s4.west)
{
\scriptsize
{
一个 中国
$
\vert\vert\vert
$
one china
$
\vert\vert\vert
$
0 -1.725 0 -1.636 1 0
$
\vert\vert\vert
$
2
$
\vert\vert\vert
$
1-1 2-2
}}
;
\node
[anchor=west] (s7) at ([yshift=-1.1em]s5.west)
{
\scriptsize
{
...
}}
;
\node
[anchor=west] (s6) at ([yshift=1.0em]s1.west)
{
\scriptsize
{
...
}}
;
\begin{pgfonlayer}
{
background
}
\node
[rectangle,inner sep=0.3em,fill=red!20] [fit = (s1) (s3) (s4) (s6) (s7)] (box1)
{}
;
\end{pgfonlayer}
\end{tikzpicture}
\end{center}
\item
在短语表的例子中,每行使用
$
\vert\vert\vert
$
划分为五个部分
\begin{itemize}
\item
第一部分为源语端的短语
\item
第二部分为目标语端的短语
\item
第三部分为多个特征的值,包含了短语翻译概率、词汇翻译概率等特征
\item
第四部分为短语对在短语抽取集合中出现的频率
\item
第五部分为词对齐信息
\end{itemize}
\end{itemize}
\end{frame}
%%%------------------------------------------------------------------------------------------------------------
\subsection
{
调序
}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论