Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
1e077ac7
Commit
1e077ac7
authored
May 30, 2020
by
曹润柘
Browse files
Options
Browse Files
Download
Plain Diff
合并分支 'caorunzhe' 到 'master'
Caorunzhe 查看合并请求
!280
parents
09bdecd9
8eebc762
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
2 行增加
和
4 行删除
+2
-4
Book/Chapter1/chapter1.tex
+1
-3
Book/Chapter4/Figures/example-of-n-gram-1.tex
+1
-1
没有找到文件。
Book/Chapter1/chapter1.tex
查看文件 @
1e077ac7
...
...
@@ -454,8 +454,7 @@ Candidate:the the the the
\label
{
eq:1-2
}
\end{eqnarray}
\parinterval
但是,该方法更倾向于对短句子打出更高的分数。一个极端的例子是译文只有很少的几个词,但是都命中答案,准确率很高可显然不是好的译文。因此,BLEU引入
{
\small\bfnew
{
短句惩罚因子
}}
\index
{
短句惩罚因子
}
(Brevity Penalty
\index
{
Brevity Penalty
}
, BP)的概念,对短句进行惩罚,
\parinterval
但是,该方法更倾向于对短句子打出更高的分数。一个极端的例子是译文只有很少的几个词,但是都命中答案,准确率很高可显然不是好的译文。因此,BLEU引入
{
\small\bfnew
{
短句惩罚因子
}}
\index
{
短句惩罚因子
}
(Brevity Penalty
\index
{
Brevity Penalty
}
, BP)的概念,对短句进行惩罚:
\begin{eqnarray}
\textrm
{
BP
}
=
\begin{cases}
...
...
@@ -466,7 +465,6 @@ e^{(1-\frac{r}{c})}& c \le r
\end{eqnarray}
\noindent
其中
$
c
$
表示译文的句子长度,
$
r
$
表示参考译文的句子长度。最终BLEU的计算公式为:
\begin{eqnarray}
\textrm
{
BLEU
}
=
\textrm
{
BP
}
\cdot
\exp
(
\sum
_{
i=1
}^{
N
}
w
_
n
\cdot
\log
{
\textrm
{
P
}_
n
}
)
\label
{
eq:1-4
}
...
...
Book/Chapter4/Figures/example-of-n-gram-1.tex
查看文件 @
1e077ac7
...
...
@@ -2,7 +2,7 @@
%%% 引入短语翻译
{
\small
\begin{tabular}
{
l | l
}
\red
{
{
词串
}}
翻译表
&
P
\\
\hline
{
\red
{
词串
}}
翻译表
&
P
\\
\hline
我
$
\to
$
I
&
0.6
\\
喜欢
$
\to
$
like
&
0.3
\\
红
$
\to
$
red
&
0.8
\\
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论