Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
4807f165
Commit
4807f165
authored
Sep 21, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
minor updates (secs 2 and 10)
parent
d70c9bb0
隐藏空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
2 行增加
和
2 行删除
+2
-2
Chapter10/chapter10.tex
+1
-1
Chapter2/chapter2.tex
+1
-1
没有找到文件。
Chapter10/chapter10.tex
查看文件 @
4807f165
...
...
@@ -163,7 +163,7 @@
\caption
{
神经机器翻译与统计机器翻译系统的译文错误率HTER[
\%
](忽略编辑距离中的移动操作)
\upcite
{
Bentivogli2016NeuralVP
}}
\label
{
tab:10-1
}
\begin{tabular}
{
r|llc
}
系统
&
单词
&
词根
&
\%
Δ
\\
\hline
系统
&
单词
&
词根
&
Δ
\\
\hline
PBSY
&
27.1
&
22.5
&
-16.9
\\
HPB
&
28.7
&
23.5
&
-18.4
\\
SPB
&
28.3
&
23.2
&
-18.0
\\
...
...
Chapter2/chapter2.tex
查看文件 @
4807f165
...
...
@@ -51,7 +51,7 @@
\parinterval
{
\small\bfnew
{
概率
}}
\index
{
概率
}
(Probability)
\index
{
Probability
}
是度量随机事件呈现其每个可能状态的可能性的数值,本质上它是一个测度函数
\upcite
{
mao-prob-book-2011,kolmogorov2018foundations
}
。概率的大小表征了随机事件在一次试验中发生的可能性大小。用
$
\funp
{
P
}
(
\cdot
)
$
表示一个随机事件的可能性,即事件发生的概率。比如
$
\funp
{
P
}
(
\textrm
{
太阳从东方升起
}
)
$
表示“太阳从东方升起”的可能性,同理,
$
\funp
{
P
}
(
A
=
B
)
$
表示的就是“
$
A
=
B
$
”这件事的可能性。
\parinterval
在实际问题中,往往需要得到随机变量的概率值。但是,真实的概率值可能是无法准确知道的,这时就需要对概率进行
{
\small\sffamily\bfseries
{
估计
}}
\index
{
估计
}
,得到的结果是概率的
{
\small\sffamily\bfseries
{
估计值
}}
\index
{
估计值
}
(Estimate)
\index
{
Estimate
}
。概率值的估计是概率论和统计学中的经典问题,有十分多样的方法可以选择。比如,一个很简单的方法是利用相对频次作为概率的估计值。如果
$
\{
x
_
1
,x
_
2
,
\dots
,x
_
n
\}
$
是一个试验的样本空间,在相同情况下重复试验
$
N
$
次,观察到样本
$
x
_
i
(
1
\leq
{
i
}
\leq
{
n
}
)
$
的次数为
$
n
(
x
_
i
)
$
,那么
$
x
_
i
$
在这
$
N
$
次试验中的相对频率是
$
\frac
{
n
(
x
_
i
)
}{
N
}$
。 当
$
N
$
越来越大时,相对概率也就越来越接近真实概率
$
\funp
{
P
}
(
x
_
i
)
$
,即
$
\lim
_{
N
\to
\infty
}
\frac
{
n
(
x
_
i
)
}{
N
}
=
\funp
{
P
}
(
x
_
i
)
$
。 实际上,很多概率模型都等同于相对频次估计。比如,对于一个服从多项式分布的变量,它的极大似然估计就可以用相对频次估计实现。
\parinterval
在实际问题中,往往需要得到随机变量的概率值。但是,真实的概率值可能是无法准确知道的,这时就需要对概率进行
{
\small\sffamily\bfseries
{
估计
}}
\index
{
估计
}
(Estimation
\index
{
Estimation
}
)
,得到的结果是概率的
{
\small\sffamily\bfseries
{
估计值
}}
\index
{
估计值
}
(Estimate)
\index
{
Estimate
}
。概率值的估计是概率论和统计学中的经典问题,有十分多样的方法可以选择。比如,一个很简单的方法是利用相对频次作为概率的估计值。如果
$
\{
x
_
1
,x
_
2
,
\dots
,x
_
n
\}
$
是一个试验的样本空间,在相同情况下重复试验
$
N
$
次,观察到样本
$
x
_
i
(
1
\leq
{
i
}
\leq
{
n
}
)
$
的次数为
$
n
(
x
_
i
)
$
,那么
$
x
_
i
$
在这
$
N
$
次试验中的相对频率是
$
\frac
{
n
(
x
_
i
)
}{
N
}$
。 当
$
N
$
越来越大时,相对概率也就越来越接近真实概率
$
\funp
{
P
}
(
x
_
i
)
$
,即
$
\lim
_{
N
\to
\infty
}
\frac
{
n
(
x
_
i
)
}{
N
}
=
\funp
{
P
}
(
x
_
i
)
$
。 实际上,很多概率模型都等同于相对频次估计。比如,对于一个服从多项式分布的变量,它的极大似然估计就可以用相对频次估计实现。
\parinterval
概率函数是用函数形式给出离散变量每个取值发生的概率,其实就是将变量的概率分布转化为数学表达形式。如果把
$
A
$
看做一个离散变量,
$
a
$
看做变量
$
A
$
的一个取值,那么
$
\funp
{
P
}
(
A
)
$
被称作变量
$
A
$
的概率函数,
$
\funp
{
P
}
(
A
=
a
)
$
被称作
$
A
=
a
$
的概率值,简记为
$
\funp
{
P
}
(
a
)
$
。例如,在相同条件下掷一个骰子50次,用
$
A
$
表示投骰子出现的点数这个离散变量,
$
a
_
i
$
表示点数的取值,
$
\funp
{
P
}_
i
$
表示
$
A
=
a
_
i
$
的概率值。表
\ref
{
tab:2-1
}
为
$
A
$
的概率分布,给出了
$
A
$
的所有取值及其概率。
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论