Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
T
Toy-MT-Introduction
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
Toy-MT-Introduction
Commits
d1c4df30
Commit
d1c4df30
authored
Apr 12, 2020
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
minor updates of section 2
parent
f1db191d
全部展开
隐藏空白字符变更
内嵌
并排
正在显示
4 个修改的文件
包含
9 行增加
和
11 行删除
+9
-11
Book/Chapter2/chapter2.tex
+3
-5
Book/mt-book-xelatex.idx
+0
-0
Book/mt-book-xelatex.ptc
+0
-0
Book/mt-book-xelatex.tex
+6
-6
没有找到文件。
Book/Chapter2/chapter2.tex
查看文件 @
d1c4df30
...
...
@@ -783,7 +783,8 @@ N & = & \sum_{r=0}^{\infty}{r^{*}n_r} \nonumber \\
也就是说,
$
N
$
仍然为这个整个样本分布最初的计数。样本中所有事件的概率之和为:
\begin{eqnarray}
\textrm
{
P
}
(r>0)
&
=
&
\sum
_{
r>0
}{
\textrm
{
P
}_
r
}
\nonumber
\\
&
=
&
1 -
\frac
{
n
_
1
}{
N
}
< 1
&
=
&
1 -
\frac
{
n
_
1
}{
N
}
\nonumber
\\
&
<
&
1
\label
{
eq:2.4-11
}
\end{eqnarray}
...
...
@@ -882,7 +883,7 @@ c_{\textrm{KN}}(\cdot) & = & \begin{cases} \textrm{count}(\cdot)\quad\quad \text
\end{eqnarray}
\noindent
其中catcount
$
(
\cdot
)
$
表示的是基于某个单个词作为第
$
n
$
个词的
$
n
$
-gram的种类数目。
\parinterval
Kneser-Ney平滑是很多语言模型工具的基础
\cite
{
wang-etal-2018-niutrans
}
\cite
{
heafield-2011-kenlm
}
\cite
{
stolcke2002srilm
}
。还有很多
基于此为基础衍生出来的算法,有
兴趣的读者可以通过参考文献自行了解
\cite
{
parsing2009speech
}
\cite
{
ney1994structuring
}
\cite
{
chen1999empirical
}
。
\parinterval
Kneser-Ney平滑是很多语言模型工具的基础
\cite
{
wang-etal-2018-niutrans
}
\cite
{
heafield-2011-kenlm
}
\cite
{
stolcke2002srilm
}
。还有很多
以此为基础衍生出来的算法,感
兴趣的读者可以通过参考文献自行了解
\cite
{
parsing2009speech
}
\cite
{
ney1994structuring
}
\cite
{
chen1999empirical
}
。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section
{
句法分析(短语结构分析)
}
\index
{
Chapter2.5
}
...
...
@@ -948,7 +949,6 @@ c_{\textrm{KN}}(\cdot) & = & \begin{cases} \textrm{count}(\cdot)\quad\quad \text
一个上下文无关文法可以被视为一个系统
$
G
=
<N,
\Sigma
,R,S>
$
,其中
\begin{itemize}
\item
\item
$
N
$
为一个非终结符集合
\item
$
\Sigma
$
为一个终结符集合
\item
$
R
$
为一个规则(产生式)集合,每条规则
$
r
\in
R
$
的形式为
$
X
\to
Y
_
1
Y
_
2
...Y
_
n
$
,其中
$
X
\in
N
$
,
$
Y
_
i
\in
N
\cup
\Sigma
$
...
...
@@ -1016,7 +1016,6 @@ s_0 \overset{r_1}{\Rightarrow} s_1 \overset{r_2}{\Rightarrow} s_2 \overset{r_3}{
且
\begin{itemize}
\item
\item
$
\forall
i
\in
[
0
,n
]
, s
_
i
\in
(
N
\cup\Sigma
)
^
*
$
\hspace
{
3.5em
}
$
\lhd
$
$
s
_
i
$
为合法的字符串
\item
$
\forall
j
\in
[
1
,n
]
, r
_
j
\in
R
$
\hspace
{
6.3em
}
$
\lhd
$
$
r
_
j
$
为
$
G
$
的规则
\item
$
s
_
0
\in
S
$
\hspace
{
10.9em
}
$
\lhd
$
$
s
_
0
$
为起始非终结符
...
...
@@ -1092,7 +1091,6 @@ s_0 \overset{r_1}{\Rightarrow} s_1 \overset{r_2}{\Rightarrow} s_2 \overset{r_3}{
一个概率上下文无关文法可以被视为一个系统
$
G
=
<N,
\Sigma
,R,S>
$
,其中
\begin{itemize}
\item
\item
$
N
$
为一个非终结符集合
\item
$
\Sigma
$
为一个终结符集合
\item
$
R
$
为一个规则(产生式)集合,每条规则
$
r
\in
R
$
的形式为
$
p:X
\to
Y
_
1
Y
_
2
...Y
_
n
$
,其中
$
X
\in
N
$
,
$
Y
_
i
\in
N
\cup
\Sigma
$
,每个
$
r
$
都对应一个概率
$
p
$
,表示其生成的可能性。
...
...
Book/mt-book-xelatex.idx
查看文件 @
d1c4df30
差异被折叠。
点击展开。
Book/mt-book-xelatex.ptc
查看文件 @
d1c4df30
差异被折叠。
点击展开。
Book/mt-book-xelatex.tex
查看文件 @
d1c4df30
...
...
@@ -112,13 +112,13 @@
% CHAPTERS
%----------------------------------------------------------------------------------------
%
\include{Chapter1/chapter1}
\include
{
Chapter1/chapter1
}
\include
{
Chapter2/chapter2
}
%
\include{Chapter3/chapter3}
%
\include{Chapter4/chapter4}
%
\include{Chapter5/chapter5}
%
\include{Chapter6/chapter6}
%
\include{ChapterAppend/chapterappend}
\include
{
Chapter3/chapter3
}
\include
{
Chapter4/chapter4
}
\include
{
Chapter5/chapter5
}
\include
{
Chapter6/chapter6
}
\include
{
ChapterAppend/chapterappend
}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论