Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
M
mtbookv2
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
mtbookv2
Commits
d457080c
Commit
d457080c
authored
Nov 26, 2020
by
zengxin
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
11
parent
655df045
显示空白字符变更
内嵌
并排
正在显示
2 个修改的文件
包含
7 行增加
和
7 行删除
+7
-7
Chapter11/Figures/figure-image-convolution.tex
+3
-3
Chapter11/chapter11.tex
+4
-4
没有找到文件。
Chapter11/Figures/figure-image-convolution.tex
查看文件 @
d457080c
...
...
@@ -25,9 +25,9 @@
\node
[data,inner sep=2pt,fill=cyan!40]
at (14.4em,2.4em)
{
19
}
;
\node
[data,inner sep=2pt]
at (16em,2.4em)
{
25
}
;
\node
[font=\footnotesize]
(in) at (1.6em,
4.8em)
{
输入
}
;
\node
[font=\footnotesize]
at (8.8em,
4.8em)
{
卷积核
}
;
\node
[font=\footnotesize]
(out) at (15.2em,
4.8em)
{
输出
}
;
\node
[font=\footnotesize]
(in) at (1.6em,
-1.8em)
{
输入:
$
3
\times
3
$
}
;
\node
[font=\footnotesize]
at (8.8em,
-1.8em)
{
卷积核:
$
2
\times
2
$
}
;
\node
[font=\footnotesize]
(out) at (15.2em,
-1.8em)
{
输出:
$
2
\times
2
$
}
;
%\node[font=\footnotesize,dashed,draw=cyan,very thick,fill=cyan!5,align=center] at ([yshift=-0.3cm,xshift=1.8cm]out.east) {*\ \ :表示\\卷积计算};
%\node[] at ([yshift=-0.3cm,xshift=-2.3cm]in.east) {\ \ \ \ \ };
...
...
Chapter11/chapter11.tex
查看文件 @
d457080c
...
...
@@ -91,7 +91,7 @@
\label
{
eq:11-1-new
}
\end{eqnarray}
\noindent
其中
$
i
$
是输出矩阵的行下标,
$
j
$
是输出矩阵的列下标。图
\ref
{
fig:11-4
}
展示了一个简单的卷积操作示例,
卷积核大小为
$
2
\times
2
$
,图像大小为
$
3
\times
3
$
,将卷积核在图像上依次进行滑动,滑动步幅为1
,根据公式
\eqref
{
eq:11-1-new
}
,图中蓝色位置
$
\mathbi
{
y
}_{
0
,
0
}$
的计算为:
\noindent
其中
$
i
$
是输出矩阵的行下标,
$
j
$
是输出矩阵的列下标。图
\ref
{
fig:11-4
}
展示了一个简单的卷积操作示例,
其中
$
Q
$
为2,
$
U
$
为2,
$
\textrm
{
stride
}$
为1,将卷积核在图像上依次进行滑动
,根据公式
\eqref
{
eq:11-1-new
}
,图中蓝色位置
$
\mathbi
{
y
}_{
0
,
0
}$
的计算为:
\begin{eqnarray}
\mathbi
{
y
}_{
0,0
}
&
=
&
\sum
\sum
(
\mathbi
{
x
}_{
[0
\times
1:0
\times
1+2-1,0
\times
1:0
\times
1+2-1]
}
\odot
\mathbi
{
w
}
)
\nonumber
\\
&
=
&
\sum
\sum
(
\mathbi
{
x
}_{
[0:1,0:1]
}
\odot
\mathbi
{
w
}
)
\nonumber
\\
...
...
@@ -466,7 +466,7 @@
\subsection
{
深度可分离卷积
}
\label
{
sec:11.3.1
}
\parinterval
根据前面的介绍,可以看到卷积神经网络容易用于局部检测和处理位置不变的特征。对于特定的表达,比如地点、情绪等,使用卷积神经网络能达到不错的识别效果,因此它常被用在文本分类中
\upcite
{
Kalchbrenner2014ACN,Kim2014ConvolutionalNN,DBLP:conf/naacl/Johnson015,DBLP:conf/acl/JohnsonZ17
}
。不过机器翻译所面临的情况更复杂,除了局部句子片段信息,我们还希望模型能够捕获句子结构、语义等信息。虽然单层卷积神经网络在文本分类中已经取得了很好的效果
\upcite
{
Kim2014ConvolutionalNN
}
,
神经机器翻译等任务仍然需要有效的卷积神经网络。随着深度可分离卷积在机器翻译中的探索
\upcite
{
Kaiser2018DepthwiseSC
}
,更高效的网络结构被设计出来,获得了比Con
S2S模型更好的性能。
\parinterval
根据前面的介绍,可以看到卷积神经网络容易用于局部检测和处理位置不变的特征。对于特定的表达,比如地点、情绪等,使用卷积神经网络能达到不错的识别效果,因此它常被用在文本分类中
\upcite
{
Kalchbrenner2014ACN,Kim2014ConvolutionalNN,DBLP:conf/naacl/Johnson015,DBLP:conf/acl/JohnsonZ17
}
。不过机器翻译所面临的情况更复杂,除了局部句子片段信息,我们还希望模型能够捕获句子结构、语义等信息。虽然单层卷积神经网络在文本分类中已经取得了很好的效果
\upcite
{
Kim2014ConvolutionalNN
}
,
但是神经机器翻译等任务仍然需要有效的卷积神经网络。随着深度可分离卷积在机器翻译中的探索
\upcite
{
Kaiser2018DepthwiseSC
}
,更高效的网络结构被设计出来,获得了比Conv
S2S模型更好的性能。
%----------------------------------------------
% 图17.
...
...
@@ -478,7 +478,7 @@
\end{figure}
%----------------------------------------------
\parinterval
深度可分离卷积由深度卷积和逐点卷积两部分结合而成
\upcite
{
sifre2014rigid
}
。图
\ref
{
fig:11-17
}
展示了标准卷积、深度卷积和逐点卷积的对比
,为了方便显示,图中只画出了部分连接。
\parinterval
深度可分离卷积由深度卷积和逐点卷积两部分结合而成
\upcite
{
sifre2014rigid
}
。图
\ref
{
fig:11-17
}
对比了标准卷积、深度卷积和逐点卷积
,为了方便显示,图中只画出了部分连接。
\parinterval
给定输入序列表示
$
\seq
{
x
}
=
\{
\mathbi
{
x
}_
1
,
\mathbi
{
x
}_
2
,...,
\mathbi
{
x
}_
m
\}
$
,其中
$
m
$
为序列长度,
$
\mathbi
{
x
}_
i
\in
\mathbb
{
R
}^{
O
}
$
,
$
O
$
即输入序列的通道数。为了获得与输入序列长度相同的卷积输出结果,首先需要进行填充。为了方便描述,这里在输入序列尾部填充
$
K
-
1
$
个元素(
$
K
$
为卷积核窗口的长度),其对应的卷积结果为
$
\seq
{
z
}
=
\{
\mathbi
{
z
}_
1
,
\mathbi
{
z
}_
2
,...,
\mathbi
{
z
}_
m
\}
$
。
在标准卷积中,若使用N表示卷积核的个数,也就是标准卷积输出序列的通道数,那么对于第
$
i
$
个位置的第
$
n
$
个通道
$
\mathbi
{
z
}_{
i,n
}^
\textrm
{
\,
std
}$
,其标准卷积具体计算方式如下:
...
...
@@ -569,7 +569,7 @@
\parinterval
在轻量卷积中,模型使用的卷积参数是静态的,与序列位置无关, 维度大小为
$
K
\times
a
$
;而在动态卷积中,为了增强模型的表示能力,卷积参数来自于当前位置输入的变换,具体如下:
\begin{eqnarray}
\funp
{
f
}
(
\mathbi
{
X
}_{
i
}
) =
\sum
_{
c=1
}^
d
\mathbi
{
W
}_{
:,:,c
}
\odot
\mathbi
{
x
}_{
i,c
}
\funp
{
f
}
(
\mathbi
{
x
}_{
i
}
) =
\sum
_{
c=1
}^
d
\mathbi
{
W
}_{
:,:,c
}
\odot
\mathbi
{
x
}_{
i,c
}
\label
{
eq:11-15
}
\end{eqnarray}
...
...
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论