Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
N
NiuTrans.Tensor
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
8
Issues
8
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
NiuTrans
NiuTrans.Tensor
Commits
bd37527b
Commit
bd37527b
authored
6 years ago
by
xiaotong
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
improve initialization
parent
c6f50a22
隐藏空白字符变更
内嵌
并排
正在显示
3 个修改的文件
包含
5 行增加
和
5 行删除
+5
-5
source/sample/transformer/T2TEmbedding.cpp
+1
-1
source/sample/transformer/T2TLayerNormal.cpp
+1
-4
source/sample/transformer/T2TOutput.cpp
+3
-0
没有找到文件。
source/sample/transformer/T2TEmbedding.cpp
查看文件 @
bd37527b
...
...
@@ -61,7 +61,7 @@ void T2TEmbedder::InitModel(int argc, char ** argv, int myDevID, XMem * myMem)
InitTensor2D
(
&
w
,
vSize
,
eSize
,
X_FLOAT
,
devID
,
mem
);
DTYPE
v
=
1.0
F
/
(
float
)
sqrt
((
float
)
eSize
);
w
.
SetDataRand
(
-
v
,
v
);
w
.
SetDataRand
n
(
0
,
v
);
/* create the positional embedding matrix */
MakePosEmbedding
(
eSize
,
d
,
maxLength
);
...
...
This diff is collapsed.
Click to expand it.
source/sample/transformer/T2TLayerNormal.cpp
查看文件 @
bd37527b
...
...
@@ -59,10 +59,7 @@ void T2TLN::InitModel(int argc, char ** argv, int myDevID, XMem * myMem)
InitTensor1D
(
&
w
,
d
,
X_FLOAT
,
devID
,
mem
);
InitTensor1D
(
&
b
,
d
,
X_FLOAT
,
devID
,
mem
);
float
scale
=
1.0
F
;
float
finfout
=
(
float
)
sqrt
(
6.0
F
*
scale
/
d
);
w
.
SetDataRand
(
-
finfout
,
finfout
);
w
.
SetDataRand
(
1.0
F
,
1.0
F
);
b
.
SetZeroAll
();
}
...
...
This diff is collapsed.
Click to expand it.
source/sample/transformer/T2TOutput.cpp
查看文件 @
bd37527b
...
...
@@ -66,6 +66,9 @@ void T2TOutput::InitModel(int argc, char ** argv, int myDevID, XMem * myMem)
float
scale
=
1.0
F
;
float
finfout
=
(
float
)
sqrt
(
6.0
F
*
scale
/
(
hSize
+
vSize
));
w
.
SetDataRand
(
-
finfout
,
finfout
);
DTYPE
v
=
1.0
F
/
(
float
)
sqrt
((
float
)
hSize
);
w
.
SetDataRandn
(
0
,
v
);
}
/*
...
...
This diff is collapsed.
Click to expand it.
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论