Skip to content
项目
群组
代码片段
帮助
当前项目
正在载入...
登录 / 注册
切换导航面板
R
ReadingList
概览
Overview
Details
Activity
Cycle Analytics
版本库
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
问题
0
Issues
0
列表
Board
标记
里程碑
合并请求
0
Merge Requests
0
CI / CD
CI / CD
流水线
作业
日程表
图表
维基
Wiki
代码片段
Snippets
成员
Collapse sidebar
Close sidebar
活动
图像
聊天
创建新问题
作业
提交
Issue Boards
Open sidebar
zengxin
ReadingList
Commits
c8caf820
Commit
c8caf820
authored
Feb 04, 2021
by
zengxin
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
tag
parent
0ce27737
隐藏空白字符变更
内嵌
并排
正在显示
6 个修改的文件
包含
37 行增加
和
0 行删除
+37
-0
tag transfer/Neural Machine Translation with Explicit Phrase Alignment.pdf
+0
-0
tag transfer/Transferring Markup Tags in Statistical Machine Translation A Two-Stream Approach.pdf
+0
-0
tag transfer/Treatment of Markup in Statistical Machine Translation.W17-4804.pdf
+0
-0
tag transfer/how-should-markup-tags-be-translated.pdf
+0
-0
tag transfer/方法介绍.md
+37
-0
tag transfer/面向机器翻译的标记语言研究.pdf
+0
-0
没有找到文件。
tag transfer/Neural Machine Translation with Explicit Phrase Alignment.pdf
0 → 100644
查看文件 @
c8caf820
File added
tag transfer/Transferring Markup Tags in Statistical Machine Translation A Two-Stream Approach.pdf
0 → 100644
查看文件 @
c8caf820
File added
tag transfer/Treatment of Markup in Statistical Machine Translation.W17-4804.pdf
0 → 100644
查看文件 @
c8caf820
File added
tag transfer/how-should-markup-tags-be-translated.pdf
0 → 100644
查看文件 @
c8caf820
File added
tag transfer/方法介绍.md
0 → 100644
查看文件 @
c8caf820
## **How Should Markup Tags Be Translated?** EMNLP 2020
## **How Should Markup Tags Be Translated?** EMNLP 2020
*
比较了两种常用的标记表示方法,测试了MT模型通过训练数据增强学习标记放置的能力;
*
构建了三种语言的标记语言测试集;
*
研究了标记表示、数据扩展大小、标记复杂度和语言对之间的相互作用,以说明每种方法的优缺点;
*
贡献
*
提出一种可在任意平行语料库中注入复杂度可控的标记方法,可以获得较高精度的数据,并且该方法能提高模型放置标签的精度:
*
n-gram片段对齐,然后插入标签
*
校验集人工评价错误率,在英德、英法、ENHU中分别是3.5%、5.8%和6.1%
*
提供了几种标记处理方法的综合评价:
*
基线实验
*
基线实验使用纯文本
*
词对齐模型使用模型的训练集进行训练
*
使用BPE和FastAlign
*
强制对齐BPE文件
*
分析了两种方法,一种泛化、一种raw data
*
质量评估
## 面向机器翻译的标记语言研究,2005年 情报学报
*
提出一种标记语言
## Neural Machine Translation with Explicit Phrase Alignment
*
提出一种词对齐方法
## **Transferring** **Markup** **Tags in Statistical** **Machine Transla** **tion:** **A** **Two**-Stream Approach**
*
**Two**
-Stream Approach:
*
用统计机器翻译翻译纯文本,然后再向译文中插入标签
*
插标签,不仅依赖短语对齐,还依赖短语中单个词的对齐
## **Treatment of Markup in Statistical Machine Translation**
tag transfer/面向机器翻译的标记语言研究.pdf
0 → 100644
查看文件 @
c8caf820
File added
编写
预览
Markdown
格式
0%
重试
或
添加新文件
添加附件
取消
您添加了
0
人
到此讨论。请谨慎行事。
请先完成此评论的编辑!
取消
请
注册
或者
登录
后发表评论