19

4a1c56ac · zengxin · 95f0892f · 4a1c56ac
Commit 4a1c56ac authored Dec 18, 2020 by zengxin
--- a/Chapter19/chapter19.tex
+++ b/Chapter19/chapter19.tex
@@ -51,9 +51,9 @@

 \parinterval 应用模式维度能够体现丰富多彩的机器翻译应用和服务，还可以细分到具体应用场景，这个我们就不一一列举，后面可能会讨论到一些具体应用。这里主要讨论一下应用模式的软硬件环境。通常机器翻译典型应用属于在线翻译公有云服务，用户接入非常简单，只需要联网使用浏览器就可以自由免费使用。在某些具体行业应用中，用户对数据翻译安全性和保密性要求非常高，其中可能还会涉及到个性化订制要求，这一点在线翻译公有云服务就无法满足用户需求，本地部署机器翻译私有云和离线机器翻译技术和服务成为了新的应用模式。本地部署私有云的问题在于用户需要自己购买GPU服务器和建机房，硬件投入和代价也不低，也许将来会出来一种新的应用模式：在线私有云\ \dash \ 专有云，有点像服务托管模式。最后一种云服务就是混合云，简单来说就是公有云、私有云和专有云混合体而已。

-\parinterval 离线机器翻译技术可以为更小型的智能翻译终端设备提供服务，比如大家熟悉的翻译机、翻译笔、翻译耳机等智能翻译设备，在不联网的情况下能够实现高品质机器翻译功能，相当于将机器翻译系统安装在智能翻译终端设备上，这个应用模式具有很大的潜力。但需要解决的问题很多，首先是模型大小、翻译速度和翻译品质三大问题，之后需要考虑不同操作系统（Linux、Android Q和iOS）和不同架构的CPU芯片，比如x86、MIPS、ARM架构等的智能适配兼容问题，特别是国产化机器翻译解决方案需求也在不断上升，本质上需要有能力兼容国产化操作系统和芯片。将来离线翻译系统还可以安装到办公设备上，比如传真机、打印机和复印机等，实现支持多语言的智能办公。目前人工智能芯片发展速度非常快，其实机器翻译和语音处理雷同，目前市面上语音技术芯片已近广泛使用，机器翻译芯片的研发估计不是技术问题，最大的问题的应用场景和上下游的应用支撑，一旦这个时机成熟，机器翻译芯片研发和应用也有可能会爆发。
+\parinterval 离线机器翻译技术可以为更小型的智能翻译终端设备提供服务，比如大家熟悉的翻译机、翻译笔、翻译耳机等智能翻译设备，在不联网的情况下能够实现高品质机器翻译功能，相当于将机器翻译系统安装在智能翻译终端设备上，这个应用模式具有很大的潜力。但需要解决的问题很多，首先是模型大小、翻译速度和翻译品质三大问题，之后需要考虑不同操作系统（Linux、Android Q和iOS）和不同架构的CPU芯片，比如x86、MIPS、ARM架构等的智能适配兼容问题，特别是国产化机器翻译解决方案需求也在不断上升，本质上需要有能力兼容国产化操作系统和芯片。将来离线翻译系统还可以安装到办公设备上，比如传真机、打印机和复印机等，实现支持多语言的智能办公。目前人工智能芯片发展速度非常快，其实机器翻译和语音处理雷同，目前市面上语音技术芯片已经被广泛使用，机器翻译芯片的研发缺的估计不是技术，其最大的问题应该是缺少应用场景和上下游的应用支撑，一旦这个时机成熟，机器翻译芯片研发和应用也有可能会爆发。

-\parinterval 机器翻译可以与文档解析、语音识别、OCR和视频字幕提取等技术相结合，我们称之为多模态机器翻译，大大丰富了机器翻译的应用模式。文档解析技术可以帮助实现Word文档翻译、PDF文档翻译、WPS文档翻译、邮件翻译等更多格式文档自动翻译能力，也可以作为插件嵌入到各种办公平台中，成为智能办公好助手。语音识别与机器翻译是绝配，语音语言是人与人交流的最自然方式，语音翻译用途就非常丰富了，比如翻译机和语音翻译app，还有目前大家比较期待的会议AI同传应用，参加国际会议可以通过该技术听懂讲不同母语的报告，该技术也可以成为会议室的标配，支持不同母语的参会人员进行自由交流。但目前最大的问题主要体现在两个方面，一是很多实际应用场景中语音识别结果欠佳，造成错误蔓延，导致机器翻译结果不够理想；二是就算小语种的语音识别效果很好，但资源稀缺型小语种翻译性能不够好。OCR技术可以帮助实现扫描笔和翻译笔的应用，还有出国旅游的拍照翻译功能，将来可以与穿戴式设备相结合，比如智能眼镜等等。视频字幕翻译能够帮助我们欣赏没有中文字幕的国外电影和电视节目，比如我们到达任何一个国家，打开电视都能够看到中文字幕，也是非常酷的应用。
+\parinterval 机器翻译可以与文档解析、语音识别、OCR和视频字幕提取等技术相结合，我们称之为多模态机器翻译，大大丰富了机器翻译的应用模式。文档解析技术可以帮助实现Word文档翻译、PDF文档翻译、WPS文档翻译、邮件翻译等更多格式文档自动翻译能力，也可以作为插件嵌入到各种办公平台中，成为智能办公好助手。语音识别与机器翻译是绝配，语音语言是人与人交流的最自然方式，语音翻译用途就非常丰富了，比如翻译机和语音翻译APP，还有目前大家比较期待的会议AI同传应用，参加国际会议可以通过该技术听懂讲不同母语研究人员的报告，该技术也可以成为会议室的标配，支持不同母语的参会人员进行自由交流。但目前最大的问题主要体现在两个方面，一是很多实际应用场景中语音识别结果欠佳，造成错误蔓延，导致机器翻译结果不够理想；二是就算小语种的语音识别效果很好，但资源稀缺型小语种翻译性能不够好。OCR技术可以帮助实现扫描笔和翻译笔的应用、出国旅游的拍照翻译功能，将来还可以与穿戴式设备相结合，比如智能眼镜等等。视频字幕翻译能够帮助我们欣赏没有中文字幕的国外电影和电视节目，比如我们到达任何一个国家，打开电视都能够看到中文字幕，也是非常酷的应用。

 \parinterval 但目前多模块机器翻译技术框架大多采用串行流水线，只是简单将两个或者多个不同的技术连接在一起，比如语音翻译过程分两步：语音识别和机器翻译，也可以增加一个语音合成发音功能。其它多模态机器翻译技术也大同小异，这个简单的串行流水线技术框架最大的问题就是错误蔓延问题，一旦某个技术环节准确率不够好，比90\%$\times$90\%=81\%，因为后续的技术环节不一定有能力纠正前面技术环节引入的错误，导致用户体验不够好。很多人说会议英中AI同传用户体验不够好，很自然以为是机器翻译出了问题，其实目前问题主要出在语音识别环节。学术界开始研究端到端的多模态机器翻译技术，不是采用串行流水线技术架构，而是采用一步到位的方式，这理论上能够缓解错误蔓延的问题，但目前实际效果还不够理想，期待学术界取得新的突破。