博鳌亚洲论坛热闹非凡,来自全球上百个国家的嘉宾齐聚博鳌镇,用不同的语言讨论经济、政治、文化等各个行业的重大议题。在这届论坛上,值得关注的是,除了传统的同声传译员外,部分现场还额外配备了人工智能翻译。翻译系统会捕捉嘉宾演讲内容,并以中英双语的方式投影在大屏幕上,展示给听众,可谓是大开眼界。
这是博鳌论坛创办17年来第一次采用人工智能同传技术。不过,这个方案并不是来自于搜狗、百度或者科大讯飞这些已经有过技术公开展示的公司,而是来自于此前在语音技术上曝光率较低的腾讯。
据界面新闻记者了解,这次博鳌论坛上使用的,是腾讯在2017年所推出的“腾讯同传”服务。腾讯和博鳌论坛主办方沟通了3个月,才战胜其他服务供应商,获得这次机会。
腾讯同传由两部分服务组成,分别是“腾讯翻译君”和“微信智聆”。腾讯翻译君在2016年11月正式上线,是一款由人工智能技术驱动的、面向消费端的翻译产品,常规功能包括15种语言的文本翻译、语音翻译和拍照翻译等,目前已经推出了网页版、App和小程序以供用户使用。
微信智聆则是微信团队打造的一款语音识别技术,2017年11月正式对外推出,我们日常使用的微信语音转文字功能就是微信智聆提供的。
在论坛上,微信智聆负责把演讲嘉宾的语音识别为文字,腾讯翻译君再把文本翻译成目标语言,最终通过语音合成进行播报,形成同传的翻译效果。
和其他翻译服务相比,腾讯同传的一大优势是海量数据积累。据腾讯方面透露,目前腾讯翻译君每天收到翻译请求次数超过4亿次,其能力已经输送到社交、硬件等等领域。
腾讯同传已经在腾讯内部活动上广泛应用,例如2017年11月举行的腾讯媒体+峰会上,腾讯COO任宇昕的演讲内容就通过这项服务,以中英双语的方式实时展现;同时,腾讯旗下的机器人写作工具Dreamwriter还把他的演讲内容实时编写成文字,对外发布。
不过,在以往的场景中,腾讯同传面对的翻译内容相对固定,难度较小。这次在博鳌论坛亮相,是腾讯同传第一次见识“大场面”,而从临场效果来看,腾讯同传还有点儿嫩。昨天下午就有网友在微博上指出其部分错误,例如词汇重复、短语误用等等。
“博鳌论坛和其他活动的不同点在于,活动规格高,演讲者的语种变化多、专业方向多、发言人数多,而且形式以讨论为主。” 腾讯翻译君负责人李学朝说。这些因素都为腾讯同传带来了一定的挑战。
李学朝对界面新闻表示,此前的数据显示,腾讯同传在会议现场的平均语音识别准确率可达97%,翻译可接受度超过92%;但由于论坛上有各种语料知识、专业名词、五湖四海的英语流派,再加上话筒噪声、回声等环境音的干扰,腾讯同传确实面临较大挑战。
总之,从现在的情况来看,腾讯同传还需要继续积累数据、不断训练,从而提升技术体验。
李学朝告诉界面新闻,目前腾讯同传主要面向企业端,以积累数据、优化服务为主,暂时不以营利为短期目标。
他认为,从目前的使用效果来看,机器翻译与人工翻译各有其擅长的应用场景和服务。比如,机器翻译可以每天提供亿级翻译次数、有对新领域的定制术语快速掌握的能力,这是人工翻译难以复制的;而翻译员所能整合的人际了解、模糊语义的掌握等,这些是机器翻译短期内不容易达到的。
目前,随着大型语料库的出现和技术的成熟,越来越多的公司都已经推出了相关的机器翻译产品或服务。从现在的趋势来看,如果机器翻译和人工翻译真的能够形成互补的话,同传人员在未来的几年内的工作也许会越来越轻松了。