阿里巴巴达摩院发布新一代AI语音FPGA芯片技术Ouroboros

8月21日,在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计。作为芯片领域的顶级峰会之一,HOTCHIPS 与其他顶级半导体会议的显著区别之一就是更侧重于商业应用,而非仅仅是学术项目,此次阿里发布的Ouroboros 就是面向语音合成领域商业应用的 FPGA 加速计算方案。


阿里巴巴达摩院发布新一代AI语音FPGA芯片技术Ouroboros_人工智能_智能芯片


(阿里达摩院科学家在HOTCHIPS大会现场发布自研语音芯片技术)


针对 ASIC 实现的性能仿真预估表明, Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。


算法很好但难以进行实时计算是语音芯片的行业难题。Ouroboros的突破在于它使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性,解决了这一问题。以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。


该芯片技术突破在于使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性。以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒。


阿里用户在使用天猫精灵、高德导航、智能点餐机等服务时,将率先得到媲美真人语音交互的体验。


阿里发布的 Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到97%以上,是目前业界体验最好的语音生成算法。自研算法与自研AI芯片设计的结合,意味着阿里在语音生成领域实现了真正的“软硬一体化”计算结构的落地。


Ouroboros的一大突破,是用端上定制硬件加速技术替代云端服务器,避免了对网络连接和云端服务的强依赖性。Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别,基于Ouroboros研发完整的语音AI芯片,有望率先在天猫精灵上落地。


2017年10月,阿里巴巴集团正式宣布成立“达摩院”,2018年9月,阿里巴巴宣布成立芯片公司“平头哥半导体有限公司”,该公司由阿里收购的国产芯片企业中天微与阿里旗下达摩院芯片团队整合而成。


阿里巴巴告诉记者,这项芯片技术还有可能加入到汽车(比如上汽荣威)和手机上,以支持高德地图的语音交互。


达摩院芯片团队成员大多拥有供职于AMD、ARM、英伟达、英特尔等芯片大厂的经验。平头哥半导体将打造面向汽车、家电、工业等诸多行业领域的智联网芯片平台。



56
189
0
91

相关资讯

  1. 1、荧屏劲刮“抄袭风”面对质疑主创各有“解释”4992
  2. 2、《父母爱情》王海洋做梦也没想到这两件事能发生,最后一件太窝心4917
  3. 3、《金牌流浪狗》口碑获赞狗狗主角萌翻观众3678
  4. 4、《盗剑72小时》终极预告神秘墓室首度曝光1885
  5. 5、大s小s聊韩星孔刘,汪小菲强行尬聊笑哭网友:孔子后人吗?2661
  6. 6、《最佳嫌疑人》泡澡特辑带动最“潮”社交方式2266
  7. 7、湖南卫视第13次播《还珠格格》收视率竟然夺冠2962
  8. 8、庄羽曝诉讼成本已超21万:望郭敬明尽快公布全部收益4398
  9. 9、关之琳接受采访自曝黑历史,网友:尽毁三观,难怪56岁依然单身4976
  10. 10、从《唐人街探案3》首日10.5亿票房看中国电影巨大潜力2459
全部评论(0)
我也有话说
0
收藏
点赞
顶部