10月20日,“讯飞输入法10周年 A.I.输入沙龙”在北京举办,讯飞输入法正式发布其最新的10.0版本。据悉,这一版本搭载了“动态自适应编解码语音识别引擎”,令通用语音识别率在98%基础上再获突破。
会上,章继东分享了过去十年讯飞输入法技术发展:2010年,讯飞输入法1.0版本将隐马尔可夫模型成功应用于语音识别系统中,让输入效率提升了3倍;2012年,讯飞输入法率先将深度神经网络DNN技术应用于语音识别,使识别效果达到业界领先水平; 2018年推出了Hybrid CNN语音识别引擎,大幅提升中英混合输入效果……在A.I.驱动和大数据积累下,讯飞输入法实现了从单一识别率提升到全场景输入覆盖的迭代。
数据显示,截至目前,讯飞输入法的日语音交互次数超过10亿次,语音输入累计服务设备超过5亿台,语音用户占比超过70%。据此前报道,2017年,讯飞输入法发起“方言保护计划”公益行动,通过智能语音技术保护方言,短短几个月超过80万人参与;截至目前,方言库的珍贵语料近140万条,并通过A.I.语言复制实现23种方言识别。
值得关注的是,讯飞输入法连续3年发起“和我一起看见”信息无障碍公益行动,将业界领先的A.I.技术应用到无障碍模式上,依托无障碍语音输入、表情输入等丰富功能,讯飞输入法铺设了通向互联网世界的“盲道”,满足1700多万视障群体对无障碍输入个性化、多元化的功能需求,让视障群体可以在不同场景下都能快速、顺畅地使用。
现场,科大讯飞输入法业务部总经理程坤还为大家展示了讯飞输入法最新发布的10.0版本。这一版本搭载了“动态自适应编解码语音识别引擎”,令通用语音识别率在98%基础上再获重大突破。新增的唇形辅助输入,提高嘈杂环境及近距离多人说话的识别效果。另一方面,是大幅优化领域词的识别。最直观的感受是,输入法会帮你更精准的匹配游戏、医疗、旅游、购物等不同的场景词汇,更懂你的表达。
“输入效率并不是终点,效率之上,输入法作为大众款产品更应满足多样化的表达,适应复杂的输入环境,”程坤补充道。
除了语音功能边界的拓展,讯飞输入法10.0版本还基于“免切换”的理念,可以实现英文单词连续手写,即在输入面板既可以手写汉字也可以直接手写完整的英文单词。至此,讯飞输入法已实现语音、拼音、手写多种方式的中英文输入免切换。
最后,章继东表示:“过去十年里,讯飞输入法秉持着技术顶天,引领语音交互落地的理念,不断革新产品,努力让让亿万用户高效输入,乐享沟通。下一个十年,随着5G和AIoT时代的到来,讯飞输入法将继续以过硬的技术实力直面行业发展的挑战与机遇,不断提高语音输入的行业天花板。“