9月29日,记者获悉,声纹识别技术服务商君林科技近期完成一轮千万级别天使轮融资,投资方为海泉基金。君林科技创始人王群表示,本次投资将用于研发投入、硬件生产及人才引进等。
君林科技成立于2016年,是一家专攻固定短语和自由文的声纹识别技术服务商,提供包含智能电视、智能音箱、车联网等智能家居和工业落地场景的技术服务。
不同于语音识别解决“说了什么”的问题,声纹识别回答“说话人是谁” 的问题。随着语音交互的发展,声纹识别作为一种安全验证方式,天然成为物联网身份识别的入口,也是个性化服务的前提条件。声纹识别按照技术从易到难排序如下:固定数字、随机数字、固定短语、自由文、分割和聚类。但从使用体验来讲,却是反序排列。今天的数字识别技术已经基本成熟,得到商业化应用。其它声纹识别技术尚不成熟,少有好的应用案例。固定短语的语音识别技术在实验室环境下准确率已经能达到99%,但在现实应用场景中准确率大幅降低,甚至低至80%。
主要有三个原因:
1、 时间的鲁棒性。现实应用都是跨时间的应用,实验数据往往是集中录制。
2、 环境噪声及混响。声纹相比语音识别更容易受到环境噪声和混响的影响,真实场景中不可避免的存在各种噪声和混响。
3、 说话人的发音随意性。现实生活中人们发音具有一定的随意性,或大或小,或轻或重,不如实验室录制的一致性强。
真实场景准确率低造成声纹识别落地的困难。可以说,真实场景的准确率如果不能达到95%以上,则会在很大程度上影响体验感,难以落地到场景中。君林科技专攻固定短语和自由文的声纹识别,提供从前端声学采集降噪,到后端模型算法、声纹数据库的一套完整解决方案。
经过2年多时间打磨,君林今年年初完成了新一代的声纹识别模型。据创始人介绍,君林已实现真实场景中固定短语识别准确率98%,自由文准确率97%。这一准确率已经超越了对应公司Nuance96%(内部测试数据)和百度92%的识别准确率(公开论文数据,2017)。商业场景落地是技术类项目的核心难点。据创始人介绍,君林在智能家居和工业场景都已经有相应产品落地,进展顺利,但目前暂不方便公开披露。
团队部分,创始人王群曾任中国电声骨干企业技术负责人。核心技术团队包括师承COPSS总统奖获得者Prof. Nancy Reid的多伦多大学统计学博士Becky.Lin及计算机博士Chuan.Ma,以及研究大数据和AI深度学习超过10年的多位技术专家。声纹识别赛道是一个正在爆发的蓝海市场,涌现出了不少的优秀玩家。百度在这一领域上持续发力,2017开始与农业银行共建AI智能银行。IDG投资的SpeakIn也在安防领域不断拓展新的落地场景。数字声纹识别方向上,清华教授郑方带领的得意音通也赢得了建设银行、国家信息中心、中国银联等大客户。智能音箱赛道中,天猫、ROKID等也开始加入声纹识别模块。2018年,声纹识别正在一步步进入大众认知视野。
虽然声纹识别在各行各业当中体现出巨大的价值,但在实操阶段,声纹识别仍面临着很多困难。其中最显著的就是声纹采集的困难和方言、情绪化对声纹识别的影响问题。
声纹识别的首要步骤和关键前提就是进行声纹采集,只有收集到足够丰富的声纹信息,建立起完善的数据库,声纹识别才能够具备准确性和可操作性。而且,采集到丰富而多样化的声纹信息还有利于机器和系统进行深度学习,毕竟智能识别系统是通过大量的数据来进行训练和学习的。但目前声纹信息的把控权牢牢掌握在公安和政府部门手中,这就给企业的声纹采集工作带来极大的困难。他们需要通过多个渠道进行大量的前期工作,采集到足够的声纹信息,才能建立恰当的声纹识别系统。
另外,人类的方言、口音差异,以及不同状态下的声音状况不同,都会对声纹识别造成一定的影响。如果声纹识别系统只能够识别标准的普通话,那说方言和口音重的人的身份可能就很难被识别出来。同样的道理,说话人的情绪有高涨或低落的时候,在不同的状态下,声音也会有微小的差异,这些差异同样会导致声纹识别发生错误。因此,如何在动态识别中准确判断出声音的本质特征对于声纹识别来说是非常重要,也是非常困难的。
尽管,声纹识别在各个领域都占有举足轻重的地位,应用也日益广泛,但具体应用仍然存在着很多困难。这些困难和问题是声纹识别发展道路上绝对不能够忽视的,需要我们用多种技术手段去尽快调整和解决。
北京君林科技股份有限公司,专业的电声企业,打造人工智能时代的金耳朵。面向全球,提供最领先的音频领域解决方案和专业服务,基于声学推动人工智能技术产品落地。
公司以打造人工智能领域的音频硬件平台及系统平台,使君林技术成为人工智能音频领域不可或缺的环节为发展目标。并以此为基础,全面覆盖声学技术-固件算法-智能硬件-系统驱动-云服务-大数据-Ai技术等技术链。
君林科技拥有一整套完整的声音处理系统解决方案。用户可以使用已有或者定制的音频数据采集方案,通过君林科技声纹REST API上传至云端,由人工智能算法进行建模,识别与认证,有效得为企业创造最大价值。
关于本轮投资逻辑,海泉基金方面表示,随着物联网时代的加速来临,声纹识别已成为人工智能领域重要的入口。君林科技在技术人才、产品评测方面都具有自身的优势,看好项目的未来发展。海泉基金是一家关注智能科技、消费升级、文创领域的早期基金,由音乐创作人胡海泉创办。自2014年成立以来,投资了包括铜师傅、悦米科技、临奇科技、新片场、风霆迅在内等诸多项目。