美国投资机构Mangrove Capital Partners本周发布了2019年“语音技术报告”。报告题为“语音:欢迎下一代的颠覆者”,分析了语音助理服务的日益普及,并对2020年Siri的动向做出了有趣的预测。
以下为腾讯科技(ID:qqtech)编译整理的报告全文:
在过去多年的键盘输入和点击手机屏幕之后,我们正在回归到最初的“用户界面”:语音。虽然我们尚未感受到语音技术带来的全部影响,但这种技术正在改变我们与数字世界互动的方式。
重要的是,这种转变影响的远远不止是查看天气预报,获取音乐,以及设置闹钟。语音带来了平台和用户界面的转变,足以与网页和智能手机相媲美。作为人工智能和机器学习的入口,语音技术将通过强大的新方式为我们提供服务。
在Mangorve,我们相信,语音将成为未来10年决定性的主题之一。除了用数字服务影响各行各业以外,语音技术还将培育出新一代的科技公司。与人工智能一起,语音技术将从根本上改变人和机器的关系,给下一代软件创造巨大价值。
向语音转移
自2011年苹果推出Siri以来,语音技术已经取得了长足发展。随着机器学习的发展,我们在语音识别(语音转文字)和自然语言处理(识别文本中的指令)两方面都获得了相当大的进步。事实上,语音系统的单词识别准确率已超过95%,这意味着它们已经具备了与人类相仿的语言理解能力。相对于打字,语音产品提供了更自然、更便利、更高效的沟通形式。因此,语音注定将成为最主要的人机互动接口。
根据Juniper Research的数据,目前市面上已有25亿个语音助理存在。随着科技巨头争相加入竞争,越来越多家庭正在启用语音服务。在美国,家用智能音箱的总数2018年大幅增长78%,从6670万台增加至1.855亿台。亚马逊在这个市场的份额达到64.6%。Canalys预计,全球范围内智能音箱的装机量到2023年将增长至5亿台。
语音也在成为智能家居和物联网的入口。亚马逊宣布,已有4500个品牌提供2.8万款支持Alexa的智能家居设备,包括电视机、炊具和机器人吸尘器。除了进入家庭场景之外,语音助手也在进入万豪等**的房间,并且在汽车信息娱乐系统中也很受欢迎。亚马逊正在与多家汽车公司展开谈判,有报道称亚马逊的车内产品Echo Auto预售订单已超过100万。Echo Auto提供全方位的免提体验,包括打电话、导航,以及操控智能家居设备。
语音技术也在超越语言障碍。目前谷歌的服务已经支持30种语言,甚至可以同时理解用户所说的多种语言。有趣的是,在中国语音服务的普及更快,阿里巴巴在中国的智能音箱市场处于领先。
各类受欢迎应用的出现令人联想到App Store发展的早期。亚马逊Alexa提供的功能包括为新妈妈提供母乳喂养支持,鼓励孩子们刷牙,帮助用户锻炼,指导足球队,以及指引人们如何祷告。
语音电商的崛起
由于亚马逊Alexa直接关联至全球最大的电商平台之一,语音购物也在初步发展。亚马逊已经看到,Alexa平台的电商交易在2018年假日季同比增长至三倍。沃尔玛近期也推出了基于谷歌语音助手的在线生鲜购物服务,支持购物者通过谷歌Home、智能手机或智能手表将产品添加到购物车。
根据Juniper的数据,在美国和英国,语音电商的规模将从2018年的20亿美元增长至2022年的400亿美元。有趣的是,语音电商最热门的三大商品品类都是低价商品:生鲜杂货(20%)、娱乐(19%)和电子(17%)。
因此对零售商来说,获得“亚马逊精选”的地位将会比以往更加重要。根据OC&C战略咨询公司的数据,亚马逊购物者中有85%最终会选择亚马逊推荐的商品。不过目前外界仍然不清楚,具体商品要如何才能获得这样的推荐。
无论是在线上还是线下,语音技术已经在指引消费者购物。快消品厂商正在探索,基于语音体验,对于制作鸡尾酒和品尝威士忌等场景,可以如何提升产品定位和用户忠诚度。
你不会再感到孤单
重要的是,语音服务正在从事务性向对话性转变。这种趋势的最终结果很难完全被理解,但你可以考虑这一点:你永远不会再感到孤单,无论是在与Alexa说话,还是与另一个人或人工智能说话。人工智能的第一次浪潮使用算法去建立推荐引擎,提供访问互联网服务,例如谷歌、亚马逊和Facebook的快捷方式。而第二次浪潮则是帮助企业利用结构化数据去优化决策流程。类似Palantir的公司开始崛起,它们挖掘大量结构化数据,找出人眼和人脑难以发现的信息关联性。
人工智能的第三次浪潮正在到来。人工智能获得了眼睛、耳朵和无数其他感官,从而可以收集从来没有过的新数据,随后使用这些数据推动更复杂的流程自动化。与此同时,我们也在从基于命令的静态流程转向动态流程。这是计算领域的结构性变化,将彻底改变我们体验软件,与软件交互的方式,模糊了数字世界和现实世界之间的关联。
随着人工智能系统在对话中变得更熟练,收集关于人们及其周围世界的更多数据,它们将可以了解情景信息。人类通常可以不费力地掌握这些关联信息,并将其应用在对话中。情景信息将帮助人类和机器以更自然的方式互动和协作。而随着体验的优化,变得更有用,他们将会更加频繁的互动,而机器也将掌握更多知识。
这样的良性循环意味着,在未来3到5年内,计算机的对话能力将变得更复杂,更具变革性。与其将我们的时间花在键盘打字和智能手机触控上,我们可以很方便地与无所不在的人工智能交谈。重要的是,我们与软件互动的方式将被永久改变:表单将会消亡,接触点将变成“监听点”。
这就可以解释,为何全球最大的科技公司向语音技术进行了大笔投资。语音技术带来了平台和用户界面的改变,这足以媲美此前的网页和智能手机,而不同之处仅仅只是,用户向语音的转移不需要任何训练。对于这种未来主导性的平台,大型科技公司不容有失。因此,亚马逊已有超过1万名员工从事Alexa项目,而亚马逊也是对语音技术创业公司最热衷的投资方之一。
语音优先界面的黎明
语音技术的影响非常深远,每家公司都需要重新考虑如何与用户进行互动。这不仅仅是调整SEO(搜索引擎优化)等方面的工作,或是开发自己的Alexa“技能”或谷歌的“操作”。
企业最终需要提供能感知情景、语音优先的界面。能建立用户认知和情感连接的企业将可以更好地吸引用户,而如果只是用预设脚本去被动响应用户问题,那么企业将处于明显的劣势。严重依赖通知去驱动应用使用的科技公司可能需要重新审视策略。消费者对于那些用太多通知去打破“声音门槛”的公司(例如LinkedIn)不会再有太多耐心。
最热门的移动应用成为了今天的主导平台,而最能吸引用户的语音优先界面将会成为明天的主导服务。很难预测理想的界面应该是什么样,但下一代Airbnb、Monzo和Uber的出现很可能只要3到5年。
无屏幕手机,例如Light Phone的出现向我们展示了未来,这样的手机不依赖于我们了解并喜爱的移动应用。考虑到语音服务的学习曲线很短,能明显减少用户的使用障碍,因此可以很合理地假设,在我们注意到全部潜力之后,语音经济将快速发展。
语音时代的工作
在我们与软件交互的过程中,所花费时间最长的场景就是工作。因此可以合理假设,在工作场景我们将会看到最明显的变化。尽管我们可能仍然需要与屏幕互动,但键盘很可能会变成多余的。毕竟,普通人每分钟可以用键盘输入40个单词,但却可以说出150个单词。
无所不在的人工智能可以支持我们日常工作中的许多任务和流程,例如回复电子邮件,整理会议信息,向团队成员发布信息,以及用数据更新相关系统等。这也可能意味着,我们将不再被捆绑在办公桌,不必再久坐不动。
更进一步,无所不在的人工智能可以注意到效率最高的员工,并告知他人他的工作方式,从而优化工作产出。能持续识别高绩效者的特定策略,并将最佳绩效建议分发给网络中其他人的人工智能学习循环已经开始出现。这些优化网络不是为了取代人工,而是依靠人类去学习并优化流程。人类仍然会处于循环中。
一个值得关注的案例是Chorus.ai,该服务能加入通话,同时就有效回复做出提示。Chorus.ai并不是给销售电话提供预设的脚本,而是会分析团队成员的不同方法,带来更积极的成果,并鼓励创造性。
通过让人类变得更聪明、更高效,新一代的SaaS(软件即服务)产品将可以收取更高的订购费用,从而成为更具价值的一代企业软件。
从虚拟人物到虚拟医生
我们已经看到,虚拟KOL逐渐兴起。例如,来自洛杉矶、19岁的虚拟KOL莉儿·米克拉(Lil Miquela)在Instagram上积累了150万粉丝,目前已经参与过Calvin Klein等知名时尚品牌的营销活动。
位于旧金山的创意工作室Fable正在虚拟人物方面迈进更多一步。该公司的虚拟人物具有完整的互动能力,并且有自己的个性。很快,我们就能创建人工智能全息伴侣,例如《银翼杀手》中的乔伊。乔伊由Wallace Corp制造,可以成为“你想看到的全部一切”。
虚拟人物很可能会改变娱乐和客服的表现形式,与此同时在给老年人和其他需要帮助的人群提供服务方面也可以扮演关键角色。毕竟,被认为孤独的人群健康下降的风险要高出59%,而社交孤立也是造成抑郁症的最常见原因之一。
总部位于巴塞罗那的Safe365作为由科技驱动的社区和互助网络已经吸引了许多老年人。语音产品提供了对用户非常友好的方式,监控健康和认知能力,并提供关于锻炼和服药的提醒。
事实上,语音和人工智能最终有可能完全取代医生。K Health已经开发了一款人工智能,将数千名医生的经验结合在一起,以做出准确的诊断。借助语音技术,人工智能还可以像人类医生一样给病人提供安慰。
对语音技术融资的分析
根据我们的分析,对语音创业公司的投资正在加速。语音技术创业公司今年已融资7.86亿美元,远远超过2018年的5.81亿美元以及2017年的2.98亿美元。这样的融资增长表明了市场的信心,即语音技术将带来变革。融资的规模也在大幅上升,2019年到目前为止平均交易规模是3000万美元,而2018年和2017年分别为1800万美元和1750万美元。
娱乐和播客是已经吸引了大量兴趣的领域之一。Spotify收购了播客创业公司Gimlet和Anchor,总共花费3.37亿美元。这个领域其他值得关注的创业公司还包括制作语音优先收费内容的Sybel。
与此同时,从2015年成立以来,亚马逊Alexa基金已经进行了72笔投资。过去18个月中,该基金投资的创业公司涉及娱乐、健康、教育、交通、电商、**和SaaS等行业。这表明,亚马逊相信语音技术将改变一系列行业。
我们的分析还显示,在语音技术创业公司的融资活动中,美国处于领先。美国此类创业公司获得了超过10亿美元的投资,而欧洲只有1.18亿美元。这尤其值得关注,因为语音技术代表着范式转换。如果欧洲希望在下一代技术发展中建立自己的地位,欧洲的创业者和投资人需要快速做出响应。
挑战
语音技术领域最大的挑战之一是隐私保护。微软的数据显示,41%的语音助手用户对信任、隐私和被动监听感到担忧。谷歌Nest设备中被发现存在隐藏的麦克风造成了不利影响,而亚马逊申请专利“监听房间里的所有对话”也是如此。
如何回应这些关切取决于科技公司,而苹果在这方面的工作卓有成效。苹果收购Silk Labs值得赞赏,后者开发在设备中运行的人工智能软件,而不必使用云计算平台去处理数据。
苹果在围绕语音服务构建生态方面进展缓慢。实际上,苹果1987年提出的“知识导航工具”给出了更明确的语音服务愿景。语音服务社区期望苹果在2020年全球开发者大会(WWDC)上为开发者社区发布Siri操作系统,从而加速创新和普及。
Voicebot.ai的编辑和出版人布雷特·金塞拉(Bret Kinsella)表示:“Siri操作系统对于鼓励创新是有必要的。许多人认为,苹果需要匹配亚马逊和谷歌语音助手取得的进展。”
《机械姬》等热门电影中提出的一个问题是,如果我们痴迷于机器人,爱上代码而不是其他人,那么人工智能将成为人类的威胁。尽管对某些人来说这种说法听起来很牵强,但约会模拟游戏已被证明非常受欢迎。在中国,名为《恋与制作人》的游戏在上线首个月下载量突破700万。
尽管挑战了我们对隐私保护的观念,就人类与技术的关系提出了新问题,但我们仍然有很多理由对语音技术保持乐观。这种技术将驱动新的生产力提升浪潮,造福消费者、企业和社会。并且,这也将帮助我们更好地照料老年人,同时让全球7.74亿不识字的人群可以使用互联网。
语音时代的预测
键盘的消亡:我们不再需要打字,而是可以使用语音和手势。键盘将在未来5到10年内基本上消亡。
语音技术将带来全新的产品门类,包括无屏幕智能手机。
品牌很快需要通过“声音身份”来被识别,产品搜索将被彻底改变。
因为在使用语音服务时用户不太能注意到具体应用,因此硬件将重新变得比软件更重要。
虚拟伴侣将变成现实,满足你生活的全部需求。
苹果将于2020年推出Siri操作系统,从而在语音经济中推动巨大的创新。到2025年,语音经济的规模将达到1万亿美元,超过移动应用经济。