智能读写 机器人 供应商「世通亨奇」已于2018年完成500万元人民币天使轮融资,投资方为中科院创投。本轮融资主要用于产品研发和市场拓展。
「世通亨奇」由中科院空天信息研究院孵化,核心技术包括函数计算、知识图谱、本体推理、多文档摘要等,目标是对互联网公开信息进行智能重构,对海量、杂乱无章的数据进行有序组织和提纯。
该公司创始人兼CEO黄宇告诉36氪,目前很多大数据公司都只是对特定机构的内部数据进行挖掘和应用,而对互联网公开数据涉猎较少。而互联网公开数据往往呈现出海量化、碎片化、无规则、不同层次分布、数据源不确定的特点,导致大家在搜索引擎和信息推送软件的帮助下,也仍然不能找到自己想要的信息。
针对这个痛点,世通亨奇研发了智能读写机器人,从全球新闻媒体、社交网站、政府网站和各类专业数据库采集信息,利用深度学习和自然语言理解来自动分析大型数据集,并自动生成与人类分析师相当的报告,帮助信息从业者解决“阅读”和“写作”这两个最耗时耗力的环节。
围绕这个思路,该公司研发了Plat-X产品体系,囊括了四个产品:黑曜、堇青、琥珀和机器人工厂。
Plat-X黑曜是该公司所有产品的基础架构,也可作为独立产品出售。该产品是向开发者和企业提供全托管、无服务器的函数计算架构,具有AI云服务市场、资源弹性伸缩、开箱即用、多语言支撑等能力,可以节省大量人力资源,因为开发者只需要关注自己的业务逻辑代码,不需要关注服务器配置、系统部署和分布式改造,即可实现一键部署、多云混合部署和私有裸金属部署等能力。
Plat-X堇青是数据采集产品,可按照用户的语义需求、自动感知数据源,并对不同类型和格式的数据进行智能统一结构化提取、语义相似度分析和主题聚合。同时,该产品可以提供面向全球分布的安全采集网络。
PlatX琥珀是基于动态本体技术,提供全平台的数据抽象建模能力。黄宇表示,动态本体是知识图谱的升级,在建立数据之间联系的同时增加二阶逻辑表达,从而实现图谱的动态更新与推理能力。动态本体是以“4W+E”为核心建立世间万物的联系,进行多源数据的融合、推理和验真。这里的“4W+E”指的是“when”、“where”、“who”、“what”和“event”。
Plat-X机器人工厂产品主要是通过组装前三款产品的功能部件、搭建信息生产线。该生产线的流程是:数据采集和聚合->关键要素提取->动态本体链接->关系构建与推理->要点提炼->报告生成。
黄宇表示,Plat-X产品体系现阶段以非结构化文本为处理主体,下阶段会进行多语种提炼和报告生成,未来会延伸至处理图像和视频信息等多媒体信息。
目前,世通亨奇的读写机器人主要用于军工领域。黄宇称,目前军工方向的市场规模已达千亿元人民币,年复合增长率会超过15%。此外,他们也正在把智能读写机器人应用于金融二级市场、企业营销、新闻自媒体等领域。
黄宇表示,他们的情报读写机器人今年预计收入3000万,并将取得多项国家重要资质。此外,他们正在与中科院相关单位合作成立联合实验室,建立常态化人才培养机制。
该公司目前正在寻求Pre-A轮融资。
世通亨奇团队有30人,总部在北京。黄宇是中科院电子所博士、硕士生导师、国家科技进步一等奖获得者,师从国内信息领域院士,在NLP、图像理解和人工智能产品系统架构设计方面有11年研究经验。团队核心成员来自IBM、微软、腾讯研究院、帝国理工、北大等,具有多年技术研发和企业服务经验。