「声智科技」获 2 亿元 B 轮融资,注重“远场语音交互”产品的落地应用

36氪获悉,声学语音技术和语言智能服务提供商「声智科技」(SoundAI)近日已完成 2 亿人民币的 B 轮融资,由毅达资本领投,峰瑞资本和正居资本跟投,中关村银行和InnoVen Capital联合参与。 本轮融资将主要用于 声学前沿技术和人工智能交互技术的研发和迭代,加速业务拓展以及产品和平台服务的规模化落地应用。

36氪此前报道过,声智科技曾在公司成立之初获得1200万元的天使轮融资、后续获得1600万元的Pre-A轮融资,2017年9月,又获得近亿元人民币的 A 轮融资,由百度、蓝港互动、洪泰基金、峰瑞资本联合财务投资,北京银行以投贷联动方式参与。

该公司成立于2016年4月,拥有约200人的团队,主要提供基于SoundAI Azero的智能交互系统和服务、以及包括芯片、模组、开发板和整机产品在内的软硬件智能交互解决方案。

其智能交互系统 SoundAI Azero 融合了远场语音交互和远场实时通话技术(“远场”是指5米以内),已经广泛应用于包括智能音箱在内的一系列智能家居产品,并逐步拓展到智能汽车、智能安防、智能金融、智能教育、智能医疗、智能法院、智能交通和机器人等行业。

目前,该公司服务的 B 端客户主要有小米、百度、阿里、华为、腾讯、联想、创维、金蝶、浪潮、极米、国美、朝歌、中国移动、奇虎360、中央人民广播电台等。

图源:声智科技

虽然客户需求千差万别,但声智科技首先搭建了一个标准配置模式,以用于规模化普及。 CEO陈孝良告诉36氪:“我们既要满足客户的这种差异性需求,然后又要 保证我们系统平台的兼容性,否则的话,就会掉入一家项目型公司了。”

声智科技不想做一家项目型公司,也不想做一家只研究AI技术的公司。 相比同行,声智科技有两个比较鲜明的特点:

第一,注重技术和商业的平衡。陈孝良说,做科研的人往往习惯用线性思维想问题,但产品要落地和商业化,面对的是非线性的世界。做智能音箱,考验的不只是技术,更是产品、市场、管理等各个环节的综合协同。 对于他们这样的技术服务商来说,只强调某项AI技术的先进性是不够的,更需要关注的是,这项技术对于产品的重要性、对于用户交互习惯的影响、以及能否帮客户解决问题。

第二,在技术架构层面,注重物理学和计算机科学的融合。陈孝良说,深度学习和神经网络可以解决“人的对话”这个非线性问题,但它们不是万能的。对于智能音箱来说,物理声学其实更能直接地解决真实场景下的远场语音唤醒和识别、远场声纹识别、声视频融合交互、多人追踪和识别等影响用户体验的关键问题。

目前,声智科技的技术研究涵盖了 近场和远场的声学场景,提供芯端云全栈的技术链条,包括智能声学传感、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、场景语义理解、自然语音合成、超远场声学监控、局部场语音识别、分布场语音交互、深度学习与小样本学习、声学芯片设计等技术。

图源:声智科技

谈及AI公司普遍遇到的量产问题,陈孝良说,量产确实是挑战。 以智能语音设备为例,以前的很多设备生产线不支持麦克风阵列,芯片和传感器也都存在不适配的问题,为此,他们专门成立了一个团队去保障用户能顺利量产,解决平台服务变现所需的量级推广问题。

陈孝良说,他们在2016年刚开始推广智能音箱的时候是非常痛苦的,因为当时大家还不认可语音交互这种产品的实用性和商业潜力。但在过去两年间,这个市场局面打开了, 智能音箱成为全球最成功的人工智能产品。

确实,对于中国的智能音箱市场来说,2018年是急速爆发的一年。在百度小度、天猫精灵、小米小爱等几个巨头争持不下的时候,荣耀、锤子科技等智能手机厂商也开始入局智能音箱市场,各路玩家也都开始进行全品类、多场景布局,这些因素都会进一步激发智能音箱市场的商业潜力、刺激其背后的声学语音技术和人工智能交互技术的快速迭代。

根据声智科技提供的资料,领投本轮融资的毅达资本董事长应文禄曾表示,人工智能、生命科学、机器人、5G、云计算、智能制造等产业是他们未来的重点投资方向。毅达资本 投资总监李丹称,远场语音交互是最自然的交流方式,为家庭、车载、教育、医疗、金融行业带来了非常良好的用户体验。而声智科技的团队来自中科院、腾讯、杜比实验室等科研机构和企业,有深厚的技术积累,这是他们所看好的。

——————

我是36氪记者王艺瑾,业务交流可添加微信catherineyijin,请备注姓名+职务。

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章