打造“操作系统” 搜狗开放AI技术赋能录音笔行业

8月28日,以“全新声态,AI未来”为主题的“搜狗听写服务开放暨AI创新联盟成立发布会”在京举行,除了发布全新炫彩版AI录音笔C1之外,搜狗宣布将面向录音笔行业全面开放听写服务,并联合Newmine纽曼、爱国者、万成集团、索尼录音笔四家录音笔头部企业成立AI创新联盟。此次发布会由搜狗CEO王小川亲自开启,不仅有搜狗CTO杨洪涛、搜狗公司AI交互技术中心总经理王砚峰等核心层共同出席,更有纽曼、爱国者、万成集团、索尼录音笔一众高管现身捧场,消息一出,业界侧目。

那么,原本是竞争对手的纽曼、爱国者、万成索尼为何会心甘情愿走到一起?这次发布会又为何会备受业内外关注呢?

服务加持,AI重新定义产品形态

关于录音笔,相信大部分人都不陌生。功能单一、产品数年如一日没有本质创新跟不上互联网和移动互联网发展步伐,这几乎就是现阶段录音笔给大众留下的基本印象,也是近几年来智能 手机 全民普及和其他附带录音功能电子产品兴起之后,录音笔受到挤压、市场销量整体止步不前甚至出现下滑迹象的重要原因。不过,在得到搜狗听写服务加持之后,录音笔的产品形态将被重新定义。

基于搜狗听写服务,不论是市场上现有的任意品牌的录音笔,或是未来研发上市的新品,都可以集“快速转写、多端同步编辑、智能纠错、云端存储、便捷分享”等功能于一体,满足用户录音文件整理的全部需求,让用户实现“录音1小时 转写5分钟”的畅快体验,同时转写准确率高达95%。

可以说,接入AI听写服务的录音笔,将突破了传统录音笔的局限,严格来说不能再单纯称之为录音笔,而是一个全方位的语音记录、转写、编辑、存储和分享工具。

变革行业产品创新,源于雄厚技术积累

当前商业环境下,用户体验是决定产品生命力和市场竞争的“胜负手”。接入搜狗听写服务后,将有效改善此前录音笔存储传输不便、转写文本需反复听取等诸多不足体验,帮助合作伙伴实现“录音、转写、编辑、存储、分享”全链路打通,根本原因在于其雄厚的技术积累和独特的AI优势。

首先,搜狗AI一直坚持以自然语言处理为核心,其在语音识别、语音合成、语义理解、机器翻译等方面的独特优势,为搜狗听写服务打造了良好技术基础;其次,搜狗拥有互联网规模最大的语音数据,依托于语音请求峰值达到7亿人次的搜狗输入法,机器在不断学习之后,识别准确率会越来越高,可应用的场景也会越来越广泛。

目前,搜狗听写服务背后的转写技术已处于行业领先地位,其实时语音转写运用了搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术,非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上。同时,基于搜狗输入法的海量用户数据,搜狗听写服务能够自动构建个性化识别网络,使用户常用语错误率下降40%;在语音增强方面,搜狗自研的Smart Voice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原;在智能辅助编辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备了良好的自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供更多便捷功能。

AI 赋能,推动行业生变革新

人工智能是新赛道,近两年来,AI技术与各行业的改造融合已经成为一种趋势,录音笔行业同样如此。尽管此前市面上已经出现了基于AI的录音笔,但仅限于单个产品或某个企业的创新,像搜狗这样面向录音笔全行业提供AI技术支持的先例绝无仅有。

正如 微软 在PC领域推出 Windows 、Google在手机领域推出安卓系统那样,搜狗此次开放听写服务,某种意义上来说是在录音笔领域打造了一套“操作系统”,在为合作伙伴赋能的同时,将给行业带来颠覆性的变化。未来,在搜狗听写服务开放并得到充分使用、在AI赋能效应充分发挥之后,录音笔行业会迎来跨越式发展。早上车早出发,这也正是纽曼、爱国者、万成集团、索尼录音笔愿意在变革初期就加入搜狗发起组建的AI创新联盟的重要原因。

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章