[图]Google通过Pixel 2中的AI技术来增强听歌识曲功能

离线听歌识曲(Now Playing)是预装在Pixel 2系列旗舰中的特有功能之一。而现在这项功能背后的人工智能技术已经运用在Sound Search功能上,该功能主要出现在Google搜索和Google Assistant中的Sound Search中,能够在支持这些服务的任意设备上提供更快更精准的结果。

尽管Now Playing功能在离线状态下工作,而Sound Search需要网络连接。想要使用后者功能,需要在手机端启动语音命令然后说出“What’s this song?”命令来聆听你身边正在播放的歌曲。

在Pixel 2系列设备上想要听歌识曲,首先人工智能会通过设备的麦克风来录制大约8秒长的音频片段,并在每秒间隔中创建7个嵌入段(小型声音样本组)。然后根据设备 数据库 进行两次匹配,第一次为快速粗略查找,而第二次查询为详细搜索。Google也会经常更新包含新歌曲的数据库。

Google已经引入了三项重大改变来改善Sound Search,包括

● 四倍大小的神经网络将麦克风录制的声音转换为嵌入空间

● 增强音频嵌入的密度,从此前的1秒增加至0.5秒,实现更快、更准确的匹配。

● 更改了数据库中索引的权重,以快速识别流行歌曲

根据外媒进行的简单测试,发现Sound Search的听歌识曲功能更加精确,能够成功识别Cimorelli的The Middle以及Rajiv Dhall的Starboy。

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章