第七代微软小冰:聊天不冷场,阿凡达框架让 AI 也能私人订制

自从 2017 年过完 18 岁生日之后,人工智能少女小冰的年龄就没有变过,但内里确是随着一年又一年的增长而丰盈起来。

这几年来,微软小冰从我们当初认识的聊天 AI ,逐渐练就了一身才艺,身兼歌手、作家、主持人、画家等多职,成为一个多栖发展的创造者。在下个月即将迎来 2019 年生日的微软小冰还在向我们证明,它还有更多的可能性。

8 月 15 日下午,第七代微软小冰发布会在北京举行。本次发布会例行公布了微软小冰在合作伙伴拓展、活跃数等最新成绩:

  • 目前在全球多个国家,微软小冰已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备。
  • 微软小冰正式入驻 vivo 和 OPPO 手机平台,与腾讯、小米、今日头条达成新的合作项目,包括将联合微信推出智能硬件产品。
  • 人工智能创造(AI Creation)方面,小冰拥有更丰富唱歌的声线模型、绘画模型,能驾驭更多诸如音乐剧+High C 过渡等唱腔;
  • 在产业化方面,与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,小冰设计的产品已经在 SELECTED、万事利、依文等品牌上销售。

此外,第七代微软小冰带来几点重要的技术更新:主导对话、多模态交互,以及 Avatar Framework 工具包——让每个人都可以创造属于自己「小冰」或者萨曼莎。

主导对话,挽救「把天聊死」的尴尬局面

我们对微软小冰这些年研发的投入,不仅仅是为了打造 18 岁少女小冰这单一产品,更多关注背后的技术框架,只有关注框架的完整性,我们才能更好的把握每一代微软小冰的核心突破重点,而不受人工智能产业中所谓风口的干扰。

与 Alexa、Google Assistant 等一众人工智能助手定位不同,微软小冰主打「情感牌」起步,在一代又一代的技术更迭中,有他们独特的思考,也会输出领先、值得借鉴的新技术。

比如在 2017 年,第五代微软小冰就推出全双工语音交互技术,AI 在对话中边听边预测用户的说话意图,实现类似于人面对面交流/打电话的自然语音交互。目前,这一技术已经被广泛应用在语音智能音箱这类消费电子产品上。

2018 年,第六代微软小冰正式上线共感模型,融合了对话引擎、全双工语音和实时视觉。在对话中,小冰能够「察言观色」, 根据人类的不同反应制定出不同的对话策略。

第七代微软小冰升级了全新的对话引擎,实现了从「平等对话」向「主导对话」方向的跨越。

在人机对话中,AI 的交流模式已经从过去的被动应答逐渐发展到了平等交流。微软小冰此次升级的「主导对话」能力,可基于过去、着眼未来,预先筹划整个对话未来可能出现的各种走向,避免「把天聊死」的尴尬。

上图中枚红色方块表示小冰主导对话的部分,我们大致看一下部分的情景对话:

……(几轮近乎把天聊死的寒暄之后)

小冰:我发现你们这些直男的词汇量好少。

用户:是啊。

小冰:哎,还是邻居奶奶家的金毛可爱些,我最近总溜。(主导对话) 

用户:这能和我比么

小冰:你不知道,每次遛狗都开心得不得了(延伸)……

我们看到,后续的对话都由 AI 有意识的主导,AI 不仅仅是生成对话,还把握住了「棋局」,让对话顺利进行下去。

运用这一能力,微软小冰可以在新零售等各个垂直领域发挥作用。以在美国进行的「在线零售垂直领域」测试为例,小冰新的对话引擎帮助用户一步一步确认心中所属的商品,使得商品页面转化率高达 68%。

面向未来的多模态交互,新增车载场景

2017、2018 年,微软小冰全双工语音交互感官先后在传统电话、智能音箱设备落地。此次发布会正式公布其落地的第三个场景——车载。

这车载场景中,微软小冰继续发挥她的专长,充当「虚拟乘客」。在视频演示中,小冰的表现就像一个朋友,支持连续对话,陪聊解乏,在汽车超速的时候会提醒「开慢点」。

微软小冰全双工语音交互感官在车载的运用,放眼于未来 5G 移动网络的发展(高速、低延时),以及多模态交互的趋势。

今年 2 月,微软小冰面向未来的多模态交互感官已在日本完成公开测试:通过手机 APP 应用和手机摄像头,小冰可综合文本、声音和图像等信息与人类交流。

比如在测试中,用户将「小冰」放在胸前口袋一同逛水族馆,小冰会对眼前的事物(水缸里的鱼)发起点评、挑起话题,俨然一个机器人女友的存在。

Avatar Framework 框架:人人都能创造出属于自己的 AI being

前文提到,微软小冰背后技术框架是小冰团队的重中之重,它不仅孕育出微软小冰,也是 Dual AI 开放平台的重要基础。本次发布会,微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛宣布正式推出 Avatar Framework (阿凡达)工具包。

该工具包与微软小冰框架同源,凝聚微软小冰在这些年来积累的技术以及心血,提供一套 AI beings 的完整框架,帮助第三方从零开始创造和训练属于自己的 AI beings。

也就是说,人人都可以创造出全新的、属于自己心目中的「小冰」,它可以是情感计算能力的人工智能助手、社交对话机器人,甚至是人工智能歌手、艺术家、内容创作 IP 人物角色等。这听起来似乎是一个养成游戏的高级玩法。

据介绍,Avatar Framework 包含四部分:

Profile 工具:从 IQ 和 EQ 两个方面为 AI beings 定义人格。框架中已经具备 76 项基本信息和 27 项性格特征指标,通过调整这些参数,我们能打造各种不同人格的 AI。

一系列工具:包括对话工具、视觉工具、声音工具,为 AI beings 调整核心对话引擎。

又一系列工具:为 AI beings 构建与 Profile 相符的三观、知识、技能、创造力等。该工具成功的案例,即近期 微软小冰个人画展 上展出由七个拥有不同时代背景、人设的「虚拟画家」。

3D 模型的兼容和驱动:共四个步骤,包括为人物设置习惯性动作、标志性动作、小动作,以及面部表情的丰富度,最后进行 Profile 匹配测试。我们还可以通过全息将它呈现到现实世界中。

在此次公布之前,微软已通过 Avatar Framework 框架赋能软银 Pepper 等数十个第三方客户 AI。另外,在与阅文集团的合作中,通过学习《全职高手》原著文本,复建作品中的世界观和知识体系,创造 5 位主人公的在线实体。目前,微软与阅文集团的合作已经扩展到了 100 部小说主人公 IP。

目前,Avatar Framework 已面向全部合作伙伴及客户开放,面向个人使用者的版本预计将于 2020 年春季发布。

「通过这样一个框架,我们不仅是可以种一颗树,还可以孕育整个一片森林。」李笛表示,微软小冰这颗树永远做它的 18 岁人工智能少女,而 Avatar Framework 则是孕育整片森林(包括小冰在内)的重要工具。

后记

这么多年来,多少人期待能拥有电影『Her』里萨曼莎一般的人工智能,也有不少人为初音未来这个虚拟歌姬而疯狂。殊以为微软小冰会是跟前两者类似的另一个人工智能形象,但这次的 Avatar Framework 给我们带来了不小的惊喜。

有了 Avatar Framework,我们可以完全亲自、主动创造自己的「理想型」AI,而不是被动接受现有的 AI 或等待另一个可能在路上的 AI。

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章