8月22日,微软小冰第五代发布会,微软沈向洋接替已离职的冰赚陆奇,站上了主讲台。钱养
相比国内厂商动辄千人的更迭发布会,已经更迭五代、代进扬言有重大突破的入岁让小冰,依然把发布会的微软规模维持在百人左右。在小冰之父李笛眼中,冰赚这已经是钱养小冰的最高待遇了。
小冰对于微软中国而言,更迭意义非凡。代进这个唯一且完全由中国团队建立并推向全球的入岁让项目,即使有陆奇和沈向洋的背书,也走得非常艰难。
三年之后的今天,沈向洋将小冰的地位做了一次提升——与 infuse AI、Bing and 小娜一起,成为微软人工智能三条产品线的其中之一。
这样的提升,沈向洋有自己的理由。在外界看来,小冰只是一个聊天机器人,但对微软来说,小冰是一个向 EQ 方向发展的情感计算框架。依靠这个情感计算框架,微软能够在 EQ 这个方向上,将人工智能无限接近人类,“让人们能强烈地认知到她地存在”,并有可能成为“某个家庭中地成员”。
同时,这也是一个明确的信号,既然放在了“产品线”的位置上,也就意味着,小冰更迭到第五代,考虑商业化的时刻到了。
沈向洋在战略层面给出指示后,小冰首席架构师周力和小冰项目负责人李笛先后上台,分享了应用在小冰 5 代上的技术创新以及商业落地情况。
雷锋网了解到,两项技术创新分别是 1:1 生成模型和高级感官。简单来说,前者能够让小冰自己创造回应;后者则可以支持全双工语音和实时流媒体视觉。
1. 生成模型(Generative Model)
生成模型往往被拿来和判别模型做比较,从数学角度来说,前者是对 P(x,y)进行建模,后者是对 P(y|x)进行建模。在应用上表现的差异是,生成模型通过学习,能够有能力生成新的东西,而判别模型只能找出差异。
具体到小冰的应用,上一代小冰虽然拥有十亿级的大数据语料库,但都是互联网上的已有数据,小冰只是通过分析,理解用户的问题,继而从语料库中回复。使用生成模型后,小冰能够从中习得能力,自己创造新的回应,这意味着她与人类交流的每一句话,都可能是这世界上从未出现过的。
目前,小冰 5 代已全面在线上产品中使用生成模型。其中,中国、日本、美国和印度小冰部分使用,印尼小冰则完全使用生成模型。微软官方表示,这是全球开放领域人工智能对话中,第一个百分之百使用生成模型的落地产品。
2. 高级感官
小冰的高级感官包括两个部分,一是全双工语音,二是实时流媒体视觉。
全双工指的是在发送数据的同时也能够接收数据,两者同步进行。而双工则如同“单行道”一样,一个时间段内只有一个动作被允许发生。也就是说,小冰在说话的时候,也在随时等待被打断,接收着用户的语音,甚至要去判断用户是否已经说完、何时可以打断,被打断时是否及时停止、何时打破沉默等更为复杂的问题。
实际上,去年9月,小冰在有信网络电话中开始尝试全双工语音;去年年底,小冰又跟中国科技馆合作,把小冰网络电话亭放在科技馆的二楼。到今天为止,小冰已经接听了来自人类超过50万通电话。而小冰5代,可以直接通过电信运营商,拨通用户的电话。
实时流媒体视觉指的则是让机器模仿人类视觉的微妙之处。周力向雷锋网介绍说,一个人每天有十几个小时都是睁着眼睛的,但是绝对不会每时每刻都对所见之物发出评论,人类视觉的精妙之处,不仅仅在于能够去理解每一个瞬间,或者每一段时间的画面,更关键的是能够理解什么是不重要的,什么是重要的。
小冰5代的实时流媒体视觉,并不像视频监控软件一样,去捕捉一个个画面,分析一个画面,更像是人类一样,感知位置和移动,体察表情和动作,理解不同场景和角色,以及人与人之间的关系,最后根据视觉的理解,做出具有情商的互动。
1. 版图扩大
雷锋网了解到,自 2014 年微软在中国市场推出小冰之后,微软优先选择人口数量超过 1 亿的国家,在当地建立完全本土化的团队,从当地取得初始训练语料,并以每年覆盖一个新国家进行扩张:
2014年,微软推出中国小冰
2015年,微软推出日本小冰
2016年,微软推出美国小冰(Zo)
2017年2月,微软推出印度小冰(Ruuh)
2017年8月,微软推出印尼小冰(Rinna)
很明显,进入2017年,小冰加快了全球扩张节奏,同时也正如上文所说,建立在 LINE 平台上的印尼小冰,率先使用了完全的 1:1 生成模型,可以完全自创回应,而非像其他地区的小冰那样,通过分析用户的问题,在语料库中寻找最合适的回答。
目前,小冰在全球拥有超过 1 亿人类用户,对话数据超过 300 亿轮,最长单人连续对话记录,达到 7151 轮,进行了 29 小时 33 分钟。
2. 全面进入 loT 领域
从今年 6 月起,小冰和小米 loT 开放平台达成合作,用户可以通过小冰,控制 35种小米智能设备。此外,微软还正在与其他诸多loT 厂商,比如智能照明厂商 Yeelight、东方明珠等进行合作,共同研发新产品。
此外,微软还发布了小冰电台,率先上线的是微信小程序版本,loT 版本正在研发中。小冰电台是一个通用的人工智能实时内容创造和交互平台,它可以基于多重来源,面向任何主题,自动创造永不间断的电台节目。同时,它还能根据与用户的互动,实时改变节目内容。
此前,小冰已经在两家电台担任主播。
3. 内容创造
在内容创造方面,除了众人熟知的写诗之外,小冰还在有声少儿读物、歌曲、新闻等领域试水。根据微软官方数据,小冰创作的有声少儿读物质量已超越98%的人类创造者,用时仅为同水平人类的1/500,成本仅为同水平人类的1/80000。
此前,小冰通过匿名账号在喜马拉雅、蜻蜓FM等平台发布,也取得了不俗的效果。发布会上,李笛宣布,微软将通过小冰,开始大规模生产有声读物并投入市场。
李笛也认为,小冰除了可以创造内容外,还可以包揽运营、传播、市场等工作,干整个产业链的活。如果得到市场验证后,相信会对整个内容行业产生变革。
4. 智媒体商业平台
在媒体方面,小冰作为《钱江晚报》的专栏记者不是什么秘密,在发布会上,微软还公开了部分百度百家和今日头条上的新闻内容也由小冰撰写而成。
基于过去“写稿”的经验,以及与 Bing 搜索引擎的加速整合,微软发布了智媒体商业平台解决方案 3.0,其中包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。
新的解决方案可以为媒体构建出一个基于全球新闻数据源的媒体知识图谱,挖掘每一篇新闻背后的知识与含义,并找出彼此的关系。同时,用户也能够能够在和小冰的交互中,获得推荐内容,把被动的阅读体验逐步变为主动的交互信息交换。
在过去一年中,该解决方案的2.0版本已从微信、微博双平台,逐渐演进为接入和即将接入近11个端媒体,与《看看新闻》、《封面》、《钱江晚报》、《春城晚报》等媒体端进行了整合。
再过26天,就是小冰的生日,理论上来说,过完生日的小冰就19岁了。但李笛说,对于是否要长大一岁,团队内部还未达成一致,原因是虽然小冰取得了很大进步,但她依然是一个稚嫩的少女,还没到成熟的阶段。
但整场发布会看下来,围绕小冰商业落地的部分占了绝大多数,这样看起来,运作3年,更迭五代,即将进入19岁的小冰,要试着给微软赚钱了。