语音助手的涅槃关头，我们应该完全抛弃屏幕还是选择“语音+图形界面”？

发布时间：2024-11-15 15:42:36

语音助手的语音应该音图涅槃关头，我们应该完全抛弃屏幕还是助手择语选择“语音+图形界面”？

奇点机智联合创始人林德康：前Google高级管理科学家（senior staff research scientist），主攻自然语言处理。槃关抛弃屏幕在加入Google之前，头们林德康是完全加拿大Alberta大学计算机教授，发表过逾90篇论文、还选被引用超过12000次，形界他也是语音应该音图华人圈少数几个国际计算语言学会ACL Fellow之一。

雷锋网按：距离苹果Siri的助手择语推出已经快6年了，期间很多智能手机厂商也纷纷将语音助手列为卖点之一，槃关抛弃屏幕但是头们其使用率一直不高，究其原因，完全还是还选语音助手的功能有限。不过随着深度学习带来的形界技术进展，以及亚马逊的语音应该音图Alexa的大获成功，智能语音助手获得了前所未有的关注，很多人都认为，语音将是下一个流量入口。

上周，乐视推出了带有智能语音助手的手机，这款手机搭载的语音助手就是去年雷锋网曾报道过的创业公司奇点机智的产品——“小不点”。对此，雷锋网对奇点机智联合创始人林德康进行了专访。

“小不点”宣传视频

奇点机智成立于2014年11月，两位创始人邬霄云和林德康曾在谷歌工作，并且在自然语言处理方面都有着深厚的技术和经验积累。该公司曾先后入驻微软创投加速器（MVA）第六期、以及TechCode孵化器。至于为何会选择做语音助手？林德康表示，最主要的目的并不是因为门槛的降低，而是因为语音助手确实有用。

虽然都是语音助手，但是“小不点”和苹果的Siri、微软的Cortana等不同。传统语音助手除了能够执行系统级别的功能，比如设置闹钟、打电话等，功能十分有限，更像是一个“搜索引擎”；“小不点”则抛弃了业界流行的单独的语音对话界面，转而帮助用户用语音来更便捷地操作手机里的各种APP，比如发微信红包、打车、定外卖等，更像是一个“动作引擎”。

因此，使用小不点的用户虽然是用语音在与手机交互，但是同时也在与手机的图形界面进行交互，这就是林德康提到的CGUI——Conversational Graphic User Interface。

模拟点击动作

对于小不点来说，其与同类产品最大的不同可能就是最后的实现过程了。

目前市面上大多数的语音助手度需要集成第三方应用的API，才能实现调用功能，然而这一方法存在很大的弊端，因为这会涉及到与第三方APP之间的谈判，覆盖的速度会很慢，而且很多语音助手都想将其他APP的功能集合到自己的界面之中，因此开发者们往往会有抵触情绪，这也是为什么苹果Siri这样的语音助手在推出这么多年之后，功能依然十分有限的原因之一。