先看一则新闻:Facebook今天推出了依托在Messenger上的虚拟助手M。这款虚拟助手借助AI+人工的方式为用户提供服务,M背后的人工运营者被称为M trainers,是Facebook公司里的合同工,而非正式员工。除了提供服务,他们还有一个任务是收集数据训练AI。在功能上,M除了常规的问答、信息查询外,还包括餐馆预定、购物等。目前M还在内测中,只支持文字输入,不支持语音。
微软有Cortana,Google有Google Now,苹果有Siri,Facebook终于也有了自己的M。当然,创业公司里面还有一堆Magic模式的虚拟助手。面对雨后春笋般扎堆出现的虚拟助手,今天我们不妨换一个角度,用人机交互的视角来看虚拟助手的意义,或许会发现一些更有趣的东西。
移动时代,智能手机是人们的主流设备。这款设备承载服务内容的形式是应用。现在,回想一下你是怎么通过这款设备、借助应用的形式去获得互联网提供的服务内容的?
以打车和订餐为例子好了:你首先点亮屏幕,然后在桌面上找到滴滴打车或者Uber这个APP,然后点开APP,用文字或者语音输入目的地信息,如果APP定位不够精确的话,你还要手动输入上车的位置、选择车型。预定一份外卖比打车还要复杂一些:点开APP后,你需要在列表里浏览很多不同的餐馆,看价格,选择菜品,然后下单、付款、输入付款密码等等。
在这两个例子里,操作可能需要七步甚至更多。在操作的同时,还要等待APP打开时的启动画面、点掉不时出现的广告。总的来说,这样的体验效果不是最好的,操作成本还是挺高的,效率也是挺低的。
而虚拟助手的出现能有效解决这个问题。通过虚拟助手预定一份外卖,流程要简单得多——你只要给虚拟助手发送一条消息,告诉它你想吃什么,它就会帮你搞定其他所有的事情。
从这个角度来说,虚拟助手是一种Hybrid APP。你可以把它看成是“应用上的应用”,Hybrid APP就是那种“One APP to rule them all”的 APP——这个超级 APP可以像微信那样吃掉其他所有的APP,而且它比微信还要强大,因为它连应用的UI都没有,但交互的成本比拥有UI的APP 来得低,IM的操作形式也更自然、更人性化,效率上的提升也非常显著。
虚拟助手,或者说Hybrid APP,之所以能做到这一点,在于它拥有AI+ 人工模式的服务后台。在这个后台里,所有用户的消息请求被汇入到专门的处理系统里,经过电脑AI前期的粗糙的处理,然后分发给不同的接线员。这些接线员坐在位置上,他们面前有功能特定的电脑,电脑上有专门的软件,他们通过特定的机器工具来批量化的完成用户消息的处理。
仔细分析下这里的过程其实很有趣:人们为了获取互联网的服务内容,在APP上面耗费了大量琐碎的操作步数和操作时间。虚拟助手通过人工+AI的形式,在后台把用户这些分散的操作全部收集起来,借助定制化的机器、系统和技术,集中统一的进行批量化的处理。这样的好处是用户不需要和APP进行交互,操作时间和操作步数大大减少,而后台的接线员则像车间流水线的工人一样高效运转。
这样一来,总的效率是提升的——我们假设一个后台接线员一天工作八小时,平均每天可以处理200个消息请求,那么每小时就可以处理25个消息,每个消息的操作时间就是2.4分钟。每个用户单独操作APP完成一次外卖预定的时间如果需要3分钟的话,通过虚拟助手这种集中化处理,每单操作的效率就提升了0.6分钟,总的效率也是提升的。退一步讲,即使总的效率保持不变,只要用户拥有的两分钟时间的价值更大的话,这样做也是有意义的。
那么为什么我们到了现在这一时间节点,虚拟助手这种东西就开始大规模的冒出来了呢?在PC时代为什么不会有这类需求和想法?
原因可能是这样:
1、在PC时代,互联网本来具有的服务内容相比移动时代就少了一个量级——那时我们不会频繁的订外卖,更没办法打车。当服务内容的量级没有明显暴涨,获取服务的操作成本相对就不是那么重要了,也不会有人关心获取服务的效率。
2、在PC时代,个人电脑承载互联网服务内容的形式是网站,人们通过浏览器和搜索引擎去打开一个个的网站,而所有提供信息、内容、服务的网站都是互相打通最后统一接入搜索引擎的。所以,一个搜索引擎就可以快速获取到所有的内容。但到了移动时代,手机承载互联网服务内容的形式是应用,这些APP互相之间是不打通的,一个APP就是一座信息孤岛。因此,我们在移动时代缺少一种“通吃”的交互方式。
总的来说,在移动时代,人们的需求和可以满足需求的服务内容,都在井喷式的增长。但因为智能手机这款设备的限制(屏幕的大小、触屏的交互方式),需求和服务内容之间的连接还不够高效,获取服务内容的成本也还太高。
讲到这里又有一个很意思的图。
解释下这个图:人们创造机器是为了利用机器替人们完成一部分的事情,让人们做事更快更有效率。机器可以粗略的分成三个部分,设备、技术和交互界面。设备是PC或者手机;技术包括定位、图像处理、语音识别这些东西;界面交互很好理解,在PC时代是屏幕鼠标和键盘,移动时代是人的手指和触屏。
这三者互相关联,任一一项进步发展或停滞不前,都会拖整体的后腿。而这三者整体决定了依附于这个机器所产生的商业模式。比如,PC时代的技术在语音和定位方面几乎没什么进展,所以PC上不可能诞生LBS类的商业模式,主要商业模式是搜索和网站广告。
到了现在我们身处的移动后时代,语音和图像识别等技术已经有了不错的进展,设备主要还是智能手机这种主流形态,但芯片算力、显卡方面还在进步——最久没有经过革新换代的或许是界面交互。
虚拟助手的大面积萌芽让我感觉,界面交互或许远比我们想象的重要得多。
当虚拟助手作为界面交互的另一种突破时,Hybrid APP或许会成为手机 “最后的守护者”——你打开手机,屏幕里只剩下一个拥有很萌的外表的虚拟助手,它冲你笑,问你需要什么帮助,而其他所有的那些东西都消失了,包括APP、桌面、甚至是手机操作系统。
原创文章,作者:ioued,如若转载,请注明出处:https://www.iamue.com/8999/