AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

文 | 何忞来自雷锋网(leiphone-sz)的报道雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路。雷锋网将其编译如下正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角...

 
雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路,来自雷锋网(leiphone-sz)的报道 雷锋网将其编译如下
文 | 何忞

正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角下,我们在思考机器学习(ML)如何在解决人类的需求时发挥自身的独特性。我们的团队集合了 Google 整个公司的各种人才,为 UX 用户带来机器学习的核心概念,让用户了解如何将机器学习和人工智能完美地融合到交互设计中。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

由谷歌AI相机Google Clips camera捕捉的父母、孩子和宠物的真实时刻

Google Clips 是谷歌的一款 AI 相机,专门用于捕捉身边人的精彩时刻。设备自带的人工智能可以通过机器学习了解到谁是你最亲密的身边人,并且知道如何才能拍出一张漂亮又令人难忘的照片。今天,我们将以这款 A I相机为例,详细阐释在这三年中,我们是如何构建出产品模型、进行工业设计和用户界面的。通过这篇文章,我们希望大家能够了解如何用以人为本的方法来设计 AI 产品。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

AI 相机可以放置在固定的框架上,并保持静止。上图中,我把相机夹在了篮筐上,抓拍到了我儿子打篮的精彩时刻。

只是将更多的 UX 用户分配到机器学习的项目中是远远不够的。更加关键的是让更多人了解到机器学习的核心概念,充分理解 AI 的能力,并能够围绕最佳实践产品来构建和维护信任。其实,从确定在产品构建中哪些模型是有用的,到数据的收集和注解,以及新颖的原型机的建造和测试,机器学习生命周期中的每一个阶段都是创新的时机。

首先第一个问题是,为什么采用以人为本的方法来构建机器学习产品和系统是非常重要的呢?我们认为有以下几个原因:

  • 机器学习本身并不会找出现实中需要解决的问题。如果你在设计中没有考虑到人的需求,那么你只是建立一个非常强大的系统来解决一个非常小或者根本不存在的问题。

  • 如果 AI 系统的目标不明确,并且用户对自身在调教系统中的角色认识不清,那么用户就会根据自己对 AI 的理解或想象来看待系统,这会让他们的信心受到影响。

  • 为了迅速发展,机器学习必须适应多学科的任务,即使不需要太多学科,但如何适应人类社会系统应该是一个需要面临的技术问题。机器学习是根据它在数据中自动发现的模式和关系进行预测的技术。一个 ML 模型的工作是要弄清楚这些自动发现的这些模式有多大可能出错,从而尽可能地保证通常的预测尽可能地正确。但这是远远不够的。从一开始建立模型的思路,到选择训练用的数据源到样本数据本身、以及用于描述和标记数据的方法,一直到模式关系对错的判断标准,机器学习系统的方方面面都是依靠人的判断来调整和修正的。总之,那句 UX 的公理“你永远不如用户了解他自己”,在这里显得异常重要。

三种以人为本提升AI设计的方法

解决人类的真正需求

今年,人们将会使用我们的相机拍摄大约一万亿张照片。在面对如此庞大的数字照片库时,我们中的很多人实际上并不会仔细浏览。新手父母尤其如此,感受宝宝的每一个第一次就是他们的日常生活。在那些珍贵而短暂的时刻,人们已经习惯使用他们的手机相机,希望能够为未来捕捉和保留一些回忆。但最终的结果是,人们用一个小小的屏幕来取代所有的感官,与世界的互动反而更低了。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

作为一个新手父母,你的照片库可能看起来很像我的上面手机照片——连续地拍摄,以捕捉孩子最完美最可爱的表情。

因此,我们在想,能不能创建一个产品,帮助我们更加关注我们关心的人呢?能不能让我们出现在照片中,而不是总躲在照相机后面呢?我们能不能“即时”拍摄照片,而不必停下来,拿出电话,打开相机,在镜头中对焦,保持这一刻的真实呢?我们能不能让一个摄影师在我们身边随时捕捉更多真实的生活时刻,比如孩子们的真正微笑呢?那些真实而转瞬即逝的时刻,往往让我们觉得甚至永远背着相机都不可能全部捕捉得到,而这就是我们这款 AI 相机打算满足的人类需求。

引导机器智能

产品设计之初,最迫切的问题是:如果人们拍摄了大量的照片,但其实并不想回头去整理它们,那么我们要如何标注数据呢?这就是基础的“以人为本的机器学习”项目诞生的起点:描述理论上的人类“专家”执行任务的方式。这个理论有两层含义:第一,如果连人类也无法完成这个任务,那么 AI 也不可能完成; 第二,通过深入研究专家完成任务的方法,我们可以找到一些信号来指导数据的收集、标记和组件模型的架构。

当时我们能想到的最接近“专家”就是一位婚礼摄影师,所以我开始了采访工作。我们通过代理进行招聘,并且使用了一个非常模糊的招聘信息“秘密项目!摄影!”。经过一番筛选加上一些运气,我们最终发现了一个宝库——一个纪录片制作人、一个摄影记者和一个美术摄影师的专业素材。我们一起开始收集团队成员的镜头材料,试图回答“什么是令人难忘的时刻?”

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

在评估我们的照片和视频的质量时,我们必须意识到很多细微之处、人们的审美本能和个人的生活历史,这些在过去都被我们所忽视了。例如,每当我看到我的小儿子在探索一根弯曲的吸管(左边),或者我去偷亲他(中间)时,我的心情就会泛起涟漪。当我看到我的大儿子在公园里骑自行车的时候(右边),我便非常自豪,因为我记得那一天是他第一次独自骑车。

建立信任

这个项目的初始假设是:我们可以向机器学习模型展示我们认为美丽而有趣的东西,然后它会学习如何找到更多这样的东西。我们对于图像的景深、构图原则、光线强弱、视频剪辑、情节设计等方面的处理显得较为随意,但遗憾的是,我们发现,永远不能低估人类运用常识和本能的能力。

这些早期的实验暴露出一些关键的技术差距,也帮助我们重新评估了我们对产品的假设,让我们真正明白了这项工作的本质。我们转变了工作方式,机器学习并不是我们所认为的那样“神圣”,它只有在相当简化的框架下才能有效地学习。打个比方,当时的我们就像在用莎士比亚而不是“Go,dog,go!”来教一个两岁的孩子英语。对我来说,这就是 AI 这个“庞然大物”走下“神坛”的时刻——AI 并不意味着一种可以理解所有事物、并且可以将学到的知识自行推广的单一“智能”。不,它差远了。

回归基础

“一致性”是教授任何东西时秘诀。比如我们在教孩子们英语时,为了正确发音,我们会不断地重复同一类词汇(如 tough, through, thorough 中的 O-U-G-H,或 cat, bat, sat 中的 A-T),通过一致性,我们可以预测更多同类的词汇发音和拼写。

而信心便来自一致性。试想一下,当一位老师提供两个似乎并不一致的例子时,大多数学生会立刻指出其中的不协调。但是算法并不会提供这样的反馈。就算法而言,除非另有指示,否则为算法提供的所有内容对算法而言都具有相同的价值。对于 Clips Camera 来说,这意味着我们不仅需要示例间的一致性,而且还需要每个示例中的一致性。AI 需要对每一个单独的框架进行具体预测。同时我们还需要教会它哪些内容可以被忽略。

捕获图像

我们需要训练模型学习什么是不好的图像:比如手挡在镜头前、快速晃动、镜头模糊。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我们使用上面的例子来训练机器学习模型来识别相机是在口袋或钱包里面(左图),或者相机被手指挡住时(右图)。虽然训练模型去忽视某些东西的好处并不能立即体现,但随着时间的推移,它会成为我们设计中的关键战略部分。这种训练能够让相机减少无效照片的拍摄浪费,捕获图像的总体质量将会显著上升。

构图问题

我们需要训练模型以保持图像的稳定性、清晰度,还要正确的取景。如果不稍加注意,面部探测模型就会将画框中心和边缘检测到的面部同等对待。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

为了训练模型保持对某个对象的连续性,需要特别强调一些特殊的例子。比如上图中,左边是我的小儿子全程都处在焦点范围内,而右图中我的大儿子只有 5% 左右的时间处在焦点中。

确定人物

熟悉你是为你拍摄的前提:你将相机对准某人时,他们通过微笑或摆姿势来暗示同意,你才能按下快门。并且,摄影师才是那个决定取景和构图的人。所以对自动相机而言,我们必须根据社交线索来确定你想要和谁一起拍照,我们可以根据你和他人相处的时间长短来确定是否拍摄有关他的照片。

编辑

多样性和冗余问题在我们拍照时并不是什么大问题,因为 我们脑海里总会有一个小小的声音说:“我们还没见过这个,需要拍下来!” 或者 “你已经拍了太多孩子的照片,可以停下来了。”,但是我们的 AI模型在这方面则需要很多的帮助。

我们从三个方面来处理多样性:

  • 时间:时间是最简单的图像捕捉信号。相机不能停工太久。

  • 视觉: 颜色微妙或戏剧性的变化可以说明环境和活动的变化。可以据此捕捉独特的精彩时刻。

  • 人物: 你正在一大群人当中,还是独自一人?让相机理解你正在和多少不同的熟悉面孔在一起,是不错过你人生重大时刻的关键。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我把 AI 相机放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们搭积木的场景。同时,这也意味着我在相当长的一段时间里,向相机展示了一堆非常相似的内容。既要避免不必要的冗余又不能错过太多的精彩时刻,这在很长一段时间里都将会是一个非常复杂的 UX 挑战。

用户信任和自我效能

我们投资在 AI 相机上的一个原因是想要向大家展示出,设备自带的用户私人机器学习系统有多么重要,当然还有它其他非常强大的功能特点(例如,它只需要很少的电量,设备不会发烫,而且设备处理器不需要网络连接就可以快速而可靠地工作)。相机是一个非常私人化的物品,而我们一直在努力保证这一特性——相机硬件内容和机器智能都只属于你一个人。所有的一切都会永远保留在你的相机里,除非你自己将它公之于众。

概念设计

我们着眼于用户的信任和自我效能,在用户界面设计中也非常强调这一点。这意味着,在项目开始的时候,我们就在不断假设一个 AI 产品应该如何“存在”。

当我们开始考虑与未来相关的科技时,许多设计师都会一下子跳跃到“少数派报告”或“刀锋战士”这类电影中的沉浸式体验中。但是请你想象一下,“少数派报告”中的 UI 是多么疯狂:  只需伸出手臂,等待两秒后,抓一把空气,然后大手一挥反方向一转就搞定了,多么简单!几乎每个科幻片中的用户界面都有类似的东西,仿佛产品的交互模式必须要体现出科幻系统的无敌复杂性。虽然在我们早期的设计中曾经有过这样的一段时间,但是我们最终尽量避免了这样的幻想,其中的原因是这样的:

  • 我们在一个明显的模拟环境中向人们展示了虚假内容,人们并没有与图像进行真正的交互。请注意,这个问题不是AI独有的;可用性实验室中常有发生。

  • 我们每天都和同行们在一起,对AI的未来想法一致。我们的错误在于,忘记了普罗大众才是我们产品设计的参照点。

  • 我们总认为我们的新设计非常酷,所以总觉得即使产品无法尽快实现也说得过去。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

大多数产品都有一些学习曲线,但是随着 AI 的火热,我们需要着重考虑到用户的认知负担。对用户来讲,当产品的内容相对新颖时(图A),可靠性非常重要。当UI界面非常新颖需要用户学习时(图B),需要特别考虑到初级用户的使用体验。而当产品的功能特别新奇时(图C),你的用户界面应该向人们熟悉的模式靠近。

随着时间的推移,我们放弃了那些不实用的幻想。我们开始大幅降低用户界面的复杂性,并为我们的体验框架提供了用户控制,增加用户的熟悉感。我们在相机上增加了一个软件取景器和一个硬件捕捉按钮。从相机中的最佳取景框到理想的持续时间,我们都确保用户有最终决定权。同时,我们让相机拍摄了更多的照片,因为实际上,让用户看到更多照片,自己删除一些不那么精彩的照片,才让他们更好地理解相机所能拍摄的画面,才能提升他们对相机的信任。

经过这个过程,我们发现了另一个关于测试 AI 产品的重要原则:使用用户的真实内容来创建用户体验模式比使用 ML 模型进行测试更加有用。后者需要花费很长时间来构建和部署(与传统的软件开发相比,ML 模型的灵活性和适应性也差得多,所以错误的的代价也更高),而前者则能提供真正的人类视角,人们才能真正从你的产品中获得价值。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

用户通过从相机流式传输来预览他们的照片。左图中,用户可以选择他们想要保存在收集中的图片。中间图中,用户可以切换到建议的视图。右图中,用户可以精确定位出他们想要保存的静态图片。

在主观性和个性化的背景下,完美是不可能的,我们甚至不应该以此为目标。与传统的软件开发不同,机器学习系统永远不会“没有 bug”,因为预测是本身就是一种模糊科学。但正是这种模糊的特性才让机器学习变得非常有用!这正是帮助我们制造更为强大和动态的“IF”语句的真谛所在,我们可以用它来设计一些东西——“如果看起来像 X,则执行 Y 任务”。我们不仅要背离僵硬的逻辑规则,还需要抛弃传统的用户参与方式。谷歌 AI 相机的成功不仅仅在于“保留,删除,点击和编辑”(尽管这些都很重要),但更关键的是,用户的作者身份、机器和用户的共同学习和不断的改进。我们很希望通过这个产品,让用户可以忘掉拍照,尽情玩耍。

带着目的去设计

通过对传统 AI 范例的重新定位,找到让机器变得更加智能的方法,探索提升人类能力的方法,我们可以释放出机器学习的更多潜力。它会成为一个前所未有的探索创新工具; 一个帮助我们找出自己和周围世界内在模式的工具。在“以人为本的机器学习”项目中,我们有无数的机会用 AI 来塑造一个更加人性化、更加包容的世界。而这一切要从我们的本源出发:寻找和解决人类真正的需求,维护人类的价值。要始终记住:我们是为了增强人类的能力而设计,不是为了机器的自动化。

人工智能的作用不是帮我们在杂草里寻找丢失的针,而是帮助我们清除杂草,好让我们自己找到那根针。

via design.google 雷锋网编译

  ◆  ◆
推荐阅读

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

    NLP工程师入门实践班

     

 

三大模块,五大应用,手把手快速入门NLP、海外博士讲师,丰富项目经验、算法+实践,搭配典型行业应用、随到随学,专业社群,讲师在线答疑,详情点戳阅读原文链接或长按识别下方二维码~

 

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

原创文章,作者:交互精选,如若转载,请注明出处:https://www.iamue.com/35073/

(0)
交互精选交互精选
上一篇 2018-02-03
下一篇 2018-02-03

相关推荐

  • 用户体验升级|丝滑般享受的执剑人单点登录功能来了!

    各位票据市场上的辛勤工作的票友们,大家在这春回大地的时节是否为了美好的明天在努力耕作呢?“执剑人”为了使用户更方便、更快捷地在互联网平台上进行票据流转交易,已经隆重上线账户单点登录功能,交易时平台切换跳转超便捷!只需要登录一次即可完成交易1过去:用户在执剑人合作平台进行票据流转交易时,需要在平台账号、执剑人账号不停的切换,操作比较不便。未接单点登录的平台时这样的2现在:一家企业账号在执剑人和执剑人合作平台上,登录的时候只要一次登录,退出...

    2018-04-15
  • Axure RP 8.0安装图解

    Axure RP 8.0下载链接:链接:https://pan.baidu.com/s/1jJFQwLK 密码:3d1yAxure RP是美国Axure Software Solution公司旗舰产品,是一个专业的快速原型设计工具,让负责定义需求和规格、设计功能和界面的专家能够快速创建应用软件或Web网站的线框图、流程图、原型和规格说明文档。作为专门的原型设计工具,它比一般创建静态原型的工具如Visio、Omnigraffle、Illu...

    2018-03-24
  • 交互设计牛校排行榜 | 纽约大学ITP研究生项目

    Create Your Difference. by CYDWHO ARE YOU?Do you love biology but also love your art classes你是否热爱生物,也沉醉于艺术and want to merge the two所以想把这两者融入Do you love programming but also like to make things你是否能编程序,也想做出真实的东西Are you int...

    2018-05-06
  • 用Axure写PRD:虎扑app产品需求文档(附下载链接)

    需求文档是产品经理的基本功,产品小白入门的必经之路,但对于小白来说,没经历过一个完整的项目,自然也没有产品可以写,所以倒推产品是一个练手的好方法。Axure也是产品经理的基本功,画原型图的利器,但axure不止是能画原型,还可以用来写prd,正如臻龙大神说的做这样一个一体化产品需求文档出于的目的就是传统的方式产生的文件过多,过于杂乱,不易整理和回溯。如果把每个版本的内容都整理在一个html中,这样无论是团队协作还是文档回溯都能大大提高效...

    2018-03-15
  • 实例解析「交互设计七大定律」在设计中的应用(上篇)

    交互设计之父阿兰·库珀说过这样一句话:“除非有更好的选择,否则就遵从标准”;在交互设计领域中,有很多被时间和前人验证过的设计法则,这些法则是从用户的行为逻辑中总结出来的,掌握这些法则能让我们迅速有效的完成自己的设计,接下来,通过一些实例来解析下这些原则在设计中的应用~由于文章有点长,影响阅读体验,姑本文将分为上下两篇来发~一、费茨定律(Fitts’ Law)费茨定律指的是:使用指点设备到达一个目标的时间,与当前设备位置和目标位置的距离(...

    2018-03-16
  • 芝加哥艺术学院交互设计硕士成功案例

    等你点蓝字关注都等出蜘蛛网了学生档案毕业院校:北京某大学本科专业:网络设计本科平均分:3.45申请学位:硕士申请专业:交互设计TOEFL:95GRE:无案例回放W同学是2015年10月底进入公司服务体系的,想要申请2017年秋季入学的设计类相关专业。通过第一次电话联系,名校规划导师了解到W同学的基本情况是:北京某大学网络设计专业学生,GPA:3.45,TOEFL:77分,没有GRE成绩。再通过头脑风暴课上的深入挖掘,名校规划导师更全面更...

    2018-04-26
  • 从用户体验到品牌形象,营销的道路有多远?

    在数字化时代,如何提升品牌形象和用户体验,是两个营销的核心问题,品牌形象塑造消费感知,用户体验决定消费忠诚。企业重要的战略资源之一是:优质化的内容。而真正做内容营销的门槛极高,唯有真正强大的IP内容,才具有引爆市场与号召市场的能力。什么是营销IP,即知识产权(Intellectual Property),大IP,本身是产业链也延伸,具有黑洞版的吸金能力,是从招牌、内容、产业链等的延伸式营销。举个目前比较火热的例子,电影《魔兽》,根据网络...

    2018-02-02
  • 静态码限额后,微信支付还能兼顾合规和用户体验吗?

    【新朋友】点击标题下方蓝色字“经济晚报”关注【老朋友】点击右上角,转发或分享本页面内容4月1日,央行关于静态码扫码支付限额500元的新规开始正式实施了,从这天开始,大家通过静态二维码支付的时候每天限额是五百块。你感觉到了不方便吗?新规一出,很多小伙伴们都产生了疑问:以后我扫码支付消费是要被“管制”了吗?如果每天的限额用完却还有扫码支付的需求咋办?新规如何配合?微信支付上线新产品体验针对用户的这些疑问,微信支付和支付宝这两大移动支付巨头给...

    2018-04-07
  • 百度UED:让上帝讲真话——聊聊用户访谈几个细枝末节的问题

    来源:百度UED由于商业产品的特殊性,我们的用户是我们的客户,就是我们常说的上帝。那么,与上帝沟通需要注意哪些技巧呢?本文所讨论的技巧并非访谈技巧类的“技术流”文章,也非方法论,主要讲获取客户真实情况的访谈准备、数据收集及数据整理过程。我们在做调研时,希望了解上帝沟的目标、需求及行为。但在我们的调研中,往往发现这样的现象:1. 客户不配合我们的调研,不愿意跟我们讲话?2. 客户跟我们聊,却发现,答非所问,无论如何我们都没法在同一个平面对...

    2018-01-31
  • 便宜的指纹锁也会有“便宜”的用户体验

    欢迎关注:CDTV-1周一至周五晚7:30—7:40全国首创电视融商节目《天天橙掌柜》。很多指纹锁在你跟老板杀完价的那一刻是开心的用的时候并不是那么开心的例如说:外观掉漆脱落了把手松动了指纹录不进或不好打开了说好的密码备用关键时刻掉链子了配的机械钥匙太low了电池没过多久就没电了指纹锁没用多久就得找师傅上门维修了等等等等,烦心吗?趁着特价,换吧智能门锁吧超B级锁芯多种开门方式让你的生活更省心省力橙掌柜家庭安全节德施曼小嘀S8云智能门锁只...

    2018-03-09