AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

文 | 何忞来自雷锋网(leiphone-sz)的报道雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路。雷锋网将其编译如下正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角...

 
雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路,来自雷锋网(leiphone-sz)的报道 雷锋网将其编译如下
文 | 何忞

正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角下,我们在思考机器学习(ML)如何在解决人类的需求时发挥自身的独特性。我们的团队集合了 Google 整个公司的各种人才,为 UX 用户带来机器学习的核心概念,让用户了解如何将机器学习和人工智能完美地融合到交互设计中。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

由谷歌AI相机Google Clips camera捕捉的父母、孩子和宠物的真实时刻

Google Clips 是谷歌的一款 AI 相机,专门用于捕捉身边人的精彩时刻。设备自带的人工智能可以通过机器学习了解到谁是你最亲密的身边人,并且知道如何才能拍出一张漂亮又令人难忘的照片。今天,我们将以这款 A I相机为例,详细阐释在这三年中,我们是如何构建出产品模型、进行工业设计和用户界面的。通过这篇文章,我们希望大家能够了解如何用以人为本的方法来设计 AI 产品。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

AI 相机可以放置在固定的框架上,并保持静止。上图中,我把相机夹在了篮筐上,抓拍到了我儿子打篮的精彩时刻。

只是将更多的 UX 用户分配到机器学习的项目中是远远不够的。更加关键的是让更多人了解到机器学习的核心概念,充分理解 AI 的能力,并能够围绕最佳实践产品来构建和维护信任。其实,从确定在产品构建中哪些模型是有用的,到数据的收集和注解,以及新颖的原型机的建造和测试,机器学习生命周期中的每一个阶段都是创新的时机。

首先第一个问题是,为什么采用以人为本的方法来构建机器学习产品和系统是非常重要的呢?我们认为有以下几个原因:

  • 机器学习本身并不会找出现实中需要解决的问题。如果你在设计中没有考虑到人的需求,那么你只是建立一个非常强大的系统来解决一个非常小或者根本不存在的问题。

  • 如果 AI 系统的目标不明确,并且用户对自身在调教系统中的角色认识不清,那么用户就会根据自己对 AI 的理解或想象来看待系统,这会让他们的信心受到影响。

  • 为了迅速发展,机器学习必须适应多学科的任务,即使不需要太多学科,但如何适应人类社会系统应该是一个需要面临的技术问题。机器学习是根据它在数据中自动发现的模式和关系进行预测的技术。一个 ML 模型的工作是要弄清楚这些自动发现的这些模式有多大可能出错,从而尽可能地保证通常的预测尽可能地正确。但这是远远不够的。从一开始建立模型的思路,到选择训练用的数据源到样本数据本身、以及用于描述和标记数据的方法,一直到模式关系对错的判断标准,机器学习系统的方方面面都是依靠人的判断来调整和修正的。总之,那句 UX 的公理“你永远不如用户了解他自己”,在这里显得异常重要。

三种以人为本提升AI设计的方法

解决人类的真正需求

今年,人们将会使用我们的相机拍摄大约一万亿张照片。在面对如此庞大的数字照片库时,我们中的很多人实际上并不会仔细浏览。新手父母尤其如此,感受宝宝的每一个第一次就是他们的日常生活。在那些珍贵而短暂的时刻,人们已经习惯使用他们的手机相机,希望能够为未来捕捉和保留一些回忆。但最终的结果是,人们用一个小小的屏幕来取代所有的感官,与世界的互动反而更低了。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

作为一个新手父母,你的照片库可能看起来很像我的上面手机照片——连续地拍摄,以捕捉孩子最完美最可爱的表情。

因此,我们在想,能不能创建一个产品,帮助我们更加关注我们关心的人呢?能不能让我们出现在照片中,而不是总躲在照相机后面呢?我们能不能“即时”拍摄照片,而不必停下来,拿出电话,打开相机,在镜头中对焦,保持这一刻的真实呢?我们能不能让一个摄影师在我们身边随时捕捉更多真实的生活时刻,比如孩子们的真正微笑呢?那些真实而转瞬即逝的时刻,往往让我们觉得甚至永远背着相机都不可能全部捕捉得到,而这就是我们这款 AI 相机打算满足的人类需求。

引导机器智能

产品设计之初,最迫切的问题是:如果人们拍摄了大量的照片,但其实并不想回头去整理它们,那么我们要如何标注数据呢?这就是基础的“以人为本的机器学习”项目诞生的起点:描述理论上的人类“专家”执行任务的方式。这个理论有两层含义:第一,如果连人类也无法完成这个任务,那么 AI 也不可能完成; 第二,通过深入研究专家完成任务的方法,我们可以找到一些信号来指导数据的收集、标记和组件模型的架构。

当时我们能想到的最接近“专家”就是一位婚礼摄影师,所以我开始了采访工作。我们通过代理进行招聘,并且使用了一个非常模糊的招聘信息“秘密项目!摄影!”。经过一番筛选加上一些运气,我们最终发现了一个宝库——一个纪录片制作人、一个摄影记者和一个美术摄影师的专业素材。我们一起开始收集团队成员的镜头材料,试图回答“什么是令人难忘的时刻?”

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

在评估我们的照片和视频的质量时,我们必须意识到很多细微之处、人们的审美本能和个人的生活历史,这些在过去都被我们所忽视了。例如,每当我看到我的小儿子在探索一根弯曲的吸管(左边),或者我去偷亲他(中间)时,我的心情就会泛起涟漪。当我看到我的大儿子在公园里骑自行车的时候(右边),我便非常自豪,因为我记得那一天是他第一次独自骑车。

建立信任

这个项目的初始假设是:我们可以向机器学习模型展示我们认为美丽而有趣的东西,然后它会学习如何找到更多这样的东西。我们对于图像的景深、构图原则、光线强弱、视频剪辑、情节设计等方面的处理显得较为随意,但遗憾的是,我们发现,永远不能低估人类运用常识和本能的能力。

这些早期的实验暴露出一些关键的技术差距,也帮助我们重新评估了我们对产品的假设,让我们真正明白了这项工作的本质。我们转变了工作方式,机器学习并不是我们所认为的那样“神圣”,它只有在相当简化的框架下才能有效地学习。打个比方,当时的我们就像在用莎士比亚而不是“Go,dog,go!”来教一个两岁的孩子英语。对我来说,这就是 AI 这个“庞然大物”走下“神坛”的时刻——AI 并不意味着一种可以理解所有事物、并且可以将学到的知识自行推广的单一“智能”。不,它差远了。

回归基础

“一致性”是教授任何东西时秘诀。比如我们在教孩子们英语时,为了正确发音,我们会不断地重复同一类词汇(如 tough, through, thorough 中的 O-U-G-H,或 cat, bat, sat 中的 A-T),通过一致性,我们可以预测更多同类的词汇发音和拼写。

而信心便来自一致性。试想一下,当一位老师提供两个似乎并不一致的例子时,大多数学生会立刻指出其中的不协调。但是算法并不会提供这样的反馈。就算法而言,除非另有指示,否则为算法提供的所有内容对算法而言都具有相同的价值。对于 Clips Camera 来说,这意味着我们不仅需要示例间的一致性,而且还需要每个示例中的一致性。AI 需要对每一个单独的框架进行具体预测。同时我们还需要教会它哪些内容可以被忽略。

捕获图像

我们需要训练模型学习什么是不好的图像:比如手挡在镜头前、快速晃动、镜头模糊。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我们使用上面的例子来训练机器学习模型来识别相机是在口袋或钱包里面(左图),或者相机被手指挡住时(右图)。虽然训练模型去忽视某些东西的好处并不能立即体现,但随着时间的推移,它会成为我们设计中的关键战略部分。这种训练能够让相机减少无效照片的拍摄浪费,捕获图像的总体质量将会显著上升。

构图问题

我们需要训练模型以保持图像的稳定性、清晰度,还要正确的取景。如果不稍加注意,面部探测模型就会将画框中心和边缘检测到的面部同等对待。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

为了训练模型保持对某个对象的连续性,需要特别强调一些特殊的例子。比如上图中,左边是我的小儿子全程都处在焦点范围内,而右图中我的大儿子只有 5% 左右的时间处在焦点中。

确定人物

熟悉你是为你拍摄的前提:你将相机对准某人时,他们通过微笑或摆姿势来暗示同意,你才能按下快门。并且,摄影师才是那个决定取景和构图的人。所以对自动相机而言,我们必须根据社交线索来确定你想要和谁一起拍照,我们可以根据你和他人相处的时间长短来确定是否拍摄有关他的照片。

编辑

多样性和冗余问题在我们拍照时并不是什么大问题,因为 我们脑海里总会有一个小小的声音说:“我们还没见过这个,需要拍下来!” 或者 “你已经拍了太多孩子的照片,可以停下来了。”,但是我们的 AI模型在这方面则需要很多的帮助。

我们从三个方面来处理多样性:

  • 时间:时间是最简单的图像捕捉信号。相机不能停工太久。

  • 视觉: 颜色微妙或戏剧性的变化可以说明环境和活动的变化。可以据此捕捉独特的精彩时刻。

  • 人物: 你正在一大群人当中,还是独自一人?让相机理解你正在和多少不同的熟悉面孔在一起,是不错过你人生重大时刻的关键。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我把 AI 相机放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们搭积木的场景。同时,这也意味着我在相当长的一段时间里,向相机展示了一堆非常相似的内容。既要避免不必要的冗余又不能错过太多的精彩时刻,这在很长一段时间里都将会是一个非常复杂的 UX 挑战。

用户信任和自我效能

我们投资在 AI 相机上的一个原因是想要向大家展示出,设备自带的用户私人机器学习系统有多么重要,当然还有它其他非常强大的功能特点(例如,它只需要很少的电量,设备不会发烫,而且设备处理器不需要网络连接就可以快速而可靠地工作)。相机是一个非常私人化的物品,而我们一直在努力保证这一特性——相机硬件内容和机器智能都只属于你一个人。所有的一切都会永远保留在你的相机里,除非你自己将它公之于众。

概念设计

我们着眼于用户的信任和自我效能,在用户界面设计中也非常强调这一点。这意味着,在项目开始的时候,我们就在不断假设一个 AI 产品应该如何“存在”。

当我们开始考虑与未来相关的科技时,许多设计师都会一下子跳跃到“少数派报告”或“刀锋战士”这类电影中的沉浸式体验中。但是请你想象一下,“少数派报告”中的 UI 是多么疯狂:  只需伸出手臂,等待两秒后,抓一把空气,然后大手一挥反方向一转就搞定了,多么简单!几乎每个科幻片中的用户界面都有类似的东西,仿佛产品的交互模式必须要体现出科幻系统的无敌复杂性。虽然在我们早期的设计中曾经有过这样的一段时间,但是我们最终尽量避免了这样的幻想,其中的原因是这样的:

  • 我们在一个明显的模拟环境中向人们展示了虚假内容,人们并没有与图像进行真正的交互。请注意,这个问题不是AI独有的;可用性实验室中常有发生。

  • 我们每天都和同行们在一起,对AI的未来想法一致。我们的错误在于,忘记了普罗大众才是我们产品设计的参照点。

  • 我们总认为我们的新设计非常酷,所以总觉得即使产品无法尽快实现也说得过去。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

大多数产品都有一些学习曲线,但是随着 AI 的火热,我们需要着重考虑到用户的认知负担。对用户来讲,当产品的内容相对新颖时(图A),可靠性非常重要。当UI界面非常新颖需要用户学习时(图B),需要特别考虑到初级用户的使用体验。而当产品的功能特别新奇时(图C),你的用户界面应该向人们熟悉的模式靠近。

随着时间的推移,我们放弃了那些不实用的幻想。我们开始大幅降低用户界面的复杂性,并为我们的体验框架提供了用户控制,增加用户的熟悉感。我们在相机上增加了一个软件取景器和一个硬件捕捉按钮。从相机中的最佳取景框到理想的持续时间,我们都确保用户有最终决定权。同时,我们让相机拍摄了更多的照片,因为实际上,让用户看到更多照片,自己删除一些不那么精彩的照片,才让他们更好地理解相机所能拍摄的画面,才能提升他们对相机的信任。

经过这个过程,我们发现了另一个关于测试 AI 产品的重要原则:使用用户的真实内容来创建用户体验模式比使用 ML 模型进行测试更加有用。后者需要花费很长时间来构建和部署(与传统的软件开发相比,ML 模型的灵活性和适应性也差得多,所以错误的的代价也更高),而前者则能提供真正的人类视角,人们才能真正从你的产品中获得价值。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

用户通过从相机流式传输来预览他们的照片。左图中,用户可以选择他们想要保存在收集中的图片。中间图中,用户可以切换到建议的视图。右图中,用户可以精确定位出他们想要保存的静态图片。

在主观性和个性化的背景下,完美是不可能的,我们甚至不应该以此为目标。与传统的软件开发不同,机器学习系统永远不会“没有 bug”,因为预测是本身就是一种模糊科学。但正是这种模糊的特性才让机器学习变得非常有用!这正是帮助我们制造更为强大和动态的“IF”语句的真谛所在,我们可以用它来设计一些东西——“如果看起来像 X,则执行 Y 任务”。我们不仅要背离僵硬的逻辑规则,还需要抛弃传统的用户参与方式。谷歌 AI 相机的成功不仅仅在于“保留,删除,点击和编辑”(尽管这些都很重要),但更关键的是,用户的作者身份、机器和用户的共同学习和不断的改进。我们很希望通过这个产品,让用户可以忘掉拍照,尽情玩耍。

带着目的去设计

通过对传统 AI 范例的重新定位,找到让机器变得更加智能的方法,探索提升人类能力的方法,我们可以释放出机器学习的更多潜力。它会成为一个前所未有的探索创新工具; 一个帮助我们找出自己和周围世界内在模式的工具。在“以人为本的机器学习”项目中,我们有无数的机会用 AI 来塑造一个更加人性化、更加包容的世界。而这一切要从我们的本源出发:寻找和解决人类真正的需求,维护人类的价值。要始终记住:我们是为了增强人类的能力而设计,不是为了机器的自动化。

人工智能的作用不是帮我们在杂草里寻找丢失的针,而是帮助我们清除杂草,好让我们自己找到那根针。

via design.google 雷锋网编译

  ◆  ◆
推荐阅读

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

    NLP工程师入门实践班

     

 

三大模块,五大应用,手把手快速入门NLP、海外博士讲师,丰富项目经验、算法+实践,搭配典型行业应用、随到随学,专业社群,讲师在线答疑,详情点戳阅读原文链接或长按识别下方二维码~

 

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

原创文章,作者:交互精选,如若转载,请注明出处:https://www.iamue.com/35073/

(0)
交互精选交互精选
上一篇 2018-02-03
下一篇 2018-02-03

相关推荐

  • 【用户体验.春节特辑】我的记事(总第265期)

    亦可访问www.koushutianxia.com了解详情编家谱   修家史   留视频建祠堂   亲互动   传万代总第265期“我的记事”——家庭、个人故事随时记录,方便存储。直接点击主页面“我的记事”按钮,即可进入“我的记事”页面,随时随地添加、修改、记录个人及家庭资料和故事。同时点击方框内加号键,可以添加照片,点击完成上传。上传后可根据提示选“分享”键转发至微信、朋友圈、微博、QQ好友、QQ空间;选“删除”键进行删除记事内容;选...

    2018-02-16
  • 中国交互设计“教父”辛向阳老师首次线上分享会来啦

    应集创堂的邀请,中国交互设计“教父”辛向阳老师将在4月20日为大家带来首次线上分享会!辛老师是卡耐基梅隆大学设计哲学博士,是目前很少数在美国获得设计哲学博士、并首个回到中国内地的华人之一。有着跨多个学科的教育和工作背景,包括机械、建筑、平面设计、油画、交互设计以及艺术史。同时,辛老师还是IXDC(交互设计国际大会)大会主席,提出了“交互设计五要素”和“行为逻辑”等交互设计领域的重要理论和方法,并在香港理工大学成功创办了中国首个交互设计专...

    2018-04-17
  • 作品集总结|本科建筑跨专业申请交互设计?Dream School还是皇艺?这可能吗?

    PS-ONE#20180504建筑背景,申请交互设计跨专业申请结果如何?本科建筑,转专业申请交互设计Master?并且Dream School还是世界第一的RCA皇家艺术学院?在经历了PS-ONE历时8个月的内部评审后她如愿以偿了吗?。。。。。。8个月后爱丁堡大学,get拉夫堡,get交互设计,是细节非常复杂的专业涉及到的知识点、设计思维,对转专业申请者来说,是很苛刻的所以拿到爱丁堡、拉夫堡这样强势院校的Offer已经是很不错的结果了但...

    2018-05-04
  • 招聘 | 年薪百万不是梦,八爪鱼一大波高薪职位与伯乐奖在等你

    八爪鱼又开始招人啦如果你对大数据充满热情技术与才华兼并就赶快行动吧行业销售总监(政企)企)N15k-30k /深圳 / 经验3-5年 / 本科及以上 / 全职>>>岗位职责:基于公司的大数据产品、资源和技术,面向企业/政府等客户,提供数据采集软件、数据分析产品,数据服务,大数据解决方案等产品或服务;销售团队的人员招聘,管理及考核淘汰工作;完成客户需求的挖掘,商务谈判,项目回款工作;负责外部销售渠道和资源的对接,开发与维护;配合市场运营部...

    2018-03-15
  • 《用户体验要素》:一张图读懂用户体验五要素

    《用户体验要素》是一本讲产品的好书,作者为我们清晰地介绍了关于用户体验的五个要素,五个要素是按照产品的整个生命过程来描述的。产品设计五要素分别是:战略层、范围层、结构层、框架层、表现层。《用户体验要素》说这本书清晰,是因为五个要素很清楚,按逻辑步骤总结出来的。但,这也是这本书唯一清晰的地方了,因为,这本书在细节描述上还是很凌乱的。产品设计五要素对于读这本书而言,能够领会作者的思想就可以,不必要拘泥于具体的细节。原因有二:一是,这本书的细...

    2018-04-04
  • AR交互设计

    AR增强现实通过实时的在现实环境中渲染虚拟数字信息,通过现实和虚拟的结合来帮助用户完成某项任务和活动。AR中的虚拟数字信息通过与现实环境以及用户的实时互动来向用户传递有价值的信息。相比“传统的”2D层面的交互(手机app,web等),AR可支持的是更加丰富的三维层面的交互方式;并且这种方式不再仅限于主动式的交互(点击,滑动)方式,它还包括用户行为的被动触发。DHL的Vision
    Picking
    拣货系统使用了增强现实技术来帮助仓储拣...

    2018-04-12
  • 动起来才好玩——创意交互设计景观

    设计是靠亮点征服人,吸引眼球,大部分方案构思雷同,建成后风格水平都差不多,如何让场地更加吸引人而脱颖而出,这就需要在新、奇上下功夫。电子梦幻天幕世贸天阶最著名的“全北京向上看”的“超豪华LED天幕”,这座天幕将为整条商业街带来富于梦幻色彩和时尚品位的声光组合,成为一座吸引人潮的世界级奇观。建成之后,人们在这里可以欣赏缤纷悦目的日夜景观,感受现代科技带来的富于梦幻色彩和时尚品位的声光艺术。而且游客可以把想说的话发送短信到平台号码,天幕上就...

    2018-02-03
  • 如何平衡广告盈利和用户体验?

    如果你是一名手机应用开发者,你肯定知道广告可以为你的应用提供巨大的收入潜力。可以说手机应用就是在为流量主下金子: 到2020年,将会有高达1890亿美元的收入,而其中仅应用内广告带来的收入就会达到1170亿美元。事实上,我们最近对1000多名应用程序开发者进行了调查,发现高达84%的人承认他们通过广告将应用变现 —— 61%的人声称广告带来了最多的收入。但是,一如既往,能力越大,责任越大。作为一名应用开发者,你要负责确保用户的使用体验,...

    2018-04-06
  • Sketch迎来重大更新,叫板PS爸爸?

    11月8日晚,Sketch 悄悄的更新至 Sketch 41。至此3X系列已经离我们而去,4X系列正式到来!在此次更新中,还是有不少惊喜的。今天一一做个盘点。全新 LogoSketch 拟物化黄色钻石 Logo 已经成为历史。新Logo 顺应了设计潮流,简化色彩并弱化光影关系。不过有一点令我很在意,就是新Logo的倒角处理(面与面之间的接缝)。之前的Logo倒角很锋利,有种割破手的感觉,典型的 2D 图形拼接效果;新Logo倒角光滑,做...

    2018-04-26
  • PM的利器——流程图基础

    一、什么是流程图?流程(flow):一系列的逻辑关系(因果关系、时间先后、必要条件、输入输出),在特定的情境下满足特定用户的特定需要的总结。固化、变化。图(chart):形式表现;图形化、可视化;传播性、优化迭代性;二、为什么要画流程图?流程图:角色、流转、规则、顺序、输入、输出;流程图三、流程图有哪些?(1)设计草图:角色、任务、逻辑、输入输出(2)线框图、交互原型图:内容、布局、权重、交互手绘线框图sketch线框图(3)视觉图、U...

    2018-04-08