AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

文 | 何忞来自雷锋网(leiphone-sz)的报道雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路。雷锋网将其编译如下正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角...

 
雷锋网按:日前谷歌在其官网发布博文,文中详细介绍了 AI 相机 Google Clips 的一些设计思路,来自雷锋网(leiphone-sz)的报道 雷锋网将其编译如下
文 | 何忞

正如过去曾经发生过的移动革命以及再之前的网络革命一样,机器学习正在让我们反思、重构、重新审视我们生活中已经拥有的一切。在 Google 用户体验(UX)社区中,我们开始了一项名为“以人为本的机器学习(HCML)”工作项目,来指导和帮助我们重构世界。站在这样的视角下,我们在思考机器学习(ML)如何在解决人类的需求时发挥自身的独特性。我们的团队集合了 Google 整个公司的各种人才,为 UX 用户带来机器学习的核心概念,让用户了解如何将机器学习和人工智能完美地融合到交互设计中。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

由谷歌AI相机Google Clips camera捕捉的父母、孩子和宠物的真实时刻

Google Clips 是谷歌的一款 AI 相机,专门用于捕捉身边人的精彩时刻。设备自带的人工智能可以通过机器学习了解到谁是你最亲密的身边人,并且知道如何才能拍出一张漂亮又令人难忘的照片。今天,我们将以这款 A I相机为例,详细阐释在这三年中,我们是如何构建出产品模型、进行工业设计和用户界面的。通过这篇文章,我们希望大家能够了解如何用以人为本的方法来设计 AI 产品。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

AI 相机可以放置在固定的框架上,并保持静止。上图中,我把相机夹在了篮筐上,抓拍到了我儿子打篮的精彩时刻。

只是将更多的 UX 用户分配到机器学习的项目中是远远不够的。更加关键的是让更多人了解到机器学习的核心概念,充分理解 AI 的能力,并能够围绕最佳实践产品来构建和维护信任。其实,从确定在产品构建中哪些模型是有用的,到数据的收集和注解,以及新颖的原型机的建造和测试,机器学习生命周期中的每一个阶段都是创新的时机。

首先第一个问题是,为什么采用以人为本的方法来构建机器学习产品和系统是非常重要的呢?我们认为有以下几个原因:

  • 机器学习本身并不会找出现实中需要解决的问题。如果你在设计中没有考虑到人的需求,那么你只是建立一个非常强大的系统来解决一个非常小或者根本不存在的问题。

  • 如果 AI 系统的目标不明确,并且用户对自身在调教系统中的角色认识不清,那么用户就会根据自己对 AI 的理解或想象来看待系统,这会让他们的信心受到影响。

  • 为了迅速发展,机器学习必须适应多学科的任务,即使不需要太多学科,但如何适应人类社会系统应该是一个需要面临的技术问题。机器学习是根据它在数据中自动发现的模式和关系进行预测的技术。一个 ML 模型的工作是要弄清楚这些自动发现的这些模式有多大可能出错,从而尽可能地保证通常的预测尽可能地正确。但这是远远不够的。从一开始建立模型的思路,到选择训练用的数据源到样本数据本身、以及用于描述和标记数据的方法,一直到模式关系对错的判断标准,机器学习系统的方方面面都是依靠人的判断来调整和修正的。总之,那句 UX 的公理“你永远不如用户了解他自己”,在这里显得异常重要。

三种以人为本提升AI设计的方法

解决人类的真正需求

今年,人们将会使用我们的相机拍摄大约一万亿张照片。在面对如此庞大的数字照片库时,我们中的很多人实际上并不会仔细浏览。新手父母尤其如此,感受宝宝的每一个第一次就是他们的日常生活。在那些珍贵而短暂的时刻,人们已经习惯使用他们的手机相机,希望能够为未来捕捉和保留一些回忆。但最终的结果是,人们用一个小小的屏幕来取代所有的感官,与世界的互动反而更低了。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

作为一个新手父母,你的照片库可能看起来很像我的上面手机照片——连续地拍摄,以捕捉孩子最完美最可爱的表情。

因此,我们在想,能不能创建一个产品,帮助我们更加关注我们关心的人呢?能不能让我们出现在照片中,而不是总躲在照相机后面呢?我们能不能“即时”拍摄照片,而不必停下来,拿出电话,打开相机,在镜头中对焦,保持这一刻的真实呢?我们能不能让一个摄影师在我们身边随时捕捉更多真实的生活时刻,比如孩子们的真正微笑呢?那些真实而转瞬即逝的时刻,往往让我们觉得甚至永远背着相机都不可能全部捕捉得到,而这就是我们这款 AI 相机打算满足的人类需求。

引导机器智能

产品设计之初,最迫切的问题是:如果人们拍摄了大量的照片,但其实并不想回头去整理它们,那么我们要如何标注数据呢?这就是基础的“以人为本的机器学习”项目诞生的起点:描述理论上的人类“专家”执行任务的方式。这个理论有两层含义:第一,如果连人类也无法完成这个任务,那么 AI 也不可能完成; 第二,通过深入研究专家完成任务的方法,我们可以找到一些信号来指导数据的收集、标记和组件模型的架构。

当时我们能想到的最接近“专家”就是一位婚礼摄影师,所以我开始了采访工作。我们通过代理进行招聘,并且使用了一个非常模糊的招聘信息“秘密项目!摄影!”。经过一番筛选加上一些运气,我们最终发现了一个宝库——一个纪录片制作人、一个摄影记者和一个美术摄影师的专业素材。我们一起开始收集团队成员的镜头材料,试图回答“什么是令人难忘的时刻?”

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

在评估我们的照片和视频的质量时,我们必须意识到很多细微之处、人们的审美本能和个人的生活历史,这些在过去都被我们所忽视了。例如,每当我看到我的小儿子在探索一根弯曲的吸管(左边),或者我去偷亲他(中间)时,我的心情就会泛起涟漪。当我看到我的大儿子在公园里骑自行车的时候(右边),我便非常自豪,因为我记得那一天是他第一次独自骑车。

建立信任

这个项目的初始假设是:我们可以向机器学习模型展示我们认为美丽而有趣的东西,然后它会学习如何找到更多这样的东西。我们对于图像的景深、构图原则、光线强弱、视频剪辑、情节设计等方面的处理显得较为随意,但遗憾的是,我们发现,永远不能低估人类运用常识和本能的能力。

这些早期的实验暴露出一些关键的技术差距,也帮助我们重新评估了我们对产品的假设,让我们真正明白了这项工作的本质。我们转变了工作方式,机器学习并不是我们所认为的那样“神圣”,它只有在相当简化的框架下才能有效地学习。打个比方,当时的我们就像在用莎士比亚而不是“Go,dog,go!”来教一个两岁的孩子英语。对我来说,这就是 AI 这个“庞然大物”走下“神坛”的时刻——AI 并不意味着一种可以理解所有事物、并且可以将学到的知识自行推广的单一“智能”。不,它差远了。

回归基础

“一致性”是教授任何东西时秘诀。比如我们在教孩子们英语时,为了正确发音,我们会不断地重复同一类词汇(如 tough, through, thorough 中的 O-U-G-H,或 cat, bat, sat 中的 A-T),通过一致性,我们可以预测更多同类的词汇发音和拼写。

而信心便来自一致性。试想一下,当一位老师提供两个似乎并不一致的例子时,大多数学生会立刻指出其中的不协调。但是算法并不会提供这样的反馈。就算法而言,除非另有指示,否则为算法提供的所有内容对算法而言都具有相同的价值。对于 Clips Camera 来说,这意味着我们不仅需要示例间的一致性,而且还需要每个示例中的一致性。AI 需要对每一个单独的框架进行具体预测。同时我们还需要教会它哪些内容可以被忽略。

捕获图像

我们需要训练模型学习什么是不好的图像:比如手挡在镜头前、快速晃动、镜头模糊。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我们使用上面的例子来训练机器学习模型来识别相机是在口袋或钱包里面(左图),或者相机被手指挡住时(右图)。虽然训练模型去忽视某些东西的好处并不能立即体现,但随着时间的推移,它会成为我们设计中的关键战略部分。这种训练能够让相机减少无效照片的拍摄浪费,捕获图像的总体质量将会显著上升。

构图问题

我们需要训练模型以保持图像的稳定性、清晰度,还要正确的取景。如果不稍加注意,面部探测模型就会将画框中心和边缘检测到的面部同等对待。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

为了训练模型保持对某个对象的连续性,需要特别强调一些特殊的例子。比如上图中,左边是我的小儿子全程都处在焦点范围内,而右图中我的大儿子只有 5% 左右的时间处在焦点中。

确定人物

熟悉你是为你拍摄的前提:你将相机对准某人时,他们通过微笑或摆姿势来暗示同意,你才能按下快门。并且,摄影师才是那个决定取景和构图的人。所以对自动相机而言,我们必须根据社交线索来确定你想要和谁一起拍照,我们可以根据你和他人相处的时间长短来确定是否拍摄有关他的照片。

编辑

多样性和冗余问题在我们拍照时并不是什么大问题,因为 我们脑海里总会有一个小小的声音说:“我们还没见过这个,需要拍下来!” 或者 “你已经拍了太多孩子的照片,可以停下来了。”,但是我们的 AI模型在这方面则需要很多的帮助。

我们从三个方面来处理多样性:

  • 时间:时间是最简单的图像捕捉信号。相机不能停工太久。

  • 视觉: 颜色微妙或戏剧性的变化可以说明环境和活动的变化。可以据此捕捉独特的精彩时刻。

  • 人物: 你正在一大群人当中,还是独自一人?让相机理解你正在和多少不同的熟悉面孔在一起,是不错过你人生重大时刻的关键。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

我把 AI 相机放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们搭积木的场景。同时,这也意味着我在相当长的一段时间里,向相机展示了一堆非常相似的内容。既要避免不必要的冗余又不能错过太多的精彩时刻,这在很长一段时间里都将会是一个非常复杂的 UX 挑战。

用户信任和自我效能

我们投资在 AI 相机上的一个原因是想要向大家展示出,设备自带的用户私人机器学习系统有多么重要,当然还有它其他非常强大的功能特点(例如,它只需要很少的电量,设备不会发烫,而且设备处理器不需要网络连接就可以快速而可靠地工作)。相机是一个非常私人化的物品,而我们一直在努力保证这一特性——相机硬件内容和机器智能都只属于你一个人。所有的一切都会永远保留在你的相机里,除非你自己将它公之于众。

概念设计

我们着眼于用户的信任和自我效能,在用户界面设计中也非常强调这一点。这意味着,在项目开始的时候,我们就在不断假设一个 AI 产品应该如何“存在”。

当我们开始考虑与未来相关的科技时,许多设计师都会一下子跳跃到“少数派报告”或“刀锋战士”这类电影中的沉浸式体验中。但是请你想象一下,“少数派报告”中的 UI 是多么疯狂:  只需伸出手臂,等待两秒后,抓一把空气,然后大手一挥反方向一转就搞定了,多么简单!几乎每个科幻片中的用户界面都有类似的东西,仿佛产品的交互模式必须要体现出科幻系统的无敌复杂性。虽然在我们早期的设计中曾经有过这样的一段时间,但是我们最终尽量避免了这样的幻想,其中的原因是这样的:

  • 我们在一个明显的模拟环境中向人们展示了虚假内容,人们并没有与图像进行真正的交互。请注意,这个问题不是AI独有的;可用性实验室中常有发生。

  • 我们每天都和同行们在一起,对AI的未来想法一致。我们的错误在于,忘记了普罗大众才是我们产品设计的参照点。

  • 我们总认为我们的新设计非常酷,所以总觉得即使产品无法尽快实现也说得过去。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

大多数产品都有一些学习曲线,但是随着 AI 的火热,我们需要着重考虑到用户的认知负担。对用户来讲,当产品的内容相对新颖时(图A),可靠性非常重要。当UI界面非常新颖需要用户学习时(图B),需要特别考虑到初级用户的使用体验。而当产品的功能特别新奇时(图C),你的用户界面应该向人们熟悉的模式靠近。

随着时间的推移,我们放弃了那些不实用的幻想。我们开始大幅降低用户界面的复杂性,并为我们的体验框架提供了用户控制,增加用户的熟悉感。我们在相机上增加了一个软件取景器和一个硬件捕捉按钮。从相机中的最佳取景框到理想的持续时间,我们都确保用户有最终决定权。同时,我们让相机拍摄了更多的照片,因为实际上,让用户看到更多照片,自己删除一些不那么精彩的照片,才让他们更好地理解相机所能拍摄的画面,才能提升他们对相机的信任。

经过这个过程,我们发现了另一个关于测试 AI 产品的重要原则:使用用户的真实内容来创建用户体验模式比使用 ML 模型进行测试更加有用。后者需要花费很长时间来构建和部署(与传统的软件开发相比,ML 模型的灵活性和适应性也差得多,所以错误的的代价也更高),而前者则能提供真正的人类视角,人们才能真正从你的产品中获得价值。

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

用户通过从相机流式传输来预览他们的照片。左图中,用户可以选择他们想要保存在收集中的图片。中间图中,用户可以切换到建议的视图。右图中,用户可以精确定位出他们想要保存的静态图片。

在主观性和个性化的背景下,完美是不可能的,我们甚至不应该以此为目标。与传统的软件开发不同,机器学习系统永远不会“没有 bug”,因为预测是本身就是一种模糊科学。但正是这种模糊的特性才让机器学习变得非常有用!这正是帮助我们制造更为强大和动态的“IF”语句的真谛所在,我们可以用它来设计一些东西——“如果看起来像 X,则执行 Y 任务”。我们不仅要背离僵硬的逻辑规则,还需要抛弃传统的用户参与方式。谷歌 AI 相机的成功不仅仅在于“保留,删除,点击和编辑”(尽管这些都很重要),但更关键的是,用户的作者身份、机器和用户的共同学习和不断的改进。我们很希望通过这个产品,让用户可以忘掉拍照,尽情玩耍。

带着目的去设计

通过对传统 AI 范例的重新定位,找到让机器变得更加智能的方法,探索提升人类能力的方法,我们可以释放出机器学习的更多潜力。它会成为一个前所未有的探索创新工具; 一个帮助我们找出自己和周围世界内在模式的工具。在“以人为本的机器学习”项目中,我们有无数的机会用 AI 来塑造一个更加人性化、更加包容的世界。而这一切要从我们的本源出发:寻找和解决人类真正的需求,维护人类的价值。要始终记住:我们是为了增强人类的能力而设计,不是为了机器的自动化。

人工智能的作用不是帮我们在杂草里寻找丢失的针,而是帮助我们清除杂草,好让我们自己找到那根针。

via design.google 雷锋网编译

  ◆  ◆
推荐阅读

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

    NLP工程师入门实践班

     

 

三大模块,五大应用,手把手快速入门NLP、海外博士讲师,丰富项目经验、算法+实践,搭配典型行业应用、随到随学,专业社群,讲师在线答疑,详情点戳阅读原文链接或长按识别下方二维码~

 

AI 交互设计怎么做?谷歌详解自家 AI 相机设计思路

原创文章,作者:交互精选,如若转载,请注明出处:https://www.iamue.com/35073/

(0)
交互精选交互精选
上一篇 2018-02-03
下一篇 2018-02-03

相关推荐

  • 交互设计的知识体系架构 做好产品与人的“翻译官”

    面临毕业季想从事交互设计这个行业,但毫无头绪?交互设计是什么鬼?工作一段时间发现转业交互设计,一直找不到学习的途径。接到一个需求,兴奋地开始画图,提交后产品和开发向你提出一大堆问题,你不停自否定的改图陷入死循环。互联网交互行业越来越受到追捧,看似入门的门槛很低,会画线框图就可以了。事实上交互设计师大部分是输出抽象方面的东西,对象是行为。一位知名人士曾将人与系统交互的过程分为五个要素:用户、行为、目标、场景、媒介,这些你曾了解过吗?这次M...

    2018-02-09
  • 产品迭代,同样是用户体验的迭代

    作者:Aaron Yan全文共 3542 字 1 图,阅读需要 8 分钟———— / BEGIN / ————我们在使用淘宝、头条、微信这些APP的时候,是不是感觉产品做的越来越好了呢?那么你觉得这种越来越好的变化,是因为APP功能的完善,还是因为操作变得更流畅了?我猜你的答案肯定是:这些APP变得好用是全方位的变好了,不仅仅只是其中一个方面变得比原来更好。我们都知道,APP越来越好用,是因为:我们产品经理和技术团队,在不停地进行产品迭...

    2018-04-01
  • 交互设计的门类 & 英国综合类院校及艺术院校在如何定义交互设计?

    艺麸大大带你了解英国交互类TOP院校要知道你离名校并不遥远别走神,好好看完哦~随着科技日新月异的发展,让交互设计一时成了“网红专业”,很多学平面设计或视觉传达的童鞋们纷纷转专业到交互设计大本营。然而各大顶尖院校对于交互设计的专业命名也是“五花八门”,如,服务设计、交互设计、用户体验设计等。交互本来就是一个艺术与科技的完美结合,国内很多院校都不能将其做的很突出和优秀,这就导致了出国学习交互设计成为许多人的想法。那么你有多了解交互设计呢?我...

    2018-04-19
  • 交互设计面试官想了解什么,你知道吗?

    丝路视觉新朋友可点击上方蓝字关注年后又是一波跳槽季,对于即将走出校园的小伙伴来说,春招也马上要开始了。今天推荐的这篇文章包含了校招过程中的所有技巧和秘籍,绝对良心面经。已有一些工作经历、现在想跳槽的朋友们也可以参考一下,不仅可以为准备的面试答案查缺补漏,也可以给心中留一个底。与面试官进行的交谈,每一句话都会影响面试官对你的判断,因此每次讲话都力求向面试官证明你是合适的人选,如果他无法从你身上获取到有效信息,自然会将你淘汰。然而很多同学在...

    2018-02-03
  • Axure案例练习-点评打分效果

    现在,外卖也好,购物也好,打车也好,点评打分是网站常见的用户互动的功能,一般都是1~5分之间评分,分值对应几颗星或者几颗心,当用户点击确定之后打分就完成了。下面我就以大众点评网为例,制作了打分效果。做之前,我们先来分析一下,点评共涉及到6个状态:没有打分的时候、一颗星的时候、二颗星的时候、三颗星的时候、四颗星的时候、五颗星的时候。根据之前的学习,知道点评区域是一个动态面板,这个动态面板有六个状态,当鼠标分别悬停时,切换出不同的状态。我们...

    2018-04-29
  • 使用Axure制作出信息化风格的精美简历(提供模板源文件下载)

    最近又到了每年“金三银四”的求职旺季,相信这段时间很多同行朋友们也正在找工作。在求职的过程中简历是非常重要的一块敲门砖,设计精美的简历能帮助你获得更多引起招聘人员注意的机会。如果我们能花点时间从设计感方面来包装一下自己的简历,这样既能体现自己的求职态度,又能展示出自己的专业细节,相信能让大家的简历增色不少,所以今天这篇分享我将教大家如何使用Axure制作出信息化风格的精美简历。从正式分享之前我需要先说明为何要使用Axure来设计简历,而...

    2018-03-24
  • 回音专栏丨交互设计中的规律

    回音专栏丨来自行业最前线的设计大咖们的独家MAX干货聚合!库伯学习圈,从行动中归纳出经验,把经验升华为规律,再用规律指导行动。……交互设计中的规律昨天讲了库伯学习圈和正确的学习步骤,应该从行动中归纳出经验,把经验升华为规律,再用规律指导行动。今天就来讲讲我在学习交互设计时,是怎样总结出一些有用的规律的,你同样也能用这种方法学习别的知识。行动中归纳经验我们平时都会使用一些电脑软件和手机APP,你有留意到它们的界面和操作吗?比如iPhone...

    2018-01-30
  • 阅读类产品中的交互设计逻辑分析

    ↑  点击上方蓝字,加个关注吧~ ↑话题:阅读类产品的交互设计该怎么做?本文共1285字25图,预计阅读时间: 4分钟阅读体验阅读类的产品交互核心所有阅读类产品围绕的产品核心是:阅读体验好的阅读体验会让用户感到熟悉性,由于用户习惯长久的累积,对于阅读产品的使用逻辑,在用户脑海中已经有了一个基础的操作定位。在阅读体验中,不同习惯的交互动作设计所带来体验也不同,通过分析阅读产品中的交互方式,来解剖其交互中设计逻辑。阅读方式我们参考了三款阅读...

    2018-02-27
  • Sketch49-原型设计才刚刚开始

    官方说明:草图49已经到来,在我们的图书馆更新之后,我们又为Sketch增加了另一个巨大且备受期待的功能。我们了解设计,所以我们知道你不能总是根据静态屏幕判断是否有效。有时你需要看到整个流程的实际运行情况,最好的方法是将你的设计变成交互式原型。通过我们的最新更新,我们正在使整个过程无缝 - 在Sketch中与原型设计师打招呼。Sketch 49带给我们的是最值得期待的功能之一:能够在本地创建和分享快速交互式原型当我听到这个消息时候,脑子...

    2018-03-02