设计语音体验
已发表: 2022-03-10VoiceLabs 最近的分析估计,今年将有 2450 万台语音驱动设备出货,几乎是去年的四倍。 作为体验设计师,我们现在有机会设计语音体验和界面!
一个新的接口并不意味着我们必须忽略我们已经成功应用于以前的接口的所有东西; 我们将需要调整我们的流程以适应语音驱动界面的细微差别,包括对话交互和缺少屏幕。 我们将了解典型的瓶中精灵是如何工作的,讨论设计语音体验所涉及的步骤,并通过为 Alexa(或亚马逊称之为 Skill)设计语音应用程序来说明这些步骤。
### SmashingMag 的进一步阅读:
- 使用 Web Speech API 增强用户体验
- 音频设计指南
- 尝试语音合成
- 什么是用户体验设计? 概述、工具和资源
- 语音应用程序(谷歌的亚马逊技能和行动);
- 人工智能平台(Amazon Alexa、Google Assistant、Apple Siri、Microsoft Cortana);
- 设备(Echo、Home、智能手机、电脑)。
Amazon Echo 和 Google Home 等语音驱动设备一直在倾听,等待唤醒词(“Alexa……”或“OK,Google……”)开始行动。 激活后,设备会将随后的音频发送到云端的 AI 平台(“……玩 Jeopardy!”)。 该平台结合使用自动语音识别 (ASR) 和自然语言理解 (NLU) 来破译用户的意图(开始琐事游戏)并将其发送到支持应用程序(Jeopardy! J6 Skill on Alexa)。 应用程序处理请求并通过文本(如果适用,还可以提供视觉效果)进行响应。 该平台将文本转换为语音并通过设备播放(“欢迎来到 Jeopardy J6。这是今天的线索……”)。 这一切都在几秒钟内完成。
建立语音体验
去年,马克·扎克伯格(Mark Zuckerberg)接受了一项个人挑战,即构建一个简单的人工智能来管理他的家。 他做到了,称它为 Jarvis,并赋予它 Morgan Freeman 的声音。
我们其他没有能力或资源做同样事情的人可以通过构建在已经构建的复杂 AI 平台上运行的语音应用程序而侥幸成功。 这使我们不必担心语音应用程序的设计和开发,这也简化了开发过程。 亚马逊和谷歌提供了对模板、代码和详细的分步说明的开放访问,以构建不同类型的语音应用程序,甚至非开发人员也可以在大约一个小时内开发出一个应用程序!
他们在简化应用程序开发方面的投资正在获得回报,每个月都会推出数以千计的新语音应用程序。 语音应用的增长让人想起 90 年代的网络淘金热,以及应用商店推出后移动应用的爆炸式增长。
在拥挤的语音市场中,良好的设计将使您的语音应用程序与数百个其他类似应用程序区分开来。
设计语音体验
设计良好的语音用户体验是一个五步过程,应该在开始开发之前进行。 虽然直接进入开发可能很诱人,但花在正确设计上的时间是值得的。
我们将讨论并应用每个步骤来设计一个语音应用程序,该应用程序可以使用 Alexa 的许多技能模板之一轻松开发。
1. 发现
设计之旅从一个问题开始,“这个语音应用程序将如何为我的用户提供价值?” 无论您是在开发独立的语音应用程序(如我们的示例),还是您的语音应用程序只是客户的众多接触点之一,这个问题都适用。 考虑人们使用语音应用程序的原因和地点。 人们使用语音界面是因为免提交互的好处、交互的速度和易用性,主要是在家中或车内使用,如 Mary Meeker 的 2016 年互联网趋势报告所示。
关键是通过语音应用程序而不是电话或计算机找到更容易或更方便的一致用户需求。 一些示例包括提供帐户信息的银行或电影观众寻找附近正在播放的新电影。
如果您的竞争对手已经拥有语音应用程序,请考虑他们正在做什么以及他们的应用程序在应用程序市场(例如亚马逊的 Alexa Skill Store)中收到的评论和反馈。 目的不是盲目模仿,而是要了解已经设置的能力栏,以及用户的期望。
(在撰写本文时,有超过 1,500 种“知识和琐事”Alexa Skills,使其成为亚马逊上最拥挤的技能类别。但是,没有一个琐事技能适合用户体验领域。为了说明在语音设计过程中,我们将创建一个用户体验设计技能,供我们的读者测试他们的知识,甚至学习新的东西。)
2. 定义
在此步骤中,我们将定义我们的应用程序的个性及其将具有的功能。
性格
在设计语音界面时,我们无法访问我们在 Web 和移动界面中使用的许多视觉元素来展示个性。 个性必须通过语言互动的声音和语气来体现。 与听到弗里曼舒缓声音的扎克伯格不同,我们只能听到设备的默认声音。 这使得语气和措辞对于传达我们想要传达的个性至关重要。
好消息是,这方面的大部分基础工作应该已经完成并记录在企业品牌指南或网站风格指南中(提示:寻找“语气”部分)。 将这些指南用于您的语音应用程序,并在渠道和接触点之间保持一致的个性。
当我想到个性和语气时,我立刻想到了维珍集团。 他们清楚地定义了他们是谁以及如何将其传达给用户。 对于维珍美国航空来说,理想的语气是“时髦、随和、不拘小节、俏皮和诙谐”,并且在他们的所有交流中都能清楚地体现出来。
如果您曾经要求 Alexa 唱歌或尝试过众多 Alexa 复活节彩蛋中的任何一个,那么您就会知道她有自己的个性。 好奇,我联系了负责她个性的团队,他们是这样说的:
在构建 Alexa 的声音时,我们试图赋予她一种反映我们在亚马逊最看重的属性的个性。 我们希望她感到乐于助人、谦虚和聪明,同时仍保持乐趣。 这是一个持续的过程,我们预计 Alexa 的声音将随着更多开发人员专注于让她更聪明而发展。
个性还可以反映在应用程序目录列表中向用户显示的应用程序名称、图标和描述中,以及用于调用应用程序的名称(调用名称)中。 因此,请确保它在发布您的应用程序时闪耀。
对于我们的 UX 设计技能,我们可以采取直接或有趣的方法,这将反映在我们的测验问答选项的措辞中。
正常音调的一个例子是:
哪种 UX 设计原则更倾向于简单而不是复杂?
- 奥卡姆剃刀
- 希克定律
- 美学可用性效应
- 令人满意
一个有趣的语气的例子是:
显然,有一个用户体验设计原则有利于简单而不是复杂。 真的! 你能猜出它叫什么吗?
- 奥卡姆剃刀法则:UX 专家能做到的最好的。
- 希克定律:听起来像是一个 UX 土包子会想出的东西。
- 美学可用性效果:这是一些花哨的 UX 行话。
- 满意:我无法得到满意……向滚石乐队道歉。
是的,让我们坚持正常。
能力
这是您仔细考虑对您的语音应用程序用户有价值的功能的地方。 从第一步重新审视您的工作,以确定核心或与您的业务相关的能力。 有时提供核心功能是不费吹灰之力的——例如银行提供有关余额、交易和到期日的信息。 其他以相关功能的形式提供价值,例如 Tide 的去污指南语音应用程序,或 Glad(食品储存和垃圾袋制造商)的语音应用程序,其中一个可以帮助用户记住他们存放剩菜的位置,或者另一个一种允许用户检查哪些物品应该被回收或丢弃在垃圾箱中的方法。
如果您在从 Web 转到移动设备时进行了类似的练习,则可以作为起点。 对于语音功能,请考虑哪些功能将使您的用户在共享空间中的语音驱动设备上受益。 如果一项技能涉及安全或隐私问题,请考虑添加保护级别(Capital One Alexa 技能允许用户创建个人密钥以进行帐户访问)。 虽然您最终可能会得到一份可以通过语音工作的功能清单,但从一到五个核心功能开始,并在发布后使用语音分析进行更新和改进。
用户体验设计技能的核心能力可能是:
- 按需提供用户体验设计原则;
- 根据随机 UX 原则对用户(单人玩家)进行测验;
- 对用户(单人)进行多用户体验原则的测验,并记分;
- 与多名玩家一起举办 UX 问答比赛。
因为我们正在使用亚马逊的技能模板构建这个 UX 设计技能,所以我们的选择目前仅限于上面的第一个(事实技能模板)或第三个(琐事技能模板)选项。 假设我们的研究表明,我们的用户会发现测验比仅仅听到背诵 UX 原则更有价值,那么我们的核心能力将是就 UX 原则对用户进行测验并记分。
3. 详细的对话流程
现在您已将语音应用程序的功能列入候选名单,开始关注应用程序与其用户之间的详细对话流程。 人类对话很复杂; 它通常有很多曲折,并且随时可能发生变化,人们经常从一个话题跳到另一个话题。 语音 AI 平台要达到这种复杂程度还有很长的路要走,所以你必须教你的技能如何响应用户。
您的语音应用程序只能支持您在上一步中定义的功能,但用户始终可以以任何格式向应用程序询问任何内容。 详细说明对话流可以让您响应用户,或将对话推向应用程序可以为用户做的事情。
对于语音应用程序将支持的每项功能,开始在用户和应用程序之间创建对话对话,类似于剧本中的对话。 当你写这些对话时,记住个性以及声音和语气特征。 开始为您的语音应用创建和策划实际内容; 对于我们的测验,这意味着建立测验问题列表。
从“快乐路径”开始——语音应用程序可以响应用户请求而不会出现任何异常或错误的对话流程。 然后,继续详细说明异常(用户未提供完整信息)和错误(语音应用程序不理解或无法执行用户要求的操作)的对话流程。
因为对话会被听到而不是被阅读,一个好的做法是大声朗读它,看看它是否听起来像一个自然的口语对话,并检查它是否传达了你想要的语气。
如果您的语音应用程序需要使用电话应用程序上显示的内容来补充对话,请将这些交互设计在一起,以使它们对用户而言显得无缝。 例如,Tide 的去污技能会告诉用户,除了听说明外,他们还可以参考 Alexa 应用程序中的去污步骤。 如果关于新 Echo 触摸屏的传言属实,这可能很快就会被要求。
以下是我们的 UX 设计技能的核心能力的幸福路径的示例对话:
用户:“Alexa,开始 UX 设计测验。”Alexa :“我会问你五个问题,有多项选择答案。 尝试尽可能多地正确。 只需说出答案的数字即可。 让我们开始。 问题一……”
用户:[正确回答]
亚历克萨:“没错! 你的分数是 1。这是第 2 题……”
用户:[回答错误]
Alexa :“糟糕,这是错误的答案。 正确答案是【正确答案】。 你的分数是 1。这是第 3 题……”
…
Alexa (在五个问题结束时):“没错! 你答对了五分之四。 谢谢你来玩!”
4. 描述替代短语
人们并不总是使用相同的词来说相同的事情,而语音应用程序需要被教导这一点。 短语映射是一项训练语音应用程序以适应用户表达请求方式的变化的练习。
对于您在上一步中详述的每个对话路径,请考虑用户可以用不同的方式表达这些请求。 然后分解每个请求的措辞,并确定他们可能使用的单词变体和同义词,同时考虑到任何区域变体和方言。 如果您的语音应用程序处理加糖碳酸饮料(苏打水、汽水、可乐、补品、软饮料、汽水)、长三明治(sub、grinder、hoagie、hero、poor boy、bomber、意大利三明治、法式长棍面包)或运动鞋(运动鞋、鞋子、运动鞋、沙鞋、套头衫、网球鞋、跑鞋、跑步者、运动鞋)。
使这个变体列表尽可能完整和详尽,以便您的语音应用程序可以理解用户请求。 Alexa 需要以“话语”的形式出现这些变化,并建议提供“……尽可能多的代表性短语”。 根据您的语音应用程序的功能,话语的数量可能很容易达到数百个,但有一些方法可以简化话语的生成。
这是我们的 UX 设计测验功能的示例短语映射。 Alexa 的 AI 平台可以很好地根据他们的模板翻译用户对技能的意图。 但是,如果您进行更改(例如我们将“琐事游戏”更改为“测验”),则必须添加这些短语。
5. 细化
设计过程的最后一步是在花费时间和精力进行开发之前验证和完善语音应用程序。 在“细节”步骤中,大声朗读对话流有助于确保它们听起来自然和对话。 当前步骤涉及与用户一起测试语音界面。
最简单的测试方法是使用绿野仙踪技术,由一个人扮演语音驱动设备的角色,并根据语音界面脚本响应用户。 另一种选择是使用诸如 SaySpring 之类的原型设计软件来创建和测试交互式原型。
如果您的语音应用程序是使用代码模板构建的(就像我们的应用程序一样),那么使用 Amazon 和 Google 在技能开发区域(如下所示)或在实际设备上的测试模式。
此测试将使您对现实世界中的语音体验有一个很好的感受,包括处理错误、重复响应以及不自然、强制或类似机器的回复。
开发
现在已经设计了语音体验,是时候进入构建-测试-提交阶段了。 每个平台都有详细的指南和教程来帮助任何人构建和测试技能,包括 Alexa Skills Kit、Develop Actions for Google 和 Cortana,它提供重用您的自定义 Alexa 技能代码!
想想你的反馈循环和分析,这将帮助你了解你的语音应用程序的使用情况。 您可以在您的开发者帐户中获得技能指标(用户、会话、话语、意图),而无需任何额外的编码,但是可以通过 VoiceLabs 等免费服务获得高级分析(我无法让它工作,可能是因为我缺乏编码技能或缺少VoiceLabs for Dummies设置指南)。
完成构建和测试语音应用程序后,最后一步是简化的提交过程。 由于 Alexa Skill 市场发展迅速,发现新的有用应用程序变得越来越困难。 在亚马逊改进这一点之前,请使用您的语音应用列表中的可见元素来帮助用户找到并尝试您的技能,包括吸引人的相关技能图标、名称和描述。
作为插图构建的配套技能可以在 Amazon Alexa Skill 商店进行试驾:UX 设计测验
指导原则
以下是设计语音体验的一些指导原则。 亚马逊和谷歌提供了更多原则和详细的注意事项。
加入用户并帮助他们入门
介绍应用程序以及用户可以使用它的方式。
欢迎来到 UX 设计测验。 我会问你五个关于 UX 设计的问题,看看你答对了多少。 如果需要,您可以让我重复一个问题或暂停。 你想开始一个新的测验吗?
保持对话交流简短,以减少认知负荷。
使用语音用户界面,用户在与语音应用程序交互时必须使用他们的短期记忆。 所以,保持简短和甜蜜。
亚历克萨:“这个原则归功于一位 14 世纪的逻辑学家和方济各会修士,并以他出生的英国萨里郡的村庄命名。 简而言之,它表明简单胜于复杂。 通过寻求更简单的设计解决方案,这种解决问题的原则可以很容易地应用于用户体验设计。 这个原理叫什么?
- 您的第一个选择是奥卡姆剃刀,有时也称为奥卡姆剃刀,或简约法则。
- 您的下一个选择是希克定律,也称为希克-海曼定律。
- 您的下一个选择是美学可用性效果。
- 您的最后一个选项称为“满足”,不要与“满足”或“牺牲”混淆。
请说出 A、B、C 或 D 来进行选择。”
用户:“嗯?! 亚历克萨,重复。 再三考虑,结束测验!”
示例比说明更有效
说明:“请以月/日/年的格式说出您的出生日期。” 示例:“请说出您的出生日期,例如 1990 年 4 月 15 日。”
在不干扰任务的情况下取悦
这是一种平衡行为。 太多了,很快就会厌倦。
对重要操作使用显式确认,对风险较小的操作使用隐式确认
如果您要求 Alexa 关灯,您可以看到它发生并且不需要口头确认,尽管她有时会用简短的“OK”确认。
失败设计
事情会出错:针对这些情况进行设计。 示例包括难以理解的问题或信息、不完整的信息、沉默或无法处理的请求。 确认,并为用户提供恢复选项。
尊重用户的隐私和安全
结论
每当您尝试与人类互动时,您都必须将人类视为非常先进的操作系统。 你的最高目标是模仿他们。 – KK Barrett,她的电影制作设计师,Wired,2014
如果您还没有看过电影《她》,请花几个小时观看这部关于一位孤独作家与操作系统建立关系的未来主义电影。 虽然这是科幻小说,但在当今世界,随着独立语音驱动设备(如 Amazon Echo 系列和 Google Home)的采用,语音体验正在增加。 开发语音应用程序是一个相对简单的模板驱动过程,亚马逊和谷歌提供了类似宜家的说明,试图建立他们的平台。 尽管跳入开发可能很诱人,但良好的语音用户体验并不仅仅发生。 它必须按照本文中描述的步骤进行设计。
请使用评论区与其他读者分享任何其他反馈、提示和资源。
资源
人工智能平台工具
- Alexa Skills Kit,亚马逊
- 谷歌的行动
- “Alexa Skills Kit 语音设计最佳实践”,亚马逊
- Google 设计资源的操作
说话的语气
- “语气对用户品牌认知的影响”,Nielsen Norman Group 的 Kate Meyer
- “寻找你的语气”,罗伯特·米尔斯,Smashing Magazine
- “寻找品牌的声音”,Harriet Cummings,Distilled
短语和方言
- “你们,你们和你们是如何交谈的(互动测验),纽约时报
- 定义语音接口(和 Alexa 话语),亚马逊
- “为 Alexa Skills Kit 定义话语”(包括工具),Maker Musings
原型设计和测试
这是我们的 UX 设计测验功能的示例短语映射。 Alexa 的 AI 平台可以很好地根据他们的模板翻译用户对技能的意图。 但是,如果您进行更改(例如我们将“琐事游戏”更改为“测验”),则必须添加这些短语。
5. 细化
设计过程的最后一步是在花费时间和精力进行开发之前验证和完善语音应用程序。 在“细节”步骤中,大声朗读对话流有助于确保它们听起来自然和对话。 当前步骤涉及与用户一起测试语音界面。
最简单的测试方法是使用绿野仙踪技术,由一个人扮演语音驱动设备的角色,并根据语音界面脚本响应用户。 另一种选择是使用诸如 SaySpring 之类的原型设计软件来创建和测试交互式原型。
如果您的语音应用程序是使用代码模板构建的(就像我们的应用程序一样),那么使用 Amazon 和 Google 在技能开发区域(如下所示)或在实际设备上的测试模式。
此测试将使您对现实世界中的语音体验有一个很好的感受,包括处理错误、重复响应以及不自然、强制或类似机器的回复。
开发
现在已经设计了语音体验,是时候进入构建-测试-提交阶段了。 每个平台都有详细的指南和教程来帮助任何人构建和测试技能,包括 Alexa Skills Kit、Develop Actions for Google 和 Cortana,它提供重用您的自定义 Alexa 技能代码!
想想你的反馈循环和分析,这将帮助你了解你的语音应用程序的使用情况。 您可以在您的开发者帐户中获得技能指标(用户、会话、话语、意图),而无需任何额外的编码,但是可以通过 VoiceLabs 等免费服务获得高级分析(我无法让它工作,可能是因为我缺乏编码技能或缺少VoiceLabs for Dummies设置指南)。
完成构建和测试语音应用程序后,最后一步是简化的提交过程。 由于 Alexa Skill 市场发展迅速,发现新的有用应用程序变得越来越困难。 在亚马逊改进这一点之前,请使用您的语音应用列表中的可见元素来帮助用户找到并尝试您的技能,包括吸引人的相关技能图标、名称和描述。
作为插图构建的配套技能可以在 Amazon Alexa Skill 商店进行试驾:UX 设计测验
指导原则
以下是设计语音体验的一些指导原则。 亚马逊和谷歌提供了更多原则和详细的注意事项。
加入用户并帮助他们入门
介绍应用程序以及用户可以使用它的方式。
欢迎来到 UX 设计测验。 我会问你五个关于 UX 设计的问题,看看你答对了多少。 如果需要,您可以让我重复一个问题或暂停。 你想开始一个新的测验吗?
保持对话交流简短,以减少认知负荷。
使用语音用户界面,用户在与语音应用程序交互时必须使用他们的短期记忆。 所以,保持简短和甜蜜。
亚历克萨:“这个原则归功于一位 14 世纪的逻辑学家和方济各会修士,并以他出生的英国萨里郡的村庄命名。 简而言之,它表明简单胜于复杂。 通过寻求更简单的设计解决方案,这种解决问题的原则可以很容易地应用于用户体验设计。 这个原理叫什么?
- 您的第一个选择是奥卡姆剃刀,有时也称为奥卡姆剃刀,或简约法则。
- 您的下一个选择是希克定律,也称为希克-海曼定律。
- 您的下一个选择是美学可用性效果。
- 您的最后一个选项称为“满足”,不要与“满足”或“牺牲”混淆。
请说出 A、B、C 或 D 来进行选择。”
用户:“嗯?! 亚历克萨,重复。 再三考虑,结束测验!”
示例比说明更有效
说明:“请以月/日/年的格式说出您的出生日期。” 示例:“请说出您的出生日期,例如 1990 年 4 月 15 日。”
在不干扰任务的情况下取悦
这是一种平衡行为。 太多了,很快就会厌倦。
对重要操作使用显式确认,对风险较小的操作使用隐式确认
如果您要求 Alexa 关灯,您可以看到它发生并且不需要口头确认,尽管她有时会用简短的“OK”确认。
失败设计
事情会出错:针对这些情况进行设计。 示例包括难以理解的问题或信息、不完整的信息、沉默或无法处理的请求。 确认,并为用户提供恢复选项。
尊重用户的隐私和安全
结论
每当您尝试与人类互动时,您都必须将人类视为非常先进的操作系统。 你的最高目标是模仿他们。 – KK Barrett,她的电影制作设计师,Wired,2014
如果您还没有看过电影《她》,请花几个小时观看这部关于一位孤独作家与操作系统建立关系的未来主义电影。 虽然这是科幻小说,但在当今世界,随着独立语音驱动设备(如 Amazon Echo 系列和 Google Home)的采用,语音体验正在增加。 开发语音应用程序是一个相对简单的模板驱动过程,亚马逊和谷歌提供了类似宜家的说明,试图建立他们的平台。 尽管跳入开发可能很诱人,但良好的语音用户体验并不仅仅发生。 它必须按照本文中描述的步骤进行设计。
请使用评论区与其他读者分享任何其他反馈、提示和资源。
资源
人工智能平台工具
- Alexa Skills Kit,亚马逊
- 谷歌的行动
- “Alexa Skills Kit 语音设计最佳实践”,亚马逊
- Google 设计资源的操作
说话的语气
- “语气对用户品牌认知的影响”,Nielsen Norman Group 的 Kate Meyer
- “寻找你的语气”,罗伯特·米尔斯,Smashing Magazine
- “寻找品牌的声音”,Harriet Cummings,Distilled
短语和方言
- “你们,你们和你们是如何交谈的(互动测验),纽约时报
- 定义语音接口(和 Alexa 话语),亚马逊
- “为 Alexa Skills Kit 定义话语”(包括工具),Maker Musings
原型设计和测试
- SaySpring“免费的语音原型软件”
- Echosim.io “Alexa 技能测试工具”
- “网络模拟器”,Google 行动
报告、书籍和电影
- “VoiceLabs 2017 年语音报告”
- 设计语音用户界面:对话体验原则,Cathy Pearl,O'Reilly Media
- 她(电影)