設計語音體驗
已發表: 2022-03-10VoiceLabs 最近的分析估計,今年將有 2450 萬台語音驅動設備出貨,幾乎是去年的四倍。 作為體驗設計師,我們現在有機會設計語音體驗和界面!
一個新的接口並不意味著我們必須忽略我們已經成功應用於以前的接口的所有東西; 我們將需要調整我們的流程以適應語音驅動界面的細微差別,包括對話交互和缺少屏幕。 我們將了解典型的瓶中精靈是如何工作的,討論設計語音體驗所涉及的步驟,並通過為 Alexa(或亞馬遜稱之為 Skill)設計語音應用程序來說明這些步驟。
### SmashingMag 的進一步閱讀:
- 使用 Web Speech API 增強用戶體驗
- 音頻設計指南
- 嘗試語音合成
- 什麼是用戶體驗設計? 概述、工具和資源
- 語音應用程序(谷歌的亞馬遜技能和行動);
- 人工智能平台(Amazon Alexa、Google Assistant、Apple Siri、Microsoft Cortana);
- 設備(Echo、Home、智能手機、電腦)。
Amazon Echo 和 Google Home 等語音驅動設備一直在傾聽,等待喚醒詞(“Alexa……”或“OK,Google……”)開始行動。 激活後,設備會將隨後的音頻發送到雲端的 AI 平台(“……玩 Jeopardy!”)。 該平台結合使用自動語音識別 (ASR) 和自然語言理解 (NLU) 來破譯用戶的意圖(開始瑣事遊戲)並將其發送到支持應用程序(Jeopardy! J6 Skill on Alexa)。 應用程序處理請求並通過文本(如果適用,還可以提供視覺效果)進行響應。 該平台將文本轉換為語音並通過設備播放(“歡迎來到 Jeopardy J6。這是今天的線索……”)。 這一切都在幾秒鐘內完成。
建立語音體驗
去年,馬克·扎克伯格(Mark Zuckerberg)接受了一項個人挑戰,即構建一個簡單的人工智能來管理他的家。 他做到了,稱它為 Jarvis,並賦予它 Morgan Freeman 的聲音。
我們其他沒有能力或資源做同樣事情的人可以通過構建在已經構建的複雜 AI 平台上運行的語音應用程序而僥倖成功。 這使我們不必擔心語音應用程序的設計和開發,這也簡化了開發過程。 亞馬遜和谷歌提供了對模板、代碼和詳細的分步說明的開放訪問,以構建不同類型的語音應用程序,甚至非開發人員也可以在大約一個小時內開發出一個應用程序!
他們在簡化應用程序開發方面的投資正在獲得回報,每個月都會推出數以千計的新語音應用程序。 語音應用的增長讓人想起 90 年代的網絡淘金熱,以及應用商店推出後移動應用的爆炸式增長。
在擁擠的語音市場中,良好的設計將使您的語音應用程序與數百個其他類似應用程序區分開來。
設計語音體驗
設計良好的語音用戶體驗是一個五步過程,應該在開始開發之前進行。 雖然直接進入開發可能很誘人,但花在正確設計上的時間是值得的。
我們將討論並應用每個步驟來設計一個語音應用程序,該應用程序可以使用 Alexa 的許多技能模板之一輕鬆開發。
1. 發現
設計之旅從一個問題開始,“這個語音應用程序將如何為我的用戶提供價值?” 無論您是在開發獨立的語音應用程序(如我們的示例),還是您的語音應用程序只是客戶的眾多接觸點之一,這個問題都適用。 考慮人們使用語音應用程序的原因和地點。 人們使用語音界面是因為免提交互的好處、交互的速度和易用性,主要是在家中或車內使用,如 Mary Meeker 的 2016 年互聯網趨勢報告所示。
關鍵是通過語音應用程序而不是電話或計算機找到更容易或更方便的一致用戶需求。 一些示例包括提供帳戶信息的銀行或電影觀眾尋找附近正在播放的新電影。
如果您的競爭對手已經擁有語音應用程序,請考慮他們正在做什麼以及他們的應用程序在應用程序市場(例如亞馬遜的 Alexa Skill Store)中收到的評論和反饋。 目的不是盲目模仿,而是要了解已經設置的能力欄,以及用戶的期望。
(在撰寫本文時,有超過 1,500 種“知識和瑣事”Alexa Skills,使其成為亞馬遜上最擁擠的技能類別。但是,沒有一個瑣事技能適合用戶體驗領域。為了說明在語音設計過程中,我們將創建一個用戶體驗設計技能,供我們的讀者測試他們的知識,甚至學習新的東西。)
2. 定義
在此步驟中,我們將定義我們的應用程序的個性及其將具有的功能。
性格
在設計語音界面時,我們無法訪問我們在 Web 和移動界面中使用的許多視覺元素來展示個性。 個性必須通過語言互動的聲音和語氣來體現。 與聽到弗里曼舒緩聲音的紮克伯格不同,我們只能聽到設備的默認聲音。 這使得語氣和措辭對於傳達我們想要傳達的個性至關重要。
好消息是,這方面的大部分基礎工作應該已經完成並記錄在企業品牌指南或網站風格指南中(提示:尋找“語氣”部分)。 將這些指南用於您的語音應用程序,並在渠道和接觸點之間保持一致的個性。
當我想到個性和語氣時,我立刻想到了維珍集團。 他們清楚地定義了他們是誰以及如何將其傳達給用戶。 對於維珍美國航空來說,理想的語氣是“時髦、隨和、不拘小節、俏皮和詼諧”,並且在他們的所有交流中都能清楚地體現出來。
如果您曾經要求 Alexa 唱歌或嘗試過眾多 Alexa 復活節彩蛋中的任何一個,那麼您就會知道她有自己的個性。 好奇,我聯繫了負責她個性的團隊,他們是這樣說的:
在構建 Alexa 的聲音時,我們試圖賦予她一種反映我們在亞馬遜最看重的屬性的個性。 我們希望她感到樂於助人、謙虛和聰明,同時仍保持樂趣。 這是一個持續的過程,我們預計 Alexa 的聲音將隨著更多開發人員專注於讓她更聰明而發展。
個性還可以反映在應用程序目錄列表中向用戶顯示的應用程序名稱、圖標和描述中,以及用於調用應用程序的名稱(調用名稱)中。 因此,請確保它在發布您的應用程序時閃耀。
對於我們的 UX 設計技能,我們可以採取直接或有趣的方法,這將反映在我們的測驗問答選項的措辭中。
正常音調的一個例子是:
哪種 UX 設計原則更傾向於簡單而不是複雜?
- 奧卡姆剃刀
- 希克定律
- 美學可用性效應
- 令人滿意
一個有趣的語氣的例子是:
顯然,有一個用戶體驗設計原則有利於簡單而不是複雜。 真的! 你能猜出它叫什麼嗎?
- 奧卡姆剃刀法則:UX 專家能做到的最好的。
- 希克定律:聽起來像是一個 UX 土包子會想出的東西。
- 美學可用性效果:這是一些花哨的 UX 行話。
- 滿意:我無法得到滿意……向滾石樂隊道歉。
是的,讓我們堅持正常。
能力
這是您仔細考慮對您的語音應用程序用戶有價值的功能的地方。 從第一步重新審視您的工作,以確定核心或與您的業務相關的能力。 有時提供核心功能是不費吹灰之力的——例如銀行提供有關餘額、交易和到期日的信息。 其他以相關功能的形式提供價值,例如 Tide 的去污指南語音應用程序,或 Glad(食品儲存和垃圾袋製造商)的語音應用程序,其中一個可以幫助用戶記住他們存放剩菜的位置,或者另一個一種允許用戶檢查哪些物品應該被回收或丟棄在垃圾箱中的方法。
如果您在從 Web 轉到移動設備時進行了類似的練習,則可以作為起點。 對於語音功能,請考慮哪些功能將使您的用戶在共享空間中的語音驅動設備上受益。 如果一項技能涉及安全或隱私問題,請考慮添加保護級別(Capital One Alexa 技能允許用戶創建個人密鑰以進行帳戶訪問)。 雖然您最終可能會得到一份可以通過語音工作的功能清單,但從一到五個核心功能開始,並在發布後使用語音分析進行更新和改進。
用戶體驗設計技能的核心能力可能是:
- 按需提供用戶體驗設計原則;
- 根據隨機 UX 原則對用戶(單人玩家)進行測驗;
- 對用戶(單人)進行多用戶體驗原則的測驗,並記分;
- 與多名玩家一起舉辦 UX 問答比賽。
因為我們正在使用亞馬遜的技能模板構建這個 UX 設計技能,所以我們的選擇目前僅限於上面的第一個(事實技能模板)或第三個(瑣事技能模板)選項。 假設我們的研究表明,我們的用戶會發現測驗比僅僅聽到背誦 UX 原則更有價值,那麼我們的核心能力將是就 UX 原則對用戶進行測驗並記分。
3. 詳細的對話流程
現在您已將語音應用程序的功能列入候選名單,開始關注應用程序與其用戶之間的詳細對話流程。 人類對話很複雜; 它通常有很多曲折,並且隨時可能發生變化,人們經常從一個話題跳到另一個話題。 語音 AI 平台要達到這種複雜程度還有很長的路要走,所以你必須教你的技能如何響應用戶。
您的語音應用程序只能支持您在上一步中定義的功能,但用戶始終可以以任何格式向應用程序詢問任何內容。 詳細說明對話流可以讓您響應用戶,或將對話推向應用程序可以為用戶做的事情。
對於語音應用程序將支持的每項功能,開始在用戶和應用程序之間創建對話對話,類似於劇本中的對話。 當你寫這些對話時,記住個性以及聲音和語氣特徵。 開始為您的語音應用創建和策劃實際內容; 對於我們的測驗,這意味著建立測驗問題列表。
從“快樂路徑”開始——語音應用程序可以響應用戶請求而不會出現任何異常或錯誤的對話流程。 然後,繼續詳細說明異常(用戶未提供完整信息)和錯誤(語音應用程序不理解或無法執行用戶要求的操作)的對話流程。
因為對話會被聽到而不是被閱讀,一個好的做法是大聲朗讀它,看看它是否聽起來像一個自然的口語對話,並檢查它是否傳達了你想要的語氣。
如果您的語音應用程序需要使用電話應用程序上顯示的內容來補充對話,請將這些交互設計在一起,以使它們對用戶而言顯得無縫。 例如,Tide 的去污技能會告訴用戶,除了聽說明外,他們還可以參考 Alexa 應用程序中的去污步驟。 如果關於新 Echo 觸摸屏的傳言屬實,這可能很快就會被要求。
以下是我們的 UX 設計技能的核心能力的幸福路徑的示例對話:
用戶:“Alexa,開始 UX 設計測驗。”Alexa :“我會問你五個問題,有多項選擇答案。 嘗試盡可能多地正確。 只需說出答案的數字即可。 讓我們開始。 問題一……”
用戶:[正確回答]
亞歷克薩:“沒錯! 你的分數是 1。這是第 2 題……”
用戶:[回答錯誤]
Alexa :“糟糕,這是錯誤的答案。 正確答案是【正確答案】。 你的分數是 1。這是第 3 題……”
…
Alexa (在五個問題結束時):“沒錯! 你答對了五分之四。 謝謝你來玩!”
4. 描述替代短語
人們並不總是使用相同的詞來說相同的事情,而語音應用程序需要被教導這一點。 短語映射是一項訓練語音應用程序以適應用戶表達請求方式的變化的練習。
對於您在上一步中詳述的每個對話路徑,請考慮用戶可以用不同的方式表達這些請求。 然後分解每個請求的措辭,並確定他們可能使用的單詞變體和同義詞,同時考慮到任何區域變體和方言。 如果您的語音應用程序處理加糖碳酸飲料(蘇打水、汽水、可樂、補品、軟飲料、汽水)、長三明治(sub、grinder、hoagie、hero、poor boy、bomber、意大利三明治、法式長棍麵包)或運動鞋(運動鞋、鞋子、運動鞋、沙鞋、套頭衫、網球鞋、跑鞋、跑步者、運動鞋)。
使這個變體列表盡可能完整和詳盡,以便您的語音應用程序可以理解用戶請求。 Alexa 需要以“話語”的形式出現這些變化,並建議提供“……盡可能多的代表性短語”。 根據您的語音應用程序的功能,話語的數量可能很容易達到數百個,但有一些方法可以簡化話語的生成。
這是我們的 UX 設計測驗功能的示例短語映射。 Alexa 的 AI 平台可以很好地根據他們的模板翻譯用戶對技能的意圖。 但是,如果您進行更改(例如我們將“瑣事遊戲”更改為“測驗”),則必須添加這些短語。
5. 細化
設計過程的最後一步是在花費時間和精力進行開發之前驗證和完善語音應用程序。 在“細節”步驟中,大聲朗讀對話流有助於確保它們聽起來自然和對話。 當前步驟涉及與用戶一起測試語音界面。
最簡單的測試方法是使用綠野仙踪技術,由一個人扮演語音驅動設備的角色,並根據語音界面腳本響應用戶。 另一種選擇是使用諸如 SaySpring 之類的原型設計軟件來創建和測試交互式原型。
如果您的語音應用程序是使用代碼模板構建的(就像我們的應用程序一樣),那麼使用 Amazon 和 Google 在技能開發區域(如下所示)或在實際設備上的測試模式。
此測試將使您對現實世界中的語音體驗有一個很好的感受,包括處理錯誤、重複響應以及不自然、強製或類似機器的回复。
開發
現在已經設計了語音體驗,是時候進入構建-測試-提交階段了。 每個平台都有詳細的指南和教程來幫助任何人構建和測試技能,包括 Alexa Skills Kit、Develop Actions for Google 和 Cortana,它提供重用您的自定義 Alexa 技能代碼!
想想你的反饋循環和分析,這將幫助你了解你的語音應用程序的使用情況。 您可以在您的開發者帳戶中獲得技能指標(用戶、會話、話語、意圖),而無需任何額外的編碼,但是可以通過 VoiceLabs 等免費服務獲得高級分析(我無法讓它工作,可能是因為我缺乏編碼技能或缺少VoiceLabs for Dummies設置指南)。
完成構建和測試語音應用程序後,最後一步是簡化的提交過程。 由於 Alexa Skill 市場發展迅速,發現新的有用應用程序變得越來越困難。 在亞馬遜改進這一點之前,請使用您的語音應用列表中的可見元素來幫助用戶找到並嘗試您的技能,包括吸引人的相關技能圖標、名稱和描述。
作為插圖構建的配套技能可以在 Amazon Alexa Skill 商店進行試駕:UX 設計測驗
指導原則
以下是設計語音體驗的一些指導原則。 亞馬遜和谷歌提供了更多原則和詳細的注意事項。
加入用戶並幫助他們入門
介紹應用程序以及用戶可以使用它的方式。
歡迎來到 UX 設計測驗。 我會問你五個關於 UX 設計的問題,看看你答對了多少。 如果需要,您可以讓我重複一個問題或暫停。 你想開始一個新的測驗嗎?
保持對話交流簡短,以減少認知負荷。
使用語音用戶界面,用戶在與語音應用程序交互時必須使用他們的短期記憶。 所以,保持簡短和甜蜜。
亞歷克薩:“這個原則歸功於一位 14 世紀的邏輯學家和方濟各會修士,並以他出生的英國薩里郡的村莊命名。 簡而言之,它表明簡單勝於復雜。 通過尋求更簡單的設計解決方案,這種解決問題的原則可以很容易地應用於用戶體驗設計。 這個原理叫什麼?
- 您的第一個選擇是奧卡姆剃刀,有時也稱為奧卡姆剃刀,或簡約法則。
- 您的下一個選擇是希克定律,也稱為希克-海曼定律。
- 您的下一個選擇是美學可用性效果。
- 您的最後一個選項稱為“滿足”,不要與“滿足”或“犧牲”混淆。
請說出 A、B、C 或 D 來進行選擇。”
用戶:“嗯?! 亞歷克薩,重複。 再三考慮,結束測驗!”
示例比說明更有效
說明:“請以月/日/年的格式說出您的出生日期。” 示例:“請說出您的出生日期,例如 1990 年 4 月 15 日。”
在不干擾任務的情況下取悅
這是一種平衡行為。 太多了,很快就會厭倦。
對重要操作使用顯式確認,對風險較小的操作使用隱式確認
如果您要求 Alexa 關燈,您可以看到它發生並且不需要口頭確認,儘管她有時會用簡短的“OK”確認。
失敗設計
事情會出錯:針對這些情況進行設計。 示例包括難以理解的問題或信息、不完整的信息、沉默或無法處理的請求。 確認,並為用戶提供恢復選項。
尊重用戶的隱私和安全
結論
每當您嘗試與人類互動時,您都必須將人類視為非常先進的操作系統。 你的最高目標是模仿他們。 – KK Barrett,她的電影製作設計師,Wired,2014
如果您還沒有看過電影《她》,請花幾個小時觀看這部關於一位孤獨作家與操作系統建立關係的未來主義電影。 雖然這是科幻小說,但在當今世界,隨著獨立語音驅動設備(如 Amazon Echo 系列和 Google Home)的採用,語音體驗正在增加。 開發語音應用程序是一個相對簡單的模板驅動過程,亞馬遜和谷歌提供了類似宜家的說明,試圖建立他們的平台。 儘管跳入開發可能很誘人,但良好的語音用戶體驗並不僅僅發生。 它必須按照本文中描述的步驟進行設計。
請使用評論區與其他讀者分享任何其他反饋、提示和資源。
資源
人工智能平台工具
- Alexa Skills Kit,亞馬遜
- 谷歌的行動
- “Alexa Skills Kit 語音設計最佳實踐”,亞馬遜
- Google 設計資源的操作
說話的語氣
- “語氣對用戶品牌認知的影響”,Nielsen Norman Group 的 Kate Meyer
- “尋找你的語氣”,羅伯特·米爾斯,Smashing Magazine
- “尋找品牌的聲音”,Harriet Cummings,Distilled
短語和方言
- “你們,你們和你們是如何交談的(互動測驗),紐約時報
- 定義語音接口(和 Alexa 話語),亞馬遜
- “為 Alexa Skills Kit 定義話語”(包括工具),Maker Musings
原型設計和測試
這是我們的 UX 設計測驗功能的示例短語映射。 Alexa 的 AI 平台可以很好地根據他們的模板翻譯用戶對技能的意圖。 但是,如果您進行更改(例如我們將“瑣事遊戲”更改為“測驗”),則必須添加這些短語。
5. 細化
設計過程的最後一步是在花費時間和精力進行開發之前驗證和完善語音應用程序。 在“細節”步驟中,大聲朗讀對話流有助於確保它們聽起來自然和對話。 當前步驟涉及與用戶一起測試語音界面。
最簡單的測試方法是使用綠野仙踪技術,由一個人扮演語音驅動設備的角色,並根據語音界面腳本響應用戶。 另一種選擇是使用諸如 SaySpring 之類的原型設計軟件來創建和測試交互式原型。
如果您的語音應用程序是使用代碼模板構建的(就像我們的應用程序一樣),那麼使用 Amazon 和 Google 在技能開發區域(如下所示)或在實際設備上的測試模式。
此測試將使您對現實世界中的語音體驗有一個很好的感受,包括處理錯誤、重複響應以及不自然、強製或類似機器的回复。
開發
現在已經設計了語音體驗,是時候進入構建-測試-提交階段了。 每個平台都有詳細的指南和教程來幫助任何人構建和測試技能,包括 Alexa Skills Kit、Develop Actions for Google 和 Cortana,它提供重用您的自定義 Alexa 技能代碼!
想想你的反饋循環和分析,這將幫助你了解你的語音應用程序的使用情況。 您可以在您的開發者帳戶中獲得技能指標(用戶、會話、話語、意圖),而無需任何額外的編碼,但是可以通過 VoiceLabs 等免費服務獲得高級分析(我無法讓它工作,可能是因為我缺乏編碼技能或缺少VoiceLabs for Dummies設置指南)。
完成構建和測試語音應用程序後,最後一步是簡化的提交過程。 由於 Alexa Skill 市場發展迅速,發現新的有用應用程序變得越來越困難。 在亞馬遜改進這一點之前,請使用您的語音應用列表中的可見元素來幫助用戶找到並嘗試您的技能,包括吸引人的相關技能圖標、名稱和描述。
作為插圖構建的配套技能可以在 Amazon Alexa Skill 商店進行試駕:UX 設計測驗
指導原則
以下是設計語音體驗的一些指導原則。 亞馬遜和谷歌提供了更多原則和詳細的注意事項。
加入用戶並幫助他們入門
介紹應用程序以及用戶可以使用它的方式。
歡迎來到 UX 設計測驗。 我會問你五個關於 UX 設計的問題,看看你答對了多少。 如果需要,您可以讓我重複一個問題或暫停。 你想開始一個新的測驗嗎?
保持對話交流簡短,以減少認知負荷。
使用語音用戶界面,用戶在與語音應用程序交互時必須使用他們的短期記憶。 所以,保持簡短和甜蜜。
亞歷克薩:“這個原則歸功於一位 14 世紀的邏輯學家和方濟各會修士,並以他出生的英國薩里郡的村莊命名。 簡而言之,它表明簡單勝於復雜。 通過尋求更簡單的設計解決方案,這種解決問題的原則可以很容易地應用於用戶體驗設計。 這個原理叫什麼?
- 您的第一個選擇是奧卡姆剃刀,有時也稱為奧卡姆剃刀,或簡約法則。
- 您的下一個選擇是希克定律,也稱為希克-海曼定律。
- 您的下一個選擇是美學可用性效果。
- 您的最後一個選項稱為“滿足”,不要與“滿足”或“犧牲”混淆。
請說出 A、B、C 或 D 來進行選擇。”
用戶:“嗯?! 亞歷克薩,重複。 再三考慮,結束測驗!”
示例比說明更有效
說明:“請以月/日/年的格式說出您的出生日期。” 示例:“請說出您的出生日期,例如 1990 年 4 月 15 日。”
在不干擾任務的情況下取悅
這是一種平衡行為。 太多了,很快就會厭倦。
對重要操作使用顯式確認,對風險較小的操作使用隱式確認
如果您要求 Alexa 關燈,您可以看到它發生並且不需要口頭確認,儘管她有時會用簡短的“OK”確認。
失敗設計
事情會出錯:針對這些情況進行設計。 示例包括難以理解的問題或信息、不完整的信息、沉默或無法處理的請求。 確認,並為用戶提供恢復選項。
尊重用戶的隱私和安全
結論
每當您嘗試與人類互動時,您都必須將人類視為非常先進的操作系統。 你的最高目標是模仿他們。 – KK Barrett,她的電影製作設計師,Wired,2014
如果您還沒有看過電影《她》,請花幾個小時觀看這部關於一位孤獨作家與操作系統建立關係的未來主義電影。 雖然這是科幻小說,但在當今世界,隨著獨立語音驅動設備(如 Amazon Echo 系列和 Google Home)的採用,語音體驗正在增加。 開發語音應用程序是一個相對簡單的模板驅動過程,亞馬遜和谷歌提供了類似宜家的說明,試圖建立他們的平台。 儘管跳入開發可能很誘人,但良好的語音用戶體驗並不僅僅發生。 它必須按照本文中描述的步驟進行設計。
請使用評論區與其他讀者分享任何其他反饋、提示和資源。
資源
人工智能平台工具
- Alexa Skills Kit,亞馬遜
- 谷歌的行動
- “Alexa Skills Kit 語音設計最佳實踐”,亞馬遜
- Google 設計資源的操作
說話的語氣
- “語氣對用戶品牌認知的影響”,Nielsen Norman Group 的 Kate Meyer
- “尋找你的語氣”,羅伯特·米爾斯,Smashing Magazine
- “尋找品牌的聲音”,Harriet Cummings,Distilled
短語和方言
- “你們,你們和你們是如何交談的(互動測驗),紐約時報
- 定義語音接口(和 Alexa 話語),亞馬遜
- “為 Alexa Skills Kit 定義話語”(包括工具),Maker Musings
原型設計和測試
- SaySpring“免費的語音原型軟件”
- Echosim.io “Alexa 技能測試工具”
- “網絡模擬器”,Google 行動
報告、書籍和電影
- “VoiceLabs 2017 年語音報告”
- 設計語音用戶界面:對話體驗原則,Cathy Pearl,O'Reilly Media
- 她(電影)