設計無形:我學到的 3 件事 語音設計

已發表: 2022-03-10
快速總結↬世界各地都有人無法輕鬆地為自己完成日常任務。 幸運的是,開發人員和設計人員可以通過試驗語音技術來提供幫助,使他們能夠完成其他人可能認為理所當然的任務。

當前的語音控制數字助理迭代仍在努力實現亞馬遜、谷歌和蘋果三大語音播放器所希望的無縫集成。 Voicelabs 2017 年的一份報告指出,用戶在下載語音應用程序後的第二週內只有 3% 的機會處於活躍狀態,並且 62% 的 Alexa 技能仍會在其商店中獲得任何類型的評級(截至 2017 年 9 月)。

作為設計師,我們有真正的機會為這些助手提供有價值的意義,但我們仍在努力找出技術可以在哪些方面為用戶帶來真正的好處。 對於許多人來說,開始一個語音 UI (VUI) 項目可能有點像進入 Unknown 。 很少有成功案例可供設計師或工程師借鑒,尤其是在說明這種新興技術如何幫助人們以新方式茁壯成長的背景下。

嘗試speechSynthesis

Web Speech API 使您能夠在兩個方向為您的網站啟用語音功能:通過speechSynthesis SpeechRecognition與他們對話。 所有這些都是通過 JavaScript API 完成的,因此很容易測試支持。 閱讀相關文章 →

作為 BBC2 的 Big Life Fix 紀錄片系列的一部分,發明家團隊為有需要的人創造了新的改變生活的解決方案,我有機會為一位名叫 Susan 的女性測試並構建了一個語音控制的助手。 蘇珊患有漸進性多發性硬化症已有 20 多年,現在無法輕鬆完成自己的日常任務。 有全職照顧者,她靠別人幫她洗衣服、換衣服,連電視換台都沒有能力。

雖然語音技術似乎可以為克服蘇珊的身體困難提供最順暢的途徑,但蘇珊從未使用過智能手機,因此讓她直接與語音助手互動絕非易事——我們必須聰明地思考才能幫助她學習與令人難以置信的外星技術交流。

跳躍後更多! 繼續往下看↓

蘇珊的成果是一個高度定制的語音控制助手,現在讓她能夠以別人認為理所當然的自由來完成日常任務——從打電話給家人,到聽音樂。 作為 Amazon Alexa 技術的增強版,在他們的 Echo Dot 設備上構建,Susan 的語音助手還涉及物理定制,因為我們 3D 打印了她最喜歡的動物貓頭鷹形狀的外殼。

當我們快速地為 Susan 試驗和迭代解決方案時,我和我的團隊發現了數十個複雜的問題,這些問題都伴隨著以更具包容性和可訪問性的方式進行語音設計。 儘管這是一個獨特的項目,但有三個關鍵要點適用於任何 VUI 項目。

1. 個性化

技術有效。 這不僅僅是坐下來等待計算能力增加符合用戶期望的問題。 我們發現每個設備的語音檢測、識別和合成功能遠比我們預期的要強大。 這並不是沒有選擇的餘地。 亞馬遜上有超過 30,000 種 Alexa 技能,平均每天發布 50 種新技能。 技能是使設計人員和開發人員在使用 Amazon Echo Dot 等設備時能夠創建更加個性化的語音體驗的特定能力。 它們的運行方式很像智能手機應用商店中的應用程序,讓您可以隨心所欲地自定義語音助手

但是,目前存在很大的訪問障礙​​。 必須通過應用程序而不是設備來添加技能,這通常會否定 VUI 的好處並破壞對話流程(更不用說排除那些不能/不會使用智能手機的人)。 這讓這個過程感覺很笨拙,充其量是脫節的,最壞的情況是完全孤立的。 即使安裝了一項技能,沒有技能可見性和有限的互動時間框架也會導致缺乏信心和焦慮; 它可以做我想做的嗎? 我怎麼跟它說話? 它聽到我了嗎? 那麼,你如何建立這種聯繫和信任呢?

對於 Susan 來說,這意味著去除不必要的內容並展示精選的核心功能。 通過將內容個性化為獨特的行為和要求,我們提供了急需的清晰度和更有意義的體驗。 Susan 想要執行關鍵任務:接聽電話、撥打電話、更換電視頻道、播放音樂等等。 通過了解她和她的需求,我們創建了一個始終感覺相關且有用的助手。 這是一個相當手動的過程,但機器學習和人工智能在這裡有巨大的機會。 如果每個語音助手都可以提供個性化元素,那麼它可以讓每個人的體驗都更加相關。

當我們為一個人設計時,我們可以輕鬆地為 Susan 定制產品的物理元素。 這意味著設計——然後是 3D 打印——一個貓頭鷹形狀的光擴散器(她最喜歡的動物,對她來說具有重要意義的東西)。 貓頭鷹充當了這項技術的視覺表現,並給了她一些可以交談和投射的東西。 正是她的嚮導讓她獲得了她想要的技能,比如聽音樂。 由於這對她來說是個人的,它讓潛在的外星人、令人生畏的技術感覺更加平易近人和熟悉

人性化技術有助於使其更易於使用:蘇珊的個性化貓頭鷹會根據她的聲音發光,讓她知道自己正在被傾聽和理解。
人性化技術有助於使其更易於使用:Susan 的個性化貓頭鷹會根據她的聲音發光,讓她知道自己正在被傾聽和理解。 (大預覽)

雖然完全定制的 3D 打印房屋並不是每個 VUI 項目的選擇,但仍有機會為人們創建一個更相關的設備進行交流,特別是如果他們對家庭助理的需求或使用非常具體。 例如,您可能會與支持語音的燈談論您的家庭照明和冰箱談論您的雜貨。

2. 考慮音頻可供性

目前,用戶完成了所有繁重的工作。 由於心智模型模糊且沒有技術支持,我們被迫想像我們想要的終點並通過必要的命令向後工作。 除了最簡單的任務(設置一個 5 分鐘的計時器,在 Spotify 上播放 Abba 等),這很難做到,尤其是如果你遇到 Susan 向我們解釋的“模糊時刻”——難以找到合適的詞。

當 Apple 在其早期的 iPhone 應用程序中著名地使用擬物化視覺元素時,用戶獲得了有價值的、熟悉的參考點,這些參考點為其提供了使用和交互方法。 只有當心智模型變得更加成熟時,他們才能自由地擺脫這種文字表示,進入他們當前的平面 UI。

在設計我們的 VUI 時,我們決定依靠在數字和網絡導航中看到的完善的菜單系統。 這是一個熟悉的工具,它需要用戶進行較少的認知處理,並允許我們結合尋路方法,如果出現問題,這種方法不會導致從一開始就開始。

例如,蘇珊發現,在當前數字助理提供的時間範圍內,用語言表達她想要的東西是一種壓力大且通常不愉快的體驗; 通常會因設備末尾的錯誤消息而復雜化。 與其期望她給出明確的命令,例如“Alexa,從我的 Spotify 播放列表中播放 Abba”,我們決定創建一個引導菜單工具,可以幫助她慢慢開始,並逐步更具體地了解她希望 Alexa 做什麼。

蘇珊的貓頭鷹現在會提示她一個精選的選項列表,例如“播放音樂”或“看點什麼”。 如果她選擇音樂,隨著她通過每個決策門的進展,它會變得更加具體,以發現她喜歡聽的類型; 就 Abba 而言,她會選擇“60 年代的音樂”。 這使蘇珊能夠更輕鬆地以適合她的速度導航到她想要的結果。 一直以來,貓頭鷹都在發光並回應她的聲音,讓她知道她被聽到和理解了。

蘇珊的語音助手讓她恢復了她因病情而失去的一些獨立性,從賦予她權力到給家人打電話,或者只是聽音樂。
蘇珊的語音助手讓她恢復了她因病情而失去的一些獨立性,從賦予她權力到給家人打電話,或者只是聽音樂。 (大預覽)

3. VUI 不僅僅是語音

語言交流的非詞彙成分賦予對話大量意義。 有些可以通過合成的聲音(語調、音高和說話速度、猶豫的聲音等等)來複製,但很多不能(例如手勢和麵部表情)。 產品的有形元素需要取代這些傳統的視覺提示,以使交互感覺更加自然。 但不僅如此。

首先,當有人與旨在復制人類行為的產品進行交互時,視覺組件會被用戶對世界的先入為主的概念(固有的和習得的)解釋並影響他們的情緒反應。 如果某件東西看起來氣勢磅礴而冷酷無情,那麼與看起來可愛可愛的東西相比,你發起對話的可能性要小得多。

在我們的案例中,由於該技術對用戶來說是如此陌生,我們需要讓它感覺盡可能地熟悉和吸引人——一隻貓頭鷹。 通過這樣做,我們希望消除我們在使用其他產品時所經歷的焦慮和挫敗感。 我們還放大了它的視覺方面——空閒狀態有一種顏色——柔和的光芒,幾乎就像呼吸一樣,但是當蘇珊說出喚醒詞時,光線會變成清醒和傾聽。

你可以走得更遠。 例如,Apple 的 Homepod 上有一個全彩顯示屏,這為他們的交互和可視化提供了更高水平的細微差別。 添加視覺體驗可能聽起來違反直覺,但可視化對用戶非常有幫助。

結論

儘管適用於個人用例,但這些頂級學習可以幫助任何希望利用語音提供的固有好處的項目。 個性化內容(在可能的情況下)提供了急需的清晰度,並且邏輯、相關的導航系統減少了認知負擔。 最後,不要低估視覺組件的重要性; 如果做得好,它們不僅能提供基本的對話線索,還能為整個互動定下基調。

對於那些希望嘗試語音的人來說,亞馬遜現在展示了星巴克和優步等公司以及其他創新設計師和開發人員創造的數以萬計的技能。 Alexa Skills Kit (ASK) 是自助服務 API、工具、文檔和代碼示例的集合,可讓您輕鬆地向 Alexa 添加技能並開始創建自己的解決方案。 想知道聲音是否有意義? 在您開始之前,這裡有一些注意事項。