Projektowanie wrażeń głosowych

Opublikowany: 2022-03-10

Szybkie podsumowanie ↬ Interfejsy głosowe stają się powszechne. Asystenci głosowi, tacy jak Siri i Cortana, istnieją już od kilku lat, ale w minionym okresie świątecznym urządzenia głosowe Amazon i Google trafiły do milionów domów. Ostatnia analiza VoiceLabs szacuje, że w tym roku zostanie wysłanych 24,5 miliona urządzeń głosowych, prawie cztery razy więcej niż w zeszłym roku. Jako projektanci doświadczeń mamy teraz możliwość projektowania doświadczeń głosowych i interfejsów!

Ostatnia analiza VoiceLabs szacuje, że w tym roku zostanie wysłanych 24,5 miliona urządzeń głosowych, prawie cztery razy więcej niż w zeszłym roku. Jako projektanci doświadczeń mamy teraz możliwość projektowania doświadczeń głosowych i interfejsów!

Nowy interfejs nie oznacza, że musimy lekceważyć wszystko, co z powodzeniem zastosowaliśmy do poprzednich interfejsów; będziemy musieli dostosować nasz proces do niuansów interfejsów sterowanych głosem, w tym interakcji konwersacyjnych i braku ekranu. Przyjrzymy się, jak działa typowy dżin w butelce, omówimy kroki związane z projektowaniem doświadczeń głosowych i zilustrujemy te kroki, projektując aplikację głosową dla Alexy (lub Skill, jak nazywa ją Amazon).

### Dalsza lektura na SmashingMag:

Poprawa doświadczenia użytkownika dzięki interfejsowi Web Speech API
Wskazówki dotyczące projektowania z dźwiękiem
Eksperymentowanie z mowąSynteza
Co to jest projektowanie doświadczeń użytkownika? Przegląd, narzędzia i zasoby

Więcej po skoku! Kontynuuj czytanie poniżej ↓

## Zrozumienie interfejsów głosowych Podobnie jak aplikacje mobilne działają na systemie operacyjnym i urządzeniu, trzy warstwy muszą ze sobą współpracować, aby umożliwić interakcje głosowe:

Warstwy głosowego interfejsu użytkownika — Warstwy umożliwiające interakcje głosowe

aplikacja głosowa (Amazon Skills and Actions dla Google);
platforma sztucznej inteligencji (Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana);
urządzenie (Echo, Home, smartfony, komputery).

Każda warstwa wykorzystuje warstwę poniżej i obsługuje warstwę powyżej. Interfejs głosowy znajduje się w dwóch górnych warstwach, z których obie znajdują się w chmurze, a nie na samym urządzeniu. Zajrzyjmy pod maskę, aby zobaczyć, jak te warstwy współpracują ze sobą, korzystając z Alexa Jeopardy! Umiejętność jako przykład.

Jak działają interfejsy głosowe — przykład umiejętności Jeopardy — Warstwy umożliwiające interakcje głosowe. (Wyświetl dużą wersję)

Urządzenia sterowane głosem, takie jak Amazon Echo i Google Home, nieustannie nasłuchują, czekając na słowo budzące („Alexa…” lub „OK, Google…”), aby wkroczyć do akcji. Po aktywacji urządzenie wysyła dźwięk do platformy AI w chmurze („… zagraj w Jeopardy!”). Platforma wykorzystuje połączenie automatycznego rozpoznawania mowy (ASR) i rozumienia języka naturalnego (NLU) w celu odszyfrowania zamiaru użytkownika (rozpoczęcia gry z ciekawostkami) i wysłania go do aplikacji wspierającej (Jeopardy! J6 Skill na Alexa). Aplikacja przetwarza żądanie i odpowiada za pomocą tekstu (i wizualizacji, jeśli dotyczy). Platforma konwertuje tekst na mowę i odtwarza go przez urządzenie („Witamy w Jeopardy J6. Oto dzisiejsze wskazówki…”). Wszystko to w ciągu kilku sekund.

Budowanie wrażeń głosowych

W zeszłym roku Mark Zuckerberg podjął się osobistego wyzwania, aby zbudować prostą sztuczną inteligencję do prowadzenia swojego domu. Zrobił, nazwał go Jarvis i nadał mu głos Morgana Freemana.

Mark Zuckerberg przedstawia Morganowi Freemanowi sztuczną inteligencję, która używa jego głosu. (Zdjęcie: Mark Zuckerberg)

Reszta z nas, która nie ma możliwości ani zasobów, aby zrobić to samo, może ujść na sucho, tworząc aplikacje głosowe działające na złożonych platformach sztucznej inteligencji, które zostały już zbudowane. To pozwala nam martwić się tylko projektowaniem i rozwojem aplikacji głosowej, a także uproszczonym procesem rozwoju. Amazon i Google zapewniły otwarty dostęp do szablonów, kodu i szczegółowych instrukcji krok po kroku, aby tworzyć różne typy aplikacji głosowych, do tego stopnia, że nawet osoby nie będące programistami mogą stworzyć aplikację w około godzinę!

Ich inwestycja w uproszczenie tworzenia aplikacji się opłaca, ponieważ co miesiąc uruchamiane są tysiące nowych aplikacji głosowych. Rozwój aplikacji głosowych przywołuje wspomnienia o internetowej gorączce złota z lat 90., a także eksplozji aplikacji mobilnych, która nastąpiła po uruchomieniu sklepów z aplikacjami.

Podział umiejętności Alexa według kategorii według stanu na maj 2017 r. — Podział umiejętności Alexa według kategorii, stan na maj 2017 r. (Wyświetl dużą wersję)

Na zatłoczonym rynku usług głosowych dobry projekt odróżnia Twoją aplikację głosową od setek innych podobnych aplikacji.

Projektowanie wrażeń głosowych

Projektowanie dobrego doświadczenia użytkownika głosowego to pięcioetapowy proces, który powinien mieć miejsce przed rozpoczęciem programowania. Chociaż przejście od razu do rozwoju może być kuszące, czas spędzony na poprawnym projekcie jest czasem dobrze spędzonym.

Kroki w projektowaniu doświadczeń głosowych — Etapy projektowania doświadczeń głosowych (Zobacz w dużej wersji)

Omówimy i zastosujemy każdy krok, aby zaprojektować aplikację głosową, którą można łatwo opracować przy użyciu jednego z wielu szablonów umiejętności dla Alexy.

1. Odkryj

Podróż do projektowania zaczyna się od pytania: „W jaki sposób ta aplikacja głosowa zapewni wartość moim użytkownikom?” To pytanie dotyczy tego, czy tworzysz samodzielną aplikację głosową (jak w naszym przykładzie), czy też aplikacja głosowa jest tylko jednym z wielu punktów styku dla klientów. Weź pod uwagę, dlaczego i gdzie ludzie korzystają z aplikacji głosowych. Jak pokazuje raport Mary Meeker 2016 Internet Trends Report, ludzie korzystają z interfejsów głosowych ze względu na korzyści płynące z interakcji bez użycia rąk, szybkość interakcji i łatwość użytkowania, przede wszystkim w domu lub w samochodzie.

Najważniejsze powody, dla których warto korzystać z interfejsów głosowych — Najważniejsze powody, dla których warto używać interfejsów głosowych (objaśnienia według autora) (Źródło: KPCB) (Wyświetl dużą wersję)

Kluczem jest znalezienie spójnych potrzeb użytkownika, które są łatwiejsze lub wygodniejsze za pomocą aplikacji głosowej, a nie telefonu lub komputera. Niektóre przykłady obejmują banki podające informacje o koncie lub widza, który znajduje nowe filmy odtwarzane w pobliżu.

Jeśli masz konkurentów, którzy mają już aplikacje głosowe, weź pod uwagę to, co robią oraz recenzje i opinie, które ich aplikacje otrzymały na rynku aplikacji (np. Amazon's Alexa Skill Store). Celem nie jest ślepe naśladowanie, ale bycie świadomym ustawionego paska możliwości, a także oczekiwań użytkowników.

(W momencie pisania tego tekstu było ponad 1500 „wiedzy i ciekawostek” umiejętności Alexa, co czyni je najbardziej zatłoczonymi kategoriami umiejętności na Amazon. Jednak nie było ani jednej umiejętności ciekawostek, która odnosiłaby się do obszaru doświadczenia użytkownika. Aby zilustrować proces projektowania głosu, stworzymy umiejętność projektowania UX, aby nasi czytelnicy mogli sprawdzić swoją wiedzę, a może nawet nauczyć się czegoś nowego.)

2. Zdefiniuj

Na tym etapie określimy osobowość naszej aplikacji i możliwości, jakie będzie ona miała.

Osobowość

Projektując interfejsy głosowe, nie mamy dostępu do wielu elementów wizualnych, których używamy w interfejsach internetowych i mobilnych, aby pokazać osobowość. Osobowość musi przejść przez głos i ton interakcji werbalnych. I w przeciwieństwie do Zuckerberga, który słyszy kojący głos Freemana, jesteśmy zmuszeni słyszeć domyślny głos urządzenia. To sprawia, że ton i słownictwo mają kluczowe znaczenie w przekazywaniu osobowości, którą chcemy przekazać.

Dobrą wiadomością jest to, że większość prac przygotowawczych w tym obszarze powinna być już ukończona i udokumentowana w przewodniku po marce korporacyjnej lub przewodniku po stylu strony internetowej (wskazówka: poszukaj sekcji „ton głosu”). Skorzystaj z tych wskazówek dla swojej aplikacji głosowej, a także zachowaj spójną osobowość we wszystkich kanałach i punktach kontaktu.

Kiedy myślę o osobowości i tonie, od razu przychodzi mi na myśl Virgin Group. Jasno określają, kim są i jak przekazują to użytkownikom. Dla Virgin America idealnym tonem jest „modny, wyluzowany, nieformalny, zabawny i z przymrużeniem oka” i jest to wyraźnie widoczne w całej ich komunikacji.

Osobowość marki Virgin America (Źródło: Virgin America)

Jeśli kiedykolwiek poprosiłeś Alexę o zaśpiewanie lub spróbowanie któregoś z licznych jajek wielkanocnych Alexy, będziesz wiedział, że ma własną osobowość. Zaciekawiony skontaktowałem się z zespołem odpowiedzialnym za jej osobowość i oto, co mieli do powiedzenia:

Projektując głos Alexy, staraliśmy się nadać jej osobowość, która odzwierciedla cechy, które najbardziej cenimy w Amazon. Chcieliśmy, aby czuła się pomocna, pokorna i mądra, a jednocześnie zachowywała poczucie dobrej zabawy. Jest to ciągły proces i spodziewamy się, że głos Alexy będzie ewoluował, ponieważ coraz więcej programistów skoncentruje się na uczynieniu jej mądrzejszą.

Osobowość może być również odzwierciedlona w nazwie aplikacji, ikonie i opisie, które są wyświetlane użytkownikom na liście katalogu aplikacji, a także w nazwie używanej do wywoływania aplikacji (nazwa wywołania). Upewnij się więc, że prześwituje podczas publikowania aplikacji.

Jeśli chodzi o nasze umiejętności projektowania UX, moglibyśmy przyjąć proste lub zabawne podejście, co znalazłoby odzwierciedlenie w sformułowaniu opcji pytań i odpowiedzi w naszym quizie.

Przykładem normalnego tonu będzie:

Która zasada projektowania UX przedkłada prostotę nad złożoność?
Brzytwa Ockhama
Prawo Hicka
Efekt estetyczno-użytkowy
Satysfakcjonujący

Przykładem zabawnego tonu byłoby:

Najwyraźniej istnieje zasada projektowania UX, która przedkłada prostotę nad złożoność. Naprawdę! Czy wiesz, jak to się nazywa?
Brzytwa Ockhama: najlepsze, co może dostać facet od UX.
Prawo Hicka: Brzmi jak coś, co wymyśliłby głupek UX.
Efekt estetyczno-użytkowy: to jakiś fantazyjny żargon UX.
Satysfakcja: nie mogę uzyskać żadnej satysfakcji… przepraszam Rolling Stones.

Tak, zostańmy przy normalności.

Możliwości

W tym miejscu dokładnie zastanawiasz się nad funkcjonalnością, która będzie cenna dla użytkowników Twojej aplikacji głosowej. Przyjrzyj się swojej pracy od pierwszego kroku, aby zidentyfikować kluczowe lub powiązane z Twoją działalnością możliwości. Czasami oferowanie podstawowych funkcji jest oczywiste — na przykład bank oferujący informacje o saldzie, transakcjach i terminach płatności. Inne oferują wartość w postaci powiązanych funkcji, takich jak aplikacja głosowa Tide do usuwania plam lub aplikacje głosowe Glad's (twórcy pojemników na żywność i worków na śmieci), z których jedna pomaga użytkownikom zapamiętać, gdzie przechowywali resztki lub inne taki, który pozwala użytkownikom sprawdzić, które przedmioty należy poddać recyklingowi lub wyrzucić do kosza.

Jeśli wykonałeś podobne ćwiczenie podczas przechodzenia z internetu na urządzenia mobilne, może to posłużyć jako punkt wyjścia. Jeśli chodzi o funkcje głosowe, zastanów się, jakie funkcje przyniosłyby korzyści Twoim użytkownikom na urządzeniu sterowanym głosem w przestrzeni współdzielonej. Jeśli umiejętność ma wpływ na bezpieczeństwo lub prywatność, rozważ dodanie poziomu ochrony (umiejętność Capital One Alexa pozwala użytkownikom utworzyć osobisty klucz dostępu do konta). Chociaż możesz skończyć z listą funkcji, które działają na głos, zacznij od jednego do pięciu podstawowych funkcji i używaj analizy głosu do aktualizacji i ulepszania po uruchomieniu.

Podstawowymi możliwościami umiejętności projektowania UX mogą być:

zapewnić zasadę projektowania UX na żądanie;
przetestuj użytkownika (single player) na zasadzie losowego UX;
wypytuj użytkownika (pojedynczego gracza) na temat wielu zasad UX i zachowaj wynik;
zorganizuj konkurs quizu UX z wieloma graczami.

Ponieważ budujemy tę umiejętność projektowania UX przy użyciu szablonów umiejętności Amazon, nasze wybory są obecnie ograniczone do pierwszej (szablon umiejętności faktów) lub trzeciej (szablon umiejętności ciekawostek) powyżej. Zakładając, że nasze badania wykazały, że dla naszych użytkowników quiz byłby bardziej wartościowy niż samo wysłuchanie recytowanej zasady UX, naszą podstawową umiejętnością będzie wypytywanie użytkownika z zasad UX i uzyskiwanie wyniku.

3. Szczegółowy przebieg rozmowy

Teraz, gdy masz już krótką listę możliwości swojej aplikacji głosowej, zacznij koncentrować się na szczegółowym przebiegu rozmów, które aplikacja będzie prowadzić ze swoimi użytkownikami. Ludzka rozmowa jest złożona; często ma wiele zwrotów akcji i może się zmienić w dowolnym momencie, a ludzie często przeskakują z jednego tematu na drugi. Platformy Voice AI wciąż mają przed sobą długą drogę do osiągnięcia tego poziomu złożoności, więc musisz nauczyć swoich umiejętności, jak reagować na użytkowników.

Twoja aplikacja głosowa może obsługiwać tylko funkcje zdefiniowane w poprzednim kroku, ale użytkownicy zawsze mają możliwość zadawania aplikacji dowolnych pytań i w dowolnym formacie. Szczegółowy przebieg konwersacji umożliwia udzielenie odpowiedzi użytkownikowi lub skierowanie konwersacji na to, co aplikacja może zrobić dla użytkownika.

Dla każdej funkcji obsługiwanej przez aplikację głosową zacznij tworzyć dialogi konwersacyjne między użytkownikiem a aplikacją, podobne do dialogów w scenariuszu. Pisząc te dialogi, pamiętaj o osobowości oraz cechach głosu i tonu. Zacznij tworzyć i dbać o rzeczywistą zawartość swojej aplikacji głosowej; dla naszego quizu oznaczałoby to zbudowanie listy pytań quizowych.

Zacznij od „szczęśliwej ścieżki” — przepływu konwersacji, w którym aplikacja głosowa może odpowiedzieć na żądanie użytkownika bez żadnych wyjątków czy błędów. Następnie przejdź do szczegółowego przebiegu konwersacji dla wyjątków (w których użytkownik nie podaje pełnych informacji) i błędów (w których aplikacja głosowa nie rozumie lub nie może wykonać tego, o co prosi użytkownik).

Ponieważ rozmowa będzie słyszana, a nie czytana, dobrą praktyką jest przeczytanie jej na głos, aby sprawdzić, czy brzmi ona jak naturalna rozmowa mówiona, i sprawdzić, czy przekazuje ton głosu, który zamierzałeś.

Jeśli Twoja aplikacja głosowa musi uzupełnić rozmowę treścią wyświetlaną w aplikacji telefonu, zaprojektuj te interakcje razem, tak aby wydawały się bezproblemowe dla użytkownika. Na przykład Umiejętność usuwania plam Tide informuje użytkownika, że oprócz wysłuchania instrukcji może również zapoznać się z etapami usuwania plam w aplikacji Alexa. Może to być wkrótce wymagane, jeśli plotki o ekranie dotykowym w nowym Echo są prawdziwe.

Oto przykładowy dialog dotyczący szczęśliwej ścieżki naszej podstawowej umiejętności projektowania UX:

Użytkownik : „Alexa, rozpocznij quiz dotyczący projektowania UX”.
Alexa : „Zadam ci pięć pytań z odpowiedziami wielokrotnego wyboru. Postaraj się uzyskać jak najwięcej prawidłowych wyników. Po prostu powiedz numer odpowiedzi. Zaczynajmy. Pytanie 1…"
Użytkownik : [odpowiada poprawnie]
Alexa : „Zgadza się! Twój wynik to 1. Oto pytanie 2…”
Użytkownik : [odpowiada niepoprawnie]
Alexa : „Ups, to zła odpowiedź. Prawidłowa odpowiedź to [prawidłowa odpowiedź]. Twój wynik to 1. Oto pytanie 3…”
…
Alexa (na końcu pięciu pytań): „Zgadza się! Udało ci się odpowiedzieć poprawnie na cztery z pięciu pytań. Dziękuję za grę!"

4. Opisz alternatywne zwroty

Ludzie nie zawsze używają tych samych słów, aby powiedzieć to samo, a aplikacji głosowych należy się tego nauczyć. Mapowanie wyrażeń to ćwiczenie, które uczy aplikacje głosowe uwzględniania różnic w sposobie, w jaki użytkownicy formułują swoje żądania.

W przypadku każdej ścieżki konwersacyjnej, którą opisałeś w poprzednim kroku, zastanów się, w jaki sposób użytkownicy mogą sformułować te prośby. Następnie podziel treść każdej prośby i zidentyfikuj odmiany słów i synonimy, których mogą używać, biorąc pod uwagę wszelkie regionalne odmiany i dialekty. Będziesz mieć pełne ręce roboty, jeśli Twoja aplikacja głosowa obsługuje słodzone napoje gazowane (soda, pop, cola, tonik, napój bezalkoholowy, napój gazowany), długie kanapki (sub, młynek, hoagie, hero, biedny chłopiec, bombowiec, włoska kanapka, bagietki) lub obuwie sportowe (trampki, buty, buty gimnastyczne, sandały, bluzy, buty do tenisa, buty do biegania, buty do biegania, trampki).

Postaraj się, aby ta lista odmian była jak najbardziej kompletna i wyczerpująca, aby aplikacja głosowa mogła zrozumieć żądania użytkowników. Alexa potrzebuje tych odmian w formie „wypowiedzi” i zaleca dostarczenie „… jak największej liczby reprezentatywnych fraz”. W zależności od możliwości Twojej aplikacji głosowej, liczba wypowiedzi może z łatwością sięgać setek, ale istnieją sposoby na uproszczenie generowania wypowiedzi.

Oto przykładowe mapowanie fraz dla możliwości naszego quizu projektowania UX. Platforma AI Alexy dobrze sobie radzi z tłumaczeniem intencji użytkownika dotyczących umiejętności na podstawie ich szablonów. Jeśli jednak wprowadzisz zmiany (tak jak zmieniliśmy „gra z ciekawostkami” na „quiz”), te frazy będą musiały zostać dodane.

5. Udoskonal

Ostatnim krokiem w procesie projektowania jest sprawdzenie i udoskonalenie aplikacji głosowej przed poświęceniem czasu i wysiłku na rozwój. Na etapie „szczegółów” czytanie na głos rozmów pomogło upewnić się, że brzmiały one naturalnie i konwersacyjnie. Obecny krok obejmuje testowanie interfejsu głosowego z użytkownikami.

Najprostszym sposobem testowania jest użycie techniki Wizard of Oz, w której osoba pełni rolę urządzenia sterowanego głosem i odpowiada użytkownikowi na podstawie skryptu interfejsu głosowego. Inną opcją jest użycie oprogramowania do prototypowania, takiego jak SaySpring, do tworzenia i testowania interaktywnych prototypów.

Jeśli Twoja aplikacja głosowa jest tworzona przy użyciu szablonów kodu (tak jak nasza aplikacja), może być łatwiej stworzyć aplikację i przetestować ją za pomocą narzędzi testowych dostarczonych przez Amazon i Google w obszarze Rozwój umiejętności (jak pokazano poniżej) lub w tryb testowy na rzeczywistym urządzeniu.

Testy te pozwolą Ci dobrze wyczuć wrażenia głosowe w świecie rzeczywistym, w tym obsługę błędów, powtarzających się odpowiedzi i odpowiedzi nienaturalnych, wymuszonych lub podobnych do maszyn.

Rozwijać

Teraz, gdy zaprojektowano obsługę głosową, nadszedł czas, aby przejść do fazy budowania, testowania i przesyłania. Każda platforma zawiera szczegółowe przewodniki i samouczki, które pomogą każdemu budować i testować umiejętności, w tym zestaw umiejętności Alexa, program Develop Actions dla Google i Cortana, które oferują możliwość ponownego wykorzystania niestandardowego kodu umiejętności Alexa!

Pomyśl o swojej pętli informacji zwrotnych i danych analitycznych, które pomogą Ci zrozumieć korzystanie z aplikacji głosowej. Możesz uzyskać wskaźniki umiejętności (użytkownicy, sesje, wypowiedzi, intencje) na swoim koncie programisty bez dodatkowego kodowania, ale zaawansowane analizy są dostępne za pośrednictwem bezpłatnych usług, takich jak VoiceLabs (nie mogłem go uruchomić, prawdopodobnie z powodu mojego braku kodowania umiejętności lub brak przewodnika po konfiguracji VoiceLabs for Dummies ).

Po zakończeniu tworzenia i testowania aplikacji głosowej ostatnim krokiem jest usprawniony proces przesyłania. Ponieważ rynek Alexa Skill szybko się rozrósł, odkrywanie nowych i przydatnych aplikacji staje się coraz trudniejsze. Dopóki Amazon to nie poprawi, używaj widocznych elementów listy aplikacji głosowych, aby pomóc użytkownikom znaleźć i wypróbować Twoją Umiejętność, w tym chwytliwą i odpowiednią ikonę umiejętności, nazwę i opis.

Umiejętność towarzysząca, która została zbudowana jako ilustracja, można wziąć na jazdę próbną w sklepie Amazon Alexa Skill: UX Design Quiz

Zasady przewodnie

Oto kilka przewodnich zasad projektowania doświadczeń głosowych. Więcej zasad i szczegółowych nakazów i zakazów jest oferowanych przez Amazon i Google.

Dołącz do użytkownika i pomóż mu zacząć

Przedstaw aplikację i sposoby interakcji z użytkownikiem.

Witamy w quizie projektowania UX. Zadam Ci pięć pytań na temat projektowania UX i zobaczę, ile masz racji. Możesz poprosić mnie o powtórzenie pytania lub pauzę, jeśli zajdzie taka potrzeba. Czy chcesz rozpocząć nowy quiz?

Utrzymuj krótkie rozmowy, aby zmniejszyć obciążenie poznawcze.

Dzięki głosowemu interfejsowi użytkownika użytkownik musi korzystać z pamięci krótkotrwałej podczas interakcji z aplikacją głosową. Więc niech będzie krótko i słodko.

Alexa : „Zasadę tę przypisuje się XIV-wiecznemu logikowi i franciszkaninowi, a jej nazwa pochodzi od wioski w angielskim hrabstwie Surrey, w której się urodził. W skrócie stwierdza, że prostota jest lepsza niż złożoność. Ta zasada rozwiązywania problemów może być łatwo zastosowana do projektowania doświadczeń użytkownika, wybierając prostsze rozwiązanie projektowe. Jak nazywa się ta zasada?
Twoja pierwsza opcja to Brzytwa Ockhama, czasami znana jako brzytwa Ockhama lub prawo skąpstwa.
Twoja następna opcja to Prawo Hicka, znane również jako Prawo Hicka-Hymana.
Twoja następna opcja to efekt estetyczno-użytkowy.
Twoja ostatnia opcja nazywa się „satysfakcjonowanie”, nie mylić z „satysfakcjonowaniem” lub „poświęceniem”.
Proszę powiedzieć A, B, C lub D, aby dokonać wyboru.
Użytkownik : „Hę?! Alexa, powtórz. Po namyśle, zakończ quiz!”

Przykłady działają lepiej niż instrukcje

Instrukcja: „Proszę podać swoją datę urodzenia w formacie miesiąc/dzień/rok”. Przykład: „Proszę podać swoją datę urodzenia, np. 15 kwietnia 1990”.

Rozkoszuj się bez zakłócania zadania

To jest akt równoważenia. Za dużo i szybko się męczy.

Używaj wyraźnych potwierdzeń dla ważnych działań i ukrytych dla mniej ryzykownych

Jeśli poprosisz Alexę o wyłączenie świateł, możesz to zobaczyć i nie potrzebujesz potwierdzenia słownego, chociaż czasami potwierdza to krótkim „OK”.

Nie wtrącaj się, zmniejsz powtarzalność — Opinie użytkowników dotyczące umiejętności Glad Leftover podkreślają dwie powyższe zasady.

Projekt na wypadek awarii

Wszystko pójdzie nie tak: zaprojektuj na takie sytuacje. Przykłady obejmują niezrozumiałe pytania lub informacje, niekompletne informacje, milczenie lub prośby, których nie można obsłużyć. Potwierdź i daj użytkownikowi opcje odzyskiwania.

Szanuj prywatność i bezpieczeństwo użytkownika

Szanuj prywatność i bezpieczeństwo użytkowników — Opinie użytkowników dotyczące banku Skill podkreślają problemy z bezpieczeństwem, pomimo spełnienia wymagań Alexa Skill Security.

Wniosek

Za każdym razem, gdy masz do czynienia z próbą interakcji z człowiekiem, musisz myśleć o ludziach jako o bardzo zaawansowanych systemach operacyjnych. Twoim najwyższym celem jest próba ich naśladowania. – KK Barrett, jej scenograf filmowy, Wired, 2014

Jeśli nie widziałeś filmu Ona, poświęć kilka godzin na obejrzenie futurystycznego filmu o samotnym pisarzu, który nawiązuje relację z systemem operacyjnym. Chociaż jest to science fiction, w dzisiejszym świecie wrażenia głosowe rosną wraz z przyjęciem samodzielnych urządzeń sterowanych głosem, takich jak rodzina Amazon Echo i Google Home. Tworzenie aplikacji głosowej jest stosunkowo prostym procesem opartym na szablonach, z instrukcjami podobnymi do IKEA dostarczonymi przez Amazon i Google w celu ustanowienia swoich platform. Chociaż przejście do programowania może być kuszące, dobre wrażenia użytkownika głosowego nie zdarzają się tak po prostu; należy go zaprojektować, wykonując czynności opisane w tym artykule.

Skorzystaj z obszaru komentarzy, aby podzielić się wszelkimi innymi opiniami, wskazówkami i zasobami z innymi czytelnikami.

Zasoby

Narzędzia AI Platform

Zestaw umiejętności Alexa, Amazon
Działania dla Google
„Najlepsze praktyki projektowania głosu Alexa Skills Kit”, Amazon
Działania dotyczące zasobów projektowych Google

Ton głosu

„Wpływ tonu głosu na postrzeganie marki przez użytkowników”, Kate Meyer, Nielsen Norman Group
„Znalezienie własnego tonu głosu”, Robert Mills, Smashing Magazine
„Znalezienie głosu swojej marki”, Harriet Cummings, destylowana

Zwroty i dialekty

„How Y'all, Youse and You Guys Talk (interaktywny quiz), New York Times
Definiowanie interfejsu głosowego (i wypowiedzi Alexa), Amazon
„Definiowanie wypowiedzi dla zestawu umiejętności Alexa” (wraz z narzędziem), Maker Musings

Prototypowanie i testowanie