Proiectarea experiențelor vocale

Publicat: 2022-03-10
Rezumat rapid ↬ Interfețele bazate pe voce devin obișnuite. Asistenții vocali precum Siri și Cortana există de câțiva ani, dar în sezonul de sărbători trecut, dispozitivele cu voce de la Amazon și Google și-au făcut loc în milioane de case. Analiza recentă de la VoiceLabs estimează că 24,5 milioane de dispozitive cu voce vor fi livrate în acest an, de aproape patru ori mai multe decât anul trecut. În calitate de designeri de experiență, acum avem oportunitatea de a proiecta experiențe vocale și interfețe!

Analiza recentă de la VoiceLabs estimează că 24,5 milioane de dispozitive cu voce vor fi livrate în acest an, de aproape patru ori mai multe decât anul trecut. În calitate de designeri de experiență, acum avem oportunitatea de a proiecta experiențe vocale și interfețe!

O interfață nouă nu înseamnă că trebuie să ignorăm tot ce am aplicat cu succes la interfețele anterioare; va trebui să ne adaptăm procesul pentru nuanțele interfețelor bazate pe voce, inclusiv interacțiunile conversaționale și lipsa unui ecran. Vom analiza cum funcționează un geniu tipic într-o sticlă, vom discuta pașii implicați în proiectarea experiențelor vocale și vom ilustra acești pași prin proiectarea unei aplicații vocale pentru Alexa (sau Skill, așa cum o numește Amazon).

### Citiți suplimentare despre SmashingMag:

  • Îmbunătățirea experienței utilizatorului cu API-ul Web Speech
  • Ghid pentru proiectarea cu audio
  • Experimentarea cu speechSinteza
  • Ce este User Experience Design? Prezentare generală, instrumente și resurse
Mai multe după săritură! Continuați să citiți mai jos ↓
## Înțelegerea interfețelor vocale La fel cum aplicațiile mobile rulează pe un sistem de operare și un dispozitiv, trei straturi trebuie să lucreze împreună pentru a permite interacțiunile vocale:
Straturi de interfață utilizator vocală
Straturile care permit interacțiunile vocale
  1. aplicație vocală (Amazon Skills and Actions pentru Google);
  2. platformă de inteligență artificială (Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana);
  3. dispozitiv (Echo, Home, smartphone-uri, computere).
Fiecare strat îl folosește pe cel de dedesubt și îl susține pe cel de deasupra lui. Interfața vocală se află în cele două straturi superioare, ambele rezidând în cloud, nu pe dispozitivul în sine. Să aruncăm o privire sub capotă pentru a vedea cum funcționează aceste straturi împreună, folosind Alexa Jeopardy! Abilitatea ca exemplu.

Cum funcționează interfețele vocale - exemplu de competență Jeopardy
Straturile care permit interacțiunile vocale. (Vezi versiunea mare)

Dispozitivele cu voce, cum ar fi Amazon Echo și Google Home ascultă în mod constant, așteaptă ca un cuvânt de trezire („Alexa…” sau „OK, Google…”) să intre în acțiune. Odată activat, dispozitivul trimite sunetul care urmează către platforma AI din cloud („... play Jeopardy!”). Platforma folosește o combinație de recunoaștere automată a vorbirii (ASR) și înțelegerea limbajului natural (NLU) pentru a descifra intenția utilizatorului (de a începe un joc trivia) și a o trimite la aplicația de suport (Jeopardy! J6 Skill pe Alexa). Aplicația procesează cererea și răspunde prin text (și un vizual, dacă este cazul). Platforma convertește textul în vorbire și îl redă prin intermediul dispozitivului („Bine ați venit la Jeopardy J6. Iată indicii de astăzi...”). Toate acestea în câteva secunde.

Construirea experiențelor vocale

Anul trecut, Mark Zuckerberg a acceptat o provocare personală de a construi un AI simplu pentru a-și conduce casa. A făcut-o, l-a numit Jarvis și i-a dat vocea lui Morgan Freeman.

Mark Zuckerberg îl prezintă pe Morgan Freeman cu inteligența artificială care îi folosește vocea
Mark Zuckerberg îl prezintă pe Morgan Freeman cu inteligența artificială care îi folosește vocea. (Imagine: Mark Zuckerberg)

Ceilalți dintre noi, care nu avem capacitatea sau resursele de a face același lucru, putem scăpa cu construirea de aplicații vocale care rulează pe platforme complexe de IA care au fost deja construite. Acest lucru ne eliberează să ne facem griji doar cu privire la proiectarea și dezvoltarea aplicației vocale, și asta cu un proces de dezvoltare simplificat. Amazon și Google au oferit acces deschis la șabloane, cod și instrucțiuni detaliate pas cu pas pentru a crea diferite tipuri de aplicații vocale, până la punctul în care chiar și cei care nu sunt dezvoltatori ar putea dezvolta o aplicație în aproximativ o oră!

Investiția lor în simplificarea dezvoltării aplicațiilor dă roade, mii de aplicații vocale noi fiind lansate în fiecare lună. Creșterea aplicațiilor de voce readuce în minte amintiri din goana aurului web din anii '90, precum și explozia de aplicații mobile care a urmat lansării magazinelor de aplicații.

Defalcarea abilităților Alexa pe categorii din mai 2017
Defalcarea abilităților Alexa pe categorii din mai 2017. (Vedeți versiunea mare)

Într-o piață de voce aglomerată, designul bun este ceea ce vă va diferenția aplicația vocală de sutele de alte aplicații similare.

Proiectarea experiențelor vocale

Proiectarea unei experiențe bune de utilizator vocal este un proces în cinci pași care ar trebui să aibă loc înainte de a începe dezvoltarea. Deși sări direct în dezvoltare ar putea fi tentant, timpul petrecut pentru realizarea corectă a designului este timpul petrecut bine.

Pași în proiectarea experiențelor vocale
Pașii în proiectarea experiențelor vocale (Vezi versiunea mare)

Vom discuta și vom aplica fiecare pas pentru a proiecta o aplicație vocală, care ar putea fi dezvoltată cu ușurință folosind unul dintre multele șabloane Skill pentru Alexa.

1. Descoperă

Călătoria de proiectare începe cu întrebarea „Cum va oferi această aplicație vocală valoare utilizatorilor mei?” Această întrebare se aplică dacă dezvoltați o aplicație vocală autonomă (cum ar fi exemplul nostru) sau dacă aplicația dvs. vocală este doar unul dintre multele puncte de contact pentru clienții dvs. Luați în considerare de ce și unde oamenii folosesc aplicațiile vocale. Oamenii folosesc interfețele vocale din cauza beneficiilor interacțiunii hands-free, a vitezei de interacțiune și a ușurinței de utilizare, folosindu-l în primul rând acasă sau în mașină, așa cum se arată în Raportul privind tendințele internetului din 2016 al lui Mary Meeker.

Principalele motive pentru a utiliza interfețele vocale
Principalele motive pentru a utiliza interfețele vocale (înștiințări după autor) (Sursa: KPCB) (Vedeți versiunea mare)

Cheia este să găsiți nevoile consecvente ale utilizatorilor, care sunt mai ușor sau mai convenabile printr-o aplicație vocală, mai degrabă decât printr-un telefon sau un computer. Unele exemple includ băncile care furnizează informații despre cont sau un cinefil care găsește filme noi care rulează în apropiere.

Dacă aveți concurenți care au deja aplicații de voce, luați în considerare ceea ce fac aceștia și recenziile și feedback-urile pe care aplicațiile lor le-au primit pe piața de aplicații (cum ar fi Magazinul de abilități Alexa de la Amazon). Scopul nu este de a imita orbește, ci de a fi conștienți de bara de capabilități care a fost setată, precum și de așteptările utilizatorilor.

(La momentul scrierii acestui articol, existau peste 1.500 de abilități Alexa de „cunoștințe și trivia”, ceea ce face ca acestea să fie cele mai aglomerate categorii de abilități de pe Amazon. Cu toate acestea, nu a existat o singură abilitate trivia care să se adreseze domeniului experienței utilizatorului. Pentru a ilustra procesul de proiectare a vocii, vom crea o abilitate de design UX, pentru ca cititorii noștri să-și testeze cunoștințele sau poate chiar să învețe ceva nou.)

2. Definiți

În acest pas, vom defini personalitatea aplicației noastre și capacitățile pe care le va avea.

Personalitate

Când proiectăm interfețe de voce, nu avem acces la multe dintre elementele vizuale pe care le folosim în interfețele web și mobile pentru a arăta o personalitate. Personalitatea trebuie să vină prin vocea și tonul interacțiunilor verbale. Și spre deosebire de Zuckerberg, care aude vocea liniștitoare a lui Freeman, suntem constrânși să auzim vocea implicită a dispozitivului. Acest lucru face ca tonul și formularea să fie cruciale în transmiterea personalității pe care vrem să o transmitem.

Vestea bună este că cea mai mare parte a lucrărilor de bază din acest domeniu ar fi trebuit deja finalizate și documentate într-un ghid de brand corporativ sau într-un ghid de stil pentru site-ul web (sfat: căutați secțiunea „tonul vocii”). Folosiți aceste reguli pentru aplicația dvs. de voce, precum și pentru a menține o personalitate consecventă pe canale și puncte de contact.

Când mă gândesc la personalitate și ton, îmi vine imediat în minte Virgin Group. Ei definesc clar cine sunt și cum transmit asta utilizatorilor. Pentru Virgin America, tonul ideal este „șold, ușor de îndurat, informal, jucăuș și limbă în obraz” și apare clar în toată comunicarea lor.

Personalitatea mărcii Virgin America
Personalitatea mărcii Virgin America (Sursa: Virgin America)

Dacă ați rugat-o vreodată pe Alexa să cânte sau ați încercat oricare dintre numeroasele ouă de Paște ale Alexa, atunci veți ști că are o personalitate proprie. Curios, am luat legătura cu echipa responsabilă de personalitatea ei și iată ce au avut de spus:

Când am proiectat vocea lui Alexa, am încercat să-i oferim o personalitate care să reflecte atributele pe care le prețuim cel mai mult la Amazon. Am vrut ca ea să se simtă de ajutor, umilă și inteligentă, păstrând în același timp un sentiment de distracție. Acesta este un proces în desfășurare și ne așteptăm ca vocea lui Alexa să evolueze pe măsură ce mai mulți dezvoltatori se concentrează pe a o face mai inteligentă.

Personalitatea se poate reflecta și în numele aplicației, pictograma și descrierea care sunt afișate utilizatorilor în lista directorului aplicației, precum și în numele folosit pentru a invoca aplicația (numele invocarii). Așadar, asigurați-vă că aceasta se manifestă în timp ce vă publicați aplicația.

Pentru abilitățile noastre de UX Design, am putea adopta o abordare simplă sau amuzantă, iar asta s-ar reflecta în formularea opțiunilor de întrebări și răspunsuri ale testului nostru.

Un exemplu de ton normal ar fi:

Ce principiu de design UX favorizează simplitatea în detrimentul complexității?
  1. Briciul lui Occam
  2. Legea lui Hick
  3. Efect estetic-utilizabilitate
  4. Satisfacator

Și un exemplu de ton amuzant ar fi:

Aparent, există un principiu de design UX care favorizează simplitatea în detrimentul complexității. Într-adevăr! Poți ghici cum se numește?
  1. Razorul lui Occam: Cel mai bun lucru pe care îl poate obține un tip UX.
  2. Legea lui Hick: Sună ca ceva cu care ar veni un bumpkin UX.
  3. Efect de utilizare estetică: acesta este un jargon UX de lux.
  4. Satisfăcător: Nu pot primi nicio satisfacție... scuze pentru Rolling Stones.

Da, să rămânem cu normalul.

Capabilități

Aici vă gândiți cu atenție la funcționalitatea care va fi valoroasă pentru utilizatorii aplicației dvs. de voce. Revizuiți-vă munca încă de la primul pas pentru a identifica capacitățile de bază sau legate de afacerea dvs. Uneori, oferirea de capabilități de bază este o idee simplă - cum ar fi o bancă care oferă informații despre sold, tranzacții și termenele scadente. Alții oferă valoare sub formă de caracteristici asociate, cum ar fi aplicația vocală pentru ghidul de îndepărtare a petelor de la Tide sau aplicațiile vocale Glad (producătorii de depozitare a alimentelor și pungi de gunoi), dintre care una îi ajută pe utilizatori să-și amintească unde și-au depozitat resturile sau cealaltă. unul care permite utilizatorilor să verifice ce articole trebuie reciclate sau aruncate la gunoi.

Dacă ați făcut un exercițiu similar când ați trecut de la web la mobil, acesta poate servi drept punct de plecare. Pentru capabilitățile de voce, luați în considerare ce capabilități ar beneficia utilizatorii dvs. de pe un dispozitiv cu voce într-un spațiu partajat. Dacă o abilitate are implicații privind securitatea sau confidențialitatea, luați în considerare adăugarea unui nivel de protecție (Capital One Alexa Skill permite utilizatorilor să creeze o cheie personală pentru accesul la cont). Deși s-ar putea să ajungeți cu o listă completă de funcționalități care ar funcționa prin voce, începeți cu una până la cinci capabilități de bază și utilizați analiza vocală pentru a actualiza și îmbunătăți după lansare.

Capacitățile de bază ale unei abilități de design UX ar putea fi:

  1. furnizarea unui principiu de design UX la cerere;
  2. chestionează utilizatorul (un singur jucător) pe principiul UX aleatoriu;
  3. chestionează utilizatorul (un singur jucător) pe principiul UX multiple și păstrează scorul;
  4. organizați o competiție de test UX cu mai mulți jucători.

Deoarece construim această abilitate de proiectare UX folosind șabloanele de abilități Amazon, alegerile noastre sunt în prezent limitate fie la prima (șablon de abilități de fapt) fie la a treia (șablon de abilități trivia) de mai sus. Presupunând că cercetarea noastră a arătat că utilizatorii noștri ar găsi un test mai valoros decât să audă un principiu UX recitat, capacitatea noastră de bază va fi să interogăm utilizatorul cu privire la principiile UX și să păstrăm scorul.

3. Fluxul de detaliu al conversației

Acum că ați selectat capabilitățile aplicației dvs. vocale, începeți să vă concentrați pe fluxul detaliat al conversației pe care aplicația îl va avea cu utilizatorii săi. Conversația umană este complexă; are adesea multe răsturnări și poate pivota oricând, oamenii sărind adesea de la un subiect la altul. Platformele Voice AI au încă un drum lung de parcurs pentru a se potrivi cu acest nivel de complexitate, așa că trebuie să-ți înveți abilitățile cum să răspunzi utilizatorilor.

Aplicația dvs. vocală poate accepta numai capacitățile pe care le-ați definit la pasul anterior, dar utilizatorii au întotdeauna posibilitatea de a cere aplicației orice și în orice format. Detalierea unui flux de conversație vă permite să răspundeți utilizatorului sau să conduceți conversația către ceea ce aplicația poate face pentru utilizator.

Pentru fiecare capacitate pe care o va accepta aplicația vocală, începeți să creați dialoguri conversaționale între utilizator și aplicație, similare dialogurilor dintr-un scenariu. Pe măsură ce scrieți aceste dialoguri, amintiți-vă personalitatea, precum și caracteristicile vocii și a tonului. Începeți să creați și să gestionați conținutul real pentru aplicația dvs. vocală; pentru testul nostru, aceasta ar însemna construirea listei de întrebări din test.

Începeți cu „calea fericită” – un flux conversațional în care aplicația vocală poate răspunde la cererea utilizatorului fără excepții sau erori. Apoi, treceți la detalierea fluxului conversațional pentru excepții (în care utilizatorul nu furnizează informații complete) și erori (în care aplicația vocală nu înțelege sau nu poate face ceea ce cere utilizatorul).

Deoarece conversația va fi auzită și nu citită, o bună practică este să o citiți cu voce tare pentru a vedea dacă sună ca o conversație vorbită naturală și pentru a verifica dacă transmite tonul vocii pe care l-ați dorit.

Dacă aplicația dvs. vocală trebuie să suplimenteze conversația cu conținut afișat în aplicația pentru telefon, proiectați împreună aceste interacțiuni, astfel încât să pară perfecte pentru utilizator. De exemplu, abilitate de îndepărtare a petelor de la Tide informează utilizatorul că ar putea să facă referire și la pașii de îndepărtare a petelor din aplicația Alexa, pe lângă audierea instrucțiunilor. Acest lucru poate fi necesar în curând dacă zvonurile despre un ecran tactil pe noul Echo sunt adevărate.

Iată un exemplu de dialog pentru calea fericită, capacitatea de bază a competenței noastre de design UX:

Utilizator : „Alexa, începe testul de design UX.”

Alexa : „Îți voi pune cinci întrebări, cu răspunsuri cu variante multiple. Încercați să obțineți cât mai multe dreptate. Spuneți doar numărul răspunsului. Sa incepem. Intrebarea 1…"

Utilizator : [răspunde corect]

Alexa : „Așa este corect! Scorul tău este 1. Iată întrebarea 2...”

Utilizator : [răspunde incorect]

Alexa : „Hopa, acesta este răspunsul greșit. Răspunsul corect este [răspunsul corect]. Scorul tău este 1. Iată întrebarea 3...”

Alexa (la sfârșitul celor cinci întrebări): „Așa este corect! Ai primit corect patru din cinci întrebări. Iti multumesc ca ai jucat!"

4. Descrieți expresii alternative

Oamenii nu folosesc întotdeauna aceleași cuvinte pentru a spune același lucru, iar aplicațiile vocale trebuie învățate asta. Maparea expresiilor este un exercițiu pentru a învăța aplicațiile vocale să se adapteze la variații în modul în care utilizatorii își formulează cererile.

Pentru fiecare cale conversațională pe care ați detaliat-o în pasul anterior, gândiți-vă la diferitele moduri în care utilizatorii ar putea formula acele solicitări. Apoi descompuneți formularea fiecărei cereri și identificați variantele de cuvinte și sinonimele pe care le-ar putea folosi, ținând cont de orice variații regionale și dialecte. Veți avea mâinile pline dacă aplicația dvs. vocală se ocupă de băuturi carbogazoase îndulcite (sodă, pop, coca-cola, tonic, băutură răcoritoare, băutură gazoasă), sandvișuri lungi (sub, râșniță, hoagie, erou, biet băiat, bombardier, sandviș italian, baghetă) sau încălțăminte de atletism (adidași, pantofi, pantofi de sport, pantofi de nisip, săritori, tenisi, pantofi de alergare, alergători, antrenori).

Faceți această listă de variații cât mai completă și exhaustivă posibil, astfel încât aplicația dvs. vocală să poată înțelege solicitările utilizatorilor. Alexa are nevoie de aceste variații sub formă de „enunțuri” și recomandă furnizarea de „... cât mai multe fraze reprezentative posibil.” În funcție de capacitățile aplicației dvs. de voce, numărul de enunțuri poate ajunge cu ușurință la sute, dar există modalități de a simplifica generarea de enunțuri.

Iată un exemplu de mapare a frazelor pentru o capacitate a testului nostru de design UX. Platforma AI a Alexa face o treabă bună de a traduce intenția utilizatorului pentru abilități pe baza șabloanelor lor. Cu toate acestea, dacă faceți modificări (cum am schimbat „joc trivia” în „quiz”), atunci aceste fraze vor trebui adăugate.

Exemplu de mapare a frazelor
Vezi versiunea mare

5. Rafinați

Pasul final al procesului de proiectare este validarea și rafinarea aplicației vocale înainte de a cheltui timp și efort pentru dezvoltare. În timpul pasului de „detaliu”, citirea fluxurilor de conversație cu voce tare a ajutat să vă asigurați că suna natural și conversațional. Pasul actual presupune testarea interfeței vocale cu utilizatorii.

Cel mai simplu mod de a testa este folosirea tehnicii Vrăjitorul din Oz, o persoană jucând rolul dispozitivului cu voce și răspunzând utilizatorului pe baza scriptului interfeței vocale. O altă opțiune este utilizarea unui software de prototipare, cum ar fi SaySpring, pentru a crea și testa prototipuri interactive.

Dacă aplicația dvs. vocală este creată folosind șabloane de cod (cum este aplicația noastră), atunci ar putea fi mai ușor să creați aplicația și să o testați folosind instrumente de testare furnizate de Amazon și Google în zona de dezvoltare a competențelor (după cum se arată mai jos) sau în modul de testare pe un dispozitiv real.

Simulator de abilități Alexa

Această testare vă va oferi o senzație bună pentru experiența vocală în lumea reală, inclusiv gestionarea erorilor, răspunsurile repetitive și răspunsurile nenaturale, forțate sau similare unei mașini.

Dezvolta

Acum că experiența vocală a fost concepută, este timpul să trecem la faza de construire-test-trimitere. Fiecare platformă are ghiduri și tutoriale detaliate pentru a ajuta pe oricine să-și dezvolte și să testeze abilitățile, inclusiv Alexa Skills Kit, Develop Actions pentru Google și Cortana, care oferă reutilizarea codului de abilități Alexa personalizat!

Gândiți-vă la bucla de feedback și la analizele care vă vor ajuta să înțelegeți modul de utilizare a aplicației dvs. de voce. Puteți obține valori de aptitudini (utilizatori, sesiuni, enunțuri, intenții) în contul dvs. de dezvoltator fără nicio codificare suplimentară, dar analize avansate sunt disponibile prin servicii gratuite, cum ar fi VoiceLabs (nu am putut să funcționeze, probabil din cauza lipsei mele de codare competențe sau lipsa unui ghid de configurare VoiceLabs for Dummies ).

După ce ați terminat de construit și testat aplicația vocală, ultimul pas este un proces simplificat de trimitere. Deoarece piața Alexa Skill a crescut rapid, descoperirea de aplicații noi și utile devine dificilă. Până când Amazon îmbunătățește acest lucru, utilizați elemente vizibile din lista aplicației dvs. vocale pentru a ajuta utilizatorii să vă găsească și să încerce abilitatile dvs., inclusiv o pictogramă, un nume și o descriere a abilității atrăgătoare și relevante.

Abilitatea însoțitoare care a fost construită ca ilustrație poate fi luată pentru un test drive în magazinul Amazon Alexa Skill: UX Design Quiz

Principii directoare

Iată câteva principii directoare pentru proiectarea experiențelor vocale. Mai multe principii și lucruri detaliate de făcut și de ce nu trebuie făcute sunt oferite de Amazon și Google.

Încorporați utilizatorul și ajutați-l să înceapă

Prezentați aplicația și modurile în care utilizatorul poate interacționa cu ea.

Bun venit la Testul de design UX. Îți voi pune cinci întrebări despre designul UX și voi vedea câte ai dreptate. Puteți să-mi cereți să repet o întrebare sau să fac o pauză dacă este necesar. Doriți să începeți un nou test?

Păstrați schimburile de conversație scurte pentru a reduce încărcătura cognitivă.

Cu o interfață de utilizator vocală, utilizatorul trebuie să își folosească memoria pe termen scurt în timp ce interacționează cu aplicația vocală. Așadar, ține-l scurt și dulce.

Alexa : „Acest principiu este atribuit unui logician și călugăr franciscan din secolul al XIV-lea și poartă numele satului din comitatul englez Surrey unde s-a născut. Pe scurt, se afirmă că simplitatea este mai bună decât complexitatea. Acest principiu de rezolvare a problemelor poate fi aplicat cu ușurință în proiectarea experienței utilizatorului, mergând spre soluția de proiectare mai simplă. Cum se numește acest principiu?
  1. Prima ta opțiune este briciul lui Occam, uneori cunoscut sub numele de briciul lui Ockham sau legea parcimoniei.
  2. Următoarea opțiune este Legea lui Hick, cunoscută și sub numele de Legea Hick-Hyman.
  3. Următoarea opțiune este efectul de utilizare estetică.
  4. Ultima ta opțiune se numește „satisfăcător”, care nu trebuie confundat cu „satisfăcător” sau „sacrificiu”.

Vă rugăm să spuneți A, B, C sau D pentru a alege.”

Utilizator : „Huh?! Alexa, repetă. Dacă te gândești bine, încheie testul!”

Exemplele funcționează mai bine decât instrucțiunile

Instrucțiune: „Vă rugăm să spuneți data nașterii în formatul lună/zi/an”. Exemplu: „Vă rugăm să spuneți data nașterii, cum ar fi 15 aprilie 1990”.

Încântați fără a interfera cu sarcina

Acesta este un act de echilibru. Prea mult și devine rapid obositor.

Utilizați Confirmări explicite pentru acțiuni importante și implicite pentru mai puțin riscante

Dacă îi cereți lui Alexa să stingă luminile, puteți vedea că se întâmplă și nu aveți nevoie de o confirmare verbală, deși ea confirmă uneori cu un scurt „OK”.

Nu interveni, reduce repetitivitatea
Feedback-ul utilizatorilor pentru abilitate Glad Leftover evidențiază două principii de mai sus.

Design pentru eșec

Lucrurile vor merge prost: proiectare pentru acele situații. Exemplele includ întrebări sau informații neinteligibile, informații incomplete, tăcere sau solicitări care nu pot fi tratate. Recunoașteți și oferiți utilizatorului opțiuni de recuperare.

Respectați confidențialitatea și securitatea utilizatorului

Respectați confidențialitatea și securitatea utilizatorului
Feedback-ul utilizatorilor pentru o abilitate bancară evidențiază problemele de securitate, în ciuda faptului că respectă cerințele de securitate Alexa Skill.

Concluzie

Ori de câte ori ai de-a face cu încercarea de a interacționa cu un om, trebuie să te gândești la oameni ca la sisteme de operare foarte avansate. Cel mai înalt obiectiv al tău este să încerci să le emulezi. – KK Barrett, designerul ei de producție de film, Wired, 2014

Dacă nu ați văzut filmul Her, faceți câteva ore pentru a viziona acest film futurist despre un scriitor singuratic care dezvoltă o relație cu un sistem de operare. Deși este știință ficțiune, în lumea de azi, experiențele vocale cresc odată cu adoptarea dispozitivelor autonome bazate pe voce, cum ar fi familia Amazon Echo și Google Home. Dezvoltarea unei aplicații de voce este un proces relativ simplu, bazat pe șabloane, cu instrucțiuni asemănătoare IKEA furnizate de Amazon și Google în încercarea de a-și stabili platformele. Deși săriți în dezvoltare poate fi tentant, o experiență bună pentru utilizatorul vocal nu se întâmplă doar; trebuie proiectat, parcurgând pașii descriși în acest articol.

Vă rugăm să folosiți zona de comentarii pentru a împărtăși orice alte feedback, sfaturi și resurse altor cititori.

Resurse

Instrumente AI Platform

  • Alexa Skills Kit, Amazon
  • Acțiuni pentru Google
  • „Alexa Skills Kit Voice Design Best Practices”, Amazon
  • Acțiuni pentru resursele de proiectare Google

Tonul vocii

  • „Impactul tonului vocii asupra percepției mărcii utilizatorilor”, Kate Meyer, Nielsen Norman Group
  • „Găsește-ți tonul vocii”, Robert Mills, Smashing Magazine
  • „Găsirea vocii mărcii tale”, a spus Harriet Cummings

Expresii și dialecte

  • „Cum vorbești, Youse and You Guys Talk (test interactiv), New York Times
  • Definirea interfeței vocale (și a afirmațiilor Alexa), Amazon
  • „Defining Utterances for the Alexa Skills Kit” (inclusiv instrumentul), Maker Musings

Prototiparea și testarea

Iată un exemplu de mapare a frazelor pentru o capacitate a testului nostru de design UX. Platforma AI a Alexa face o treabă bună de a traduce intenția utilizatorului pentru abilități pe baza șabloanelor lor. Cu toate acestea, dacă faceți modificări (cum am schimbat „joc trivia” în „quiz”), atunci aceste fraze vor trebui adăugate.

Exemplu de mapare a frazelor
Vezi versiunea mare

5. Rafinați

Pasul final al procesului de proiectare este validarea și rafinarea aplicației vocale înainte de a cheltui timp și efort pentru dezvoltare. În timpul pasului de „detaliu”, citirea fluxurilor de conversație cu voce tare a ajutat să vă asigurați că suna natural și conversațional. Pasul actual presupune testarea interfeței vocale cu utilizatorii.

Cel mai simplu mod de a testa este folosirea tehnicii Vrăjitorul din Oz, o persoană jucând rolul dispozitivului cu voce și răspunzând utilizatorului pe baza scriptului interfeței vocale. O altă opțiune este utilizarea unui software de prototipare, cum ar fi SaySpring, pentru a crea și testa prototipuri interactive.

Dacă aplicația dvs. vocală este creată folosind șabloane de cod (cum este aplicația noastră), atunci ar putea fi mai ușor să creați aplicația și să o testați folosind instrumente de testare furnizate de Amazon și Google în zona de dezvoltare a competențelor (după cum se arată mai jos) sau în modul de testare pe un dispozitiv real.

Simulator de abilități Alexa

Această testare vă va oferi o senzație bună pentru experiența vocală în lumea reală, inclusiv gestionarea erorilor, răspunsurile repetitive și răspunsurile nenaturale, forțate sau similare unei mașini.

Dezvolta

Acum că experiența vocală a fost concepută, este timpul să trecem la faza de construire-test-trimitere. Fiecare platformă are ghiduri și tutoriale detaliate pentru a ajuta pe oricine să-și dezvolte și să testeze abilitățile, inclusiv Alexa Skills Kit, Develop Actions pentru Google și Cortana, care oferă reutilizarea codului de abilități Alexa personalizat!

Gândiți-vă la bucla de feedback și la analizele care vă vor ajuta să înțelegeți modul de utilizare a aplicației dvs. de voce. Puteți obține valori de aptitudini (utilizatori, sesiuni, enunțuri, intenții) în contul dvs. de dezvoltator fără nicio codificare suplimentară, dar analize avansate sunt disponibile prin servicii gratuite, cum ar fi VoiceLabs (nu am putut să funcționeze, probabil din cauza lipsei mele de codare competențe sau lipsa unui ghid de configurare VoiceLabs for Dummies ).

După ce ați terminat de construit și testat aplicația vocală, ultimul pas este un proces simplificat de trimitere. Deoarece piața Alexa Skill a crescut rapid, descoperirea de aplicații noi și utile devine dificilă. Până când Amazon îmbunătățește acest lucru, utilizați elemente vizibile din lista aplicației dvs. vocale pentru a ajuta utilizatorii să vă găsească și să încerce abilitatile dvs., inclusiv o pictogramă, un nume și o descriere a abilității atrăgătoare și relevante.

Abilitatea însoțitoare care a fost construită ca ilustrație poate fi luată pentru un test drive în magazinul Amazon Alexa Skill: UX Design Quiz

Principii directoare

Iată câteva principii directoare pentru proiectarea experiențelor vocale. Mai multe principii și lucruri detaliate de făcut și de ce nu trebuie făcute sunt oferite de Amazon și Google.

Încorporați utilizatorul și ajutați-l să înceapă

Prezentați aplicația și modurile în care utilizatorul poate interacționa cu ea.

Bun venit la Testul de design UX. Îți voi pune cinci întrebări despre designul UX și voi vedea câte ai dreptate. Puteți să-mi cereți să repet o întrebare sau să fac o pauză dacă este necesar. Doriți să începeți un nou test?

Păstrați schimburile de conversație scurte pentru a reduce încărcătura cognitivă.

Cu o interfață de utilizator vocală, utilizatorul trebuie să își folosească memoria pe termen scurt în timp ce interacționează cu aplicația vocală. Așadar, ține-l scurt și dulce.

Alexa : „Acest principiu este atribuit unui logician și călugăr franciscan din secolul al XIV-lea și poartă numele satului din comitatul englez Surrey unde s-a născut. Pe scurt, se afirmă că simplitatea este mai bună decât complexitatea. Acest principiu de rezolvare a problemelor poate fi aplicat cu ușurință în proiectarea experienței utilizatorului, mergând spre soluția de proiectare mai simplă. Cum se numește acest principiu?
  1. Prima ta opțiune este briciul lui Occam, uneori cunoscut sub numele de briciul lui Ockham sau legea parcimoniei.
  2. Următoarea opțiune este Legea lui Hick, cunoscută și sub numele de Legea Hick-Hyman.
  3. Următoarea opțiune este efectul de utilizare estetică.
  4. Ultima ta opțiune se numește „satisfăcător”, care nu trebuie confundat cu „satisfăcător” sau „sacrificiu”.

Vă rugăm să spuneți A, B, C sau D pentru a alege.”

Utilizator : „Huh?! Alexa, repetă. Dacă te gândești bine, încheie testul!”

Exemplele funcționează mai bine decât instrucțiunile

Instrucțiune: „Vă rugăm să spuneți data nașterii în formatul lună/zi/an”. Exemplu: „Vă rugăm să spuneți data nașterii, cum ar fi 15 aprilie 1990”.

Încântați fără a interfera cu sarcina

Acesta este un act de echilibru. Prea mult și devine rapid obositor.

Utilizați Confirmări explicite pentru acțiuni importante și implicite pentru mai puțin riscante

Dacă îi cereți lui Alexa să stingă luminile, puteți vedea că se întâmplă și nu aveți nevoie de o confirmare verbală, deși ea confirmă uneori cu un scurt „OK”.

Nu interveni, reduce repetitivitatea
Feedback-ul utilizatorilor pentru abilitate Glad Leftover evidențiază două principii de mai sus.

Design pentru eșec

Lucrurile vor merge prost: proiectare pentru acele situații. Exemplele includ întrebări sau informații neinteligibile, informații incomplete, tăcere sau solicitări care nu pot fi tratate. Recunoașteți și oferiți utilizatorului opțiuni de recuperare.

Respectați confidențialitatea și securitatea utilizatorului

Respectați confidențialitatea și securitatea utilizatorului
Feedback-ul utilizatorilor pentru o abilitate bancară evidențiază problemele de securitate, în ciuda faptului că respectă cerințele de securitate Alexa Skill.

Concluzie

Ori de câte ori ai de-a face cu încercarea de a interacționa cu un om, trebuie să te gândești la oameni ca la sisteme de operare foarte avansate. Cel mai înalt obiectiv al tău este să încerci să le emulezi. – KK Barrett, designerul ei de producție de film, Wired, 2014

Dacă nu ați văzut filmul Her, faceți câteva ore pentru a viziona acest film futurist despre un scriitor singuratic care dezvoltă o relație cu un sistem de operare. Deși este știință ficțiune, în lumea de azi, experiențele vocale cresc odată cu adoptarea dispozitivelor autonome bazate pe voce, cum ar fi familia Amazon Echo și Google Home. Dezvoltarea unei aplicații de voce este un proces relativ simplu, bazat pe șabloane, cu instrucțiuni asemănătoare IKEA furnizate de Amazon și Google în încercarea de a-și stabili platformele. Deși săriți în dezvoltare poate fi tentant, o experiență bună pentru utilizatorul vocal nu se întâmplă doar; trebuie proiectat, parcurgând pașii descriși în acest articol.

Vă rugăm să folosiți zona de comentarii pentru a împărtăși orice alte feedback, sfaturi și resurse altor cititori.

Resurse

Instrumente AI Platform

  • Alexa Skills Kit, Amazon
  • Acțiuni pentru Google
  • „Alexa Skills Kit Voice Design Best Practices”, Amazon
  • Acțiuni pentru resursele de proiectare Google

Tonul vocii

  • „Impactul tonului vocii asupra percepției mărcii utilizatorilor”, Kate Meyer, Nielsen Norman Group
  • „Găsește-ți tonul vocii”, Robert Mills, Smashing Magazine
  • „Găsirea vocii mărcii tale”, a spus Harriet Cummings

Expresii și dialecte

  • „Cum vorbești, Youse and You Guys Talk (test interactiv), New York Times
  • Definirea interfeței vocale (și a afirmațiilor Alexa), Amazon
  • „Defining Utterances for the Alexa Skills Kit” (inclusiv instrumentul), Maker Musings

Prototiparea și testarea

  • SaySpring „Software gratuit de prototipare pentru voce”
  • Echosim.io „Instrument de testare a abilităților Alexa”
  • „Web Simulator”, Acțiuni pentru Google

Reportaj, carte și film

  • „Raportul Voice 2017 de la VoiceLabs”
  • Designing Voice User Interfaces: Principles of Conversational Experiences , Cathy Pearl, O'Reilly Media
  • Ea (film)