Tot ce doriți să știți despre crearea interfețelor de utilizator vocale

Publicat: 2022-03-10

Rezumat rapid ↬ Crearea interfețelor vocale cu utilizatorul necesită multă experiență în design în diverse domenii, cum ar fi designul conversațiilor, designul interacțiunii, designul vizual și în mișcare. Acest articol acoperă cele mai critice aspecte ale proiectării interfețelor utilizator vocale - proiectarea conversației și proiectarea interfețelor vizuale.

Vocea este un instrument puternic pe care îl putem folosi pentru a comunica unul cu celălalt. Conversațiile umane îi inspiră pe designerii de produse să creeze interfețe de utilizator vocale (VUI), o nouă generație de interfețe de utilizator care oferă utilizatorilor puterea de a interacționa cu mașinile folosind limbajul lor natural.

Pentru o lungă perioadă de timp, ideea de a controla o mașină pur și simplu vorbind cu ea a fost chestii științifico-fantastice. Poate cel mai faimos, în 1968, Stanley Kubrick a lansat un film numit 2001: A Space Odyssey , în care antagonistul central nu era un om. HAL 9000 a fost o inteligență artificială sofisticată controlată de voce.

HAL 9000, un asistent vocal din filmul „2001: A Space Odyssey”. (Urmăriți videoclipul pe YouTube)

De atunci, progresele în procesarea limbajului natural și învățarea automată i-au ajutat pe creatorii de produse să introducă interfețe de utilizator vocale mai puțin criminale în diverse produse - de la telefoane mobile la aparate inteligente și automobile.

O scurtă istorie a interfețelor vocale

Dacă ne întoarcem la lumea reală și analizăm evoluția VUI, este posibil să definim trei generații de VUI. Prima generație de VUI este datată din anii 1950. În 1952, Bell Labs a construit un sistem numit Audrey. Sistemul și-a derivat numele de la capacitatea sa de a decoda cifrele - Recunoaștere automată a cifrelor. Din cauza limitărilor tehnice, sistemul a putut recunoaște doar numerele rostite de la „0” la „9”. Cu toate acestea, Audrey a demonstrat că VUI-urile ar putea fi construite.

Bell Labs Audrey cu controale de intrare și ieșire. — 1952 Bell Labs Audrey. Fotografia arată doar comenzile de intrare și ieșire, dar nu prezintă electronice de sprijin. (Credit imagine: Computerhistory) (Previzualizare mare)

A doua generație de VUI datează din anii 1980 și 1990. A fost epoca răspunsului vocal interactiv (IVR). Unul dintre primele IVR a fost dezvoltat în 1984 de Speechworks și Nuance, în principal pentru telefonie, și au revoluționat afacerea. Pentru prima dată în istorie, un sistem digital ar putea recunoaște apelurile vocale umane și să îndeplinească sarcinile care le-au fost date. A fost posibil să obțineți statutul zborului dvs., să faceți o rezervare la hotel, să transferați bani între conturi folosind nimic mai mult decât un telefon fix obișnuit și vocea umană.

Ce este IVR? (Credite video: YouTube)

Cea de-a treia (și actuala) generație de VUI-uri a început să devină populară în al doilea deceniu al secolului XXI. Diferența critică dintre a 2-a și a 3-a generație este că vocea este cuplată cu tehnologia AI. Asistenții inteligenți precum Apple Siri, Google Assistant și Microsoft Cortana pot înțelege ce spune utilizatorul și pot oferi opțiuni adecvate. Această generație de VUI este disponibilă în diferite tipuri de produse — de la telefoane mobile până la interfețe om-mașină (HMI) auto. Ele devin rapid norma.

Voce cuplată cu tehnologia AI. (Credit video: Gleb Kuznetsov)

Mai multe după săritură! Continuați să citiți mai jos ↓

Șase proprietăți fundamentale ale designului VUI

Înainte de a trece la recomandări specifice de proiectare, este esențial să enunțăm principiile de bază ale unui design bun VUI.

1. Voce-primul design

Trebuie să proiectați interfețe de utilizator fără mâini și fără ochi. Chiar și atunci când un dispozitiv VUI are un ecran, ar trebui să proiectăm întotdeauna pentru interacțiuni cu vocea mai întâi. În timp ce ecranul poate completa interacțiunea vocală, utilizatorul ar trebui să poată finaliza operația cu o privire minimă sau deloc la ecran.

Desigur, unele sarcini devin ineficiente sau imposibil de finalizat doar prin voce. De exemplu, ca utilizatorii să asculte și să răsfoiască rezultatele căutării prin voce poate fi plictisitor. Dar ar trebui să evitați crearea unei acțiuni care se bazează pe utilizatorii care interacționează numai cu un ecran. Dacă proiectați una dintre aceste sarcini, trebuie să luați în considerare o experiență în care utilizatorii dvs. încep cu voce și apoi trec la o interfață vizuală sau tactilă.

2. Conversație naturală

Interacțiunea cu VUI nu ar trebui să pară o interacțiune cu un robot. Fluxul conversației ar trebui să fie centrat pe utilizator (seamănă cu conversația umană naturală). Utilizatorul nu ar trebui să-și amintească anumite fraze pentru a determina sistemul să facă ceea ce vrea să facă.

Este important să folosiți limbajul de zi cu zi și să invitați utilizatorii să spună lucrurile în moduri în care o fac de obicei. Dacă observați că trebuie să explicați comenzile, este un indiciu clar că ceva nu este în regulă cu designul dvs. și trebuie să vă întoarceți la planșa de desen și să o reproiectați.

3. Personalizare

Personalizarea înseamnă mai mult decât a spune „Bine ați revenit, %username%”. Personalizarea înseamnă cunoașterea nevoilor și dorințelor reale ale utilizatorilor și adaptarea informațiilor la acestea. VUI oferă designerilor de produse o oportunitate unică de a individualiza întreaga interacțiune a utilizatorului. Sistemul ar trebui să poată recunoaște utilizatorii noi și cei care revin, să creeze profiluri de utilizator și să stocheze informațiile pe care sistemul le colectează în el. Cu cât sistemul învață mai multe despre utilizatori, cu atât ar trebui să ofere o experiență mai personalizată. Designerii de produse trebuie să decidă ce tipuri de informații să colecteze de la utilizatori pentru a personaliza experiența.

4. Tonul vocii

Vocea este mai mult decât un simplu mijloc de interacțiune. În câteva secunde, ascultăm vocea celeilalte persoane; creăm o impresie asupra acelei persoane - un sentiment de gen, vârstă, educație, inteligență, încredere și multe alte caracteristici. O facem intuitiv, doar ascultând o voce. De aceea, este vital să oferiți VUI o personalitate - creați personalitatea potrivită de brand care se potrivește cu valorile mărcii. O persoană bună este suficient de specifică pentru a evoca o voce și o personalitate unică.

Creați o discuție despre personalitatea mărcii de Wally Brill. (Credite video: Google)

5. Contextul de utilizare

Trebuie să înțelegeți unde și cum va fi utilizat produsul cu voce activată. Va fi folosit de o singură persoană sau împărțit între mai multe persoane? În zone publice sau private? Cât de zgomotos este mediul? Contextul de utilizare va afecta multe decizii de proiectare a produsului pe care le veți lua.

6. Simțul încrederii

Încrederea este un principiu de bază al unei bune experiențe de utilizare - implicarea utilizatorilor se bazează pe o bază de încredere. O bună interacțiune cu interfața vocală cu utilizatorul ar trebui să conducă întotdeauna la creșterea încrederii.

Iată câteva lucruri pe care designerii de produse le pot face pentru a atinge acest obiectiv:

Nu partajați niciodată date private cu nimeni.
Aveți grijă să verbalizați datele sensibile, cum ar fi datele medicale, deoarece utilizatorii ar putea să nu fie singuri.
Evitați conținutul ofensator.
Introduceți modificări ofensive sau sensibile în funcție de vârstă și regiune/țară.
Încercați să evitați conținutul pur promoțional.
Nu menționați produse sau nume de mărci în afara contextului, deoarece utilizatorii le pot percepe ca conținut promoțional.

Recomandări de proiectare

Când vine vorba de proiectarea VUI, este posibil să definiți două domenii majore:

Design conversațional
Design vizual

1. Proiectarea conversației

La prima vedere, diferența semnificativă dintre GUI și VUI este mediul de interacțiune. În GUI, folosim o tastatură, un mouse sau un ecran tactil, în timp ce pentru VUI, folosim vocea. Cu toate acestea, când ne uităm mai atent, vom vedea că diferența fundamentală dintre cele două tipuri de interfețe este un model de interacțiune. Cu vocea, utilizatorii pot cere pur și simplu ceea ce doresc, în loc să învețe cum să navigheze prin aplicație și să învețe caracteristicile acesteia. Când proiectăm pentru voce, proiectăm interacțiuni conversaționale.

Aflați despre utilizatorii dvs

Conversațiile cu un computer nu ar trebui să pară incomode. Utilizatorii ar trebui să poată interacționa cu o interfață de utilizator vocală așa cum ar face-o cu o altă persoană. De aceea, procesul de proiectare a conversației ar trebui să înceapă întotdeauna cu învățarea despre utilizatori. Trebuie să găsiți răspunsuri la următoarele întrebări:

Cine sunt utilizatorii tăi?
(Demografie, portret psihologic)
Cum sunt ei familiarizați cu interacțiunile vocale? Folosesc în prezent produse vocale?
(Nivel de expertiză tehnologică)

Înțelegeți spațiul problemei și definiți cazurile de utilizare cheie

Când știți cine sunt utilizatorii dvs., trebuie să dezvoltați o înțelegere profundă a problemelor utilizatorilor. Care sunt scopurile lor? Creați hărți de empatie pentru a identifica punctele cheie ale utilizatorilor. De îndată ce înțelegeți spațiul cu probleme, vă va fi mai ușor să anticipați funcțiile pe care le doresc utilizatorii și să definiți cazuri de utilizare specifice. (Ce poate face un utilizator cu sistemul vocal?)

Gândiți-vă atât la problema pe care utilizatorul dvs. încearcă să o rezolve, cât și la modul în care interfața vocală cu utilizatorul îl poate ajuta pe utilizator să rezolve această problemă. Iată câteva întrebări care vă pot ajuta în acest sens:

Care sunt sarcinile utilizatorului cheie? (Aflați despre nevoile/dorințele utilizatorilor.)
Ce situații declanșează aceste sarcini? (În ce context vor interacționa utilizatorii cu sistemul.)
Cum realizează utilizatorii aceste sarcini astăzi? (Care este călătoria utilizatorului?)

De asemenea, este vital să ne asigurăm că o interfață vocală cu utilizatorul este soluția potrivită pentru problema utilizatorului. De exemplu, interfața de utilizare vocală poate funcționa bine pentru sarcina de a găsi un restaurant din apropiere în timp ce sunteți pe drum, dar s-ar putea să vă pară neplăcut pentru sarcini precum răsfoirea recenziilor restaurantelor.

Flux de dialog de scriere

În esență, designul conversației se referă la fluxul conversației. Fluxul de dialog nu ar trebui să fie o idee ulterioară; în schimb, ar trebui să fie primul lucru pe care îl creați, deoarece va afecta dezvoltarea.

Iată câteva sfaturi pentru a crea o bază pentru fluxul de dialog:

Începeți cu un eșantion de dialog care reprezintă calea fericită.
Calea fericită este cea mai simplă și mai ușoară cale către succes pe care ar putea-o urma un utilizator. Nu încercați să faceți dialogul eșantion perfect la acest pas.
Concentrați-vă pe conversația vorbită.
Încercați să evitați situațiile în care scrieți dialogul altfel decât îl vorbesc oamenii. De obicei duce la dialoguri bine structurate, dar mai lungi și mai formale. Când oamenii vor să rezolve o anumită sarcină, sunt mai la obiect atunci când vorbesc.
Citiți cu voce tare un exemplu de dialog pentru a vă asigura că sună natural.
În mod ideal, ar trebui să invitați oameni care nu aparțin echipei de proiectare și să colectați feedback.

Exemplul de dialog vă va ajuta să identificați contextul conversației (când, unde și cum declanșează utilizatorul interfața vocală) și enunțurile și răspunsurile comune.

După ce ați terminat de scris exemple de dialog, următorul lucru de făcut este să adăugați diferite căi (luați în considerare modul în care sistemul va răspunde în numeroase situații, adăugarea de rânduri în conversații etc.). Nu înseamnă că trebuie să luați în considerare toate variațiile posibile în dialoguri. Luați în considerare principiul Pareto (80% dintre utilizatori vor urma cele mai comune 20% dintre căile posibile într-o discuție) și definiți cele mai probabile căi logice pe care le poate lua un utilizator.

Principii de proiectare a conversației. (Credite video: Google)

De asemenea, este recomandat să recrutați un designer de conversații — un profesionist care vă poate ajuta să creați conversații naturale și intuitive pentru utilizatori.

Design pentru limbajul uman

Cu cât o interfață folosește mai mult conversația umană, cu atât mai puțini utilizatori trebuie să fie învățați cum să o folosească. Investește în cercetarea utilizatorilor și învață vocabularul utilizatorilor reali sau potențiali. Încercați să utilizați aceleași fraze și propoziții în răspunsul sistemului. Va crea o conversație mai ușor de utilizat.

Nu preda comenzi.
Lăsați utilizatorii să vorbească cu propriile cuvinte.
Evita jargonul tehnic.
Permiteți utilizatorilor să interacționeze cu sistemul în mod natural, folosind expresiile pe care le preferă.

Utilizatorul începe întotdeauna conversația

Indiferent cât de sofisticat este sistemul bazat pe voce, acesta nu ar trebui să înceapă niciodată conversația. Va fi incomod dacă sistemul ajunge la utilizator cu un subiect pe care nu vrea să-l discute.

Evitați răspunsurile lungi

Când proiectați răspunsurile sistemului, luați întotdeauna în considerare o sarcină cognitivă. Utilizatorii VUI nu citesc, ei ascultă și cu cât dați mai mult răspunsuri de sistem, cu atât mai multe informații trebuie să păstreze în memoria lor de lucru. Este posibil ca unele dintre aceste informații să nu fie utilizabile pentru utilizator, dar nu există nicio modalitate de a avansa rapid răspunsurile pentru a trece înainte.

Faceți ca fiecare cuvânt să conteze și proiectați pentru conversații scurte. Când scriptați răspunsurile sistemului, citiți-le cu voce tare. Lungimea este probabil bună dacă puteți rosti cuvintele într-un ritm conversațional cu o singură respirație. Dacă trebuie să respirați în plus, rescrieți răspunsurile și reduceți lungimea.

Minimizați numărul de opțiuni din prompturile de sistem

De asemenea, este posibil să se minimizeze încărcarea cognitivă prin reducerea numărului de opțiuni pe care utilizatorii le aud. În mod ideal, atunci când utilizatorii solicită o recomandare, sistemul ar trebui să ofere imediat cea mai bună opțiune posibilă. Dacă este imposibil să faci asta, încearcă să oferi cele mai bune trei opțiuni posibile și verbalizează-o mai întâi pe cea mai relevantă.

Oferiți alegeri definitive

Evitați întrebările deschise din răspunsurile sistemului. Acestea pot determina utilizatorii să răspundă în moduri pe care sistemul nu le așteaptă sau nu le suportă. De exemplu, când proiectați o solicitare de introducere, în loc să spuneți „Bună ziua, compania ACME, ce doriți să faceți?” ar trebui să spuneți „Bună ziua, compania ACME, puteți face [Opțiunea A], [Opțiunea B] sau [Opțiunea C].”

Adăugați pauze între întrebare și opțiuni

Pauzele și semnele de punctuație imită cadența reală a vorbirii și sunt benefice pentru situațiile în care sistemul pune o întrebare și oferă câteva opțiuni din care să aleagă.

Adăugați o pauză de 500 de milisecunde după ce ați pus întrebarea. Această pauză va oferi utilizatorilor suficient timp pentru a înțelege întrebarea.

Oferiți-le utilizatorilor timp de gândire

Când sistemul întreabă utilizatorului ceva, acesta ar putea fi nevoit să se gândească să răspundă la întrebare. Timpul de expirare implicit pentru ca utilizatorii să răspundă la cerere este de 8-10 secunde. După acest timeout, sistemul ar trebui să repete cererea sau să o reclame. De exemplu, să presupunem că un utilizator rezervă o masă la un restaurant. Exemplul de dialog ar putea suna astfel:

Utilizator : „Asistent, vreau să merg la restaurant.”

Sistem : „Unde ai vrea să mergi?”

(Fără răspuns timp de 8 secunde)

Sistem : „Îți pot rezerva o masă într-un restaurant. Ce restaurant ai vrea să vizitezi?”

Solicitați mai multe informații atunci când este necesar

Este destul de comun ca utilizatorii să solicite ceva, dar să nu ofere suficiente detalii. De exemplu, când utilizatorii îi cer asistentului vocal să rezerve o excursie, ei ar putea spune ceva de genul „Asistent, rezervă o excursie pe mare”. Utilizatorul presupune că sistemul le cunoaște și va oferi cea mai bună opțiune posibilă. Când sistemul nu are suficiente informații despre utilizare, ar trebui să solicite mai multe informații, mai degrabă decât să ofere o opțiune care ar putea să nu fie relevantă.

Utilizator : „Aș dori să rezerv o excursie la malul mării.”

Sistem : „Când ai vrea să mergi?”

Nu pune niciodată întrebări retorice sau deschise

Punând întrebări retorice sau deschise, puneți o sarcină cognitivă ridicată asupra utilizatorilor. În schimb, pune întrebări directe. De exemplu, în loc să întrebi utilizatorul „Ce vrei să faci cu invitația ta?” ar trebui să spuneți „Puteți să vă anulați invitația sau să o reprogramați. Ce funcționează pentru tine?”

Nu faceți oamenii să aștepte în tăcere

Când oamenii nu aud/văd niciun feedback de la sistem, s-ar putea gândi că nu funcționează. Uneori, sistemul are nevoie de mai mult timp pentru a continua cu solicitarea utilizatorului, dar asta nu înseamnă că utilizatorii ar trebui să aștepte în tăcere absolută/fără feedback vizual. Cel puțin, ar trebui să oferiți un semnal de audiție și să îl asociați cu feedback vizual.

Feedback vizual mazon Echo — Feedback vizual Amazon Echo. (Credit imagine: Tenor)

Minimizați introducerea datelor utilizatorului

Încercați să reduceți numărul de cazuri când utilizatorii trebuie să furnizeze numere de telefon, adrese stradale sau parole alfanumerice. Poate fi dificil pentru utilizatori să spună șiruri de numere ale sistemului vocal sau informații detaliate. Acest lucru este valabil mai ales pentru utilizatorii cu probleme de vorbire. Oferiți metode alternative pentru introducerea acestui tip de informații, cum ar fi utilizarea aplicației mobile însoțitoare.

Repetare suport

Indiferent dacă utilizatorii folosesc sistemul într-o zonă zgomotoasă sau doar au probleme de înțelegere a întrebării, ar trebui să poată cere sistemului să repete ultima solicitare în orice moment.

Descoperirea caracteristicilor

Descoperirea caracteristicilor poate fi o problemă masivă în interfețele bazate pe voce. În GUI, aveți un ecran pe care îl puteți utiliza pentru a prezenta funcții noi, în timp ce în interfețele de utilizator vocale, nu aveți această opțiune.

Iată două tehnici pe care le puteți folosi pentru a îmbunătăți capacitatea de descoperire:

Integrare solidă. Un utilizator începător necesită integrarea în sistem pentru a înțelege capacitățile acestuia. Faceți-l practic - permiteți utilizatorilor să finalizeze unele acțiuni folosind comenzi vocale.
La prima întâlnire cu o anumită aplicație de voce, este posibil să doriți să discutați despre ceea ce este posibil.

Confirmați solicitările utilizatorilor

Oamenii se bucură de un sentiment de recunoaștere. Astfel, informați utilizatorul că sistemul le aude și le înțelege. Este posibil să definiți două tipuri de confirmare - confirmare implicită și explicită.

Confirmări explicite sunt necesare pentru sarcini cu risc ridicat, cum ar fi transferurile de bani. Aceste confirmări necesită aprobarea verbală a utilizatorului pentru a continua.

Utilizator : „Transferă o mie de dolari către Alice.”

Sistem : „Vrei să transferi o mie de dolari lui Alice Young, corect?”

În același timp, nu orice acțiune necesită confirmarea utilizatorului. De exemplu, atunci când un utilizator cere să oprească redarea muzicii, sistemul ar trebui să oprească redarea fără să întrebe „Doriți să opriți muzica?”

Gestionați eroarea cu grație

Este aproape imposibil să evitați erorile în interacțiunile vocale. Stările de eroare tratate în mod vag pot afecta impresia unui utilizator despre sistem. Indiferent de ce a cauzat eroarea, este important să o gestionăm cu grație, ceea ce înseamnă că utilizatorul ar trebui să aibă o experiență pozitivă de la utilizarea unui sistem chiar și atunci când se confruntă cu o condiție de eroare.

Minimizați numărul de situații „nu vă înțeleg”.
Evitați mesajele de eroare care spun doar că nu au înțeles corect utilizatorul. Fluxul de dialog bine conceput ar trebui să ia în considerare toate ramurile posibile de dialog, inclusiv ramurile cu introducere incorectă de utilizator.
Introduceți un mecanism de reparații contextuale.
Ajutați situația sistemului când se întâmplă ceva neașteptat în timp ce utilizatorul vorbește. De exemplu, sistemul de recunoaștere a vocii nu a reușit să audă utilizatorul din cauza zgomotului puternic din fundal.
Spuneți clar ce nu poate face sistemul.
Când utilizatorii se confruntă cu mesaje de eroare precum „Nu vă înțeleg”, încep să se gândească dacă sistemul nu este capabil să facă ceva sau verbalizează incorect cererea. Este recomandat să oferiți un răspuns explicit în situațiile în care sistemul nu poate face ceva. De exemplu, „Îmi pare rău, nu pot face asta. Dar te pot ajuta cu [opțiune].”
Acceptați corecțiile.
Uneori, utilizatorii fac corecții atunci când știu că sistemul a greșit ceva sau când au decis să se răzgândească. Când utilizatorii doresc să-și corecteze introducerea, vor spune ceva de genul „Nu” sau „Am spus”, urmat de un enunț valid.

Testați-vă dialogurile

Cu cât începeți mai devreme să vă testați fluxul de conversație, cu atât mai bine. În mod ideal, începeți să testați și să repetați modelele dvs. de îndată ce aveți exemple de dialog. Colectarea feedback-ului în timpul procesului de proiectare expune probleme de utilizare și vă permite să remediați designul din timp.

Cel mai bun mod de a testa dacă dialogul tău funcționează este să-l acționezi. Puteți folosi tehnici precum Vrăjitorul din Oz , în care o persoană pretinde a fi un sistem, iar cealaltă este un utilizator. De îndată ce începeți să exersați scenariul, veți observa dacă sună bine sau rău atunci când este rostit cu voce tare.

Amintiți-vă că ar trebui să împiedicați oamenii să împărtășească indicii non-verbale. Când interacționăm cu alți oameni, folosim de obicei limbaj non-verbal (privirea ochilor, limbajul corpului). Indiciile non-verbale sunt extrem de valoroase pentru transmiterea informațiilor, dar, din păcate, sistemele VUI nu le pot înțelege. Când testați dialogurile, încercați să așezați participanții la test spate în spate pentru a evita contactul vizual.

Următoarea parte a testării este observarea comportamentului real al utilizatorului. În mod ideal, ar trebui să observați utilizatorii care vă folosesc produsul pentru prima dată. Vă va ajuta să înțelegeți ce funcționează și ce nu. Testarea cu 5 participanți vă va ajuta să dezvăluiți majoritatea problemelor dvs. de utilizare.

2. Design vizual

Un ecran joacă un rol secundar în interacțiunile vocale. Cu toate acestea, este vital să luați în considerare un aspect vizual al interacțiunii utilizatorului, deoarece experiențele vizuale de înaltă calitate creează impresii mai bune asupra utilizatorilor. În plus, imaginile sunt bune pentru anumite sarcini, cum ar fi scanarea și compararea rezultatelor căutării. Scopul final este de a proiecta o experiență multimodală mai încântătoare și mai captivantă.

Design pentru ecrane mai mici În primul rând

Când adaptați conținutul pe ecrane, începeți mai întâi cu cea mai mică dimensiune a ecranului. Vă va ajuta să prioritizați care este conținutul cel mai important.

Când vizați dispozitive cu ecrane mai mari, nu măriți doar conținutul. Încercați să profitați din plin de spațiul imobiliar suplimentar al ecranului. Acordați atenție calității imaginilor și videoclipurilor - imaginile nu ar trebui să-și piardă calitatea pe măsură ce se extind.

Optimizați conținutul pentru scanare rapidă

După cum am menționat anterior, ecranele sunt foarte utile pentru cazurile în care trebuie să oferiți câteva opțiuni pentru a compara. Dintre toate containerele de conținut pe care le puteți folosi, cardurile sunt cele care funcționează cel mai bine pentru scanarea rapidă. Când trebuie să furnizați o listă de opțiuni din care să alegeți, puteți pune fiecare opțiune pe card.

Nest Hub folosește carduri ca containere de conținut. (Credit imagine: Google) (Previzualizare mare)

Design cu o anumită distanță de vizualizare în minte

Proiectați conținutul astfel încât să poată fi vizualizat de la distanță. Raza de vizionare a dispozitivelor cu ecran mic cu voce activată ar trebui să fie între 1-2 metri, în timp ce pentru ecranele mari, cum ar fi televizoarele, ar trebui să fie de 3 metri. Trebuie să vă asigurați că dimensiunea fontului și dimensiunea imaginilor și a elementelor UI pe care le veți afișa pe ecran sunt confortabile pentru utilizatori.

Google recomandă utilizarea unei dimensiuni minime de font de 32 de puncte pentru textul principal, cum ar fi titlurile, și de minim 24 de puncte pentru textul secundar, cum ar fi descrierile sau paragrafele de text.

În imagine, Echo Show stă pe o masă de bucătărie lângă o masă de tocat cu ceva mâncare pe ea. — Un context obișnuit de utilizare pentru Echo Show, dispozitivul Amazon pentru voce. (Credit imagine: Amazon) (Previzualizare mare)

Aflați așteptările utilizatorilor despre un anumit dispozitiv

Dispozitivele cu voce activată pot varia de la dispozitive din vehicul până la dispozitive TV. Fiecare mod de dispozitiv are propriul context de utilizare și un set de așteptări ale utilizatorilor. De exemplu, hub-urile de acasă sunt utilizate în mod obișnuit pentru muzică, comunicații și divertisment, în timp ce sistemele din mașină sunt utilizate de obicei în scopuri de navigație.

Lectură suplimentară : Proiectarea interfețelor om-mașină pentru vehiculele viitorului

Ierarhia informațiilor de pe ecrane

Când proiectăm pagini de site, începem de obicei cu structura paginii. O abordare similară ar trebui urmată atunci când proiectați pentru VUI - decideți unde ar trebui să fie amplasat fiecare element. Ierarhia informațiilor ar trebui să meargă de la cea mai importantă la cea mai puțin importantă. Încercați să minimizați informațiile pe care le afișați pe ecran - doar informațiile necesare care îi ajută pe utilizatori să facă ceea ce doresc.

Ierarhie vizuală clară a informațiilor de pe Portal, dispozitivul Sber pe primul loc pentru voce. (Credit imagine: Sber) (Previzualizare mare)

Păstrați imaginea și vocea sincronizate

Nu ar trebui să existe o întârziere semnificativă între voce și elementele vizuale. Interfața grafică ar trebui să fie cu adevărat receptivă - imediat după ce utilizatorul aude mesajul vocal; interfața ar trebui să fie reîmprospătată cu informații relevante.

Limbajul mișcării joacă un rol important în modul în care utilizatorii înțeleg informațiile. Este esențial să evitați tăieturile grele și să utilizați tranziții netede între stările individuale. Atunci când utilizatorii vorbesc, ar trebui să oferim, de asemenea, feedback vizual care să recunoască faptul că sistemul îl ascultă pe utilizator.

Ierarhie clară a informațiilor despre managerul de fișiere vocale. (Credit video: Gleb Kuznetsov)

Design accesibil

Un produs bine conceput este inclusiv și accesibil universal. Utilizatorii cu deficiențe de vedere (persoane cu dizabilități, cum ar fi orbirea, vederea scăzută și daltonismul) nu ar trebui să aibă probleme în interacțiunea cu produsul dvs. Pentru a vă face designul accesibil, urmați regulile WCAG.

Asigurați-vă că textul de pe ecran este lizibil. Asigurați-vă că textul are un raport de contrast suficient de ridicat. Culoarea textului și contrastul respectă rapoartele AAA.
Utilizatorii care se bazează pe cititoare de ecran ar trebui să înțeleagă ce este afișat pe ecrane. Adăugați descrieri la imagini.
Nu proiectați elemente de ecran care pâlpâie, clipesc sau clipesc. În general, tot ceea ce clipește mai mult de trei flash-uri pe secundă poate cauza utilizatorilor cu dureri de cap de rău de mișcare.

Lectură similară : Cum un utilizator de cititor de ecran accesează web-ul

Concluzie

Suntem în zorii următoarei revoluții digitale. Următoarea generație de computere va oferi utilizatorilor o oportunitate unică de a interacționa cu vocea. Dar fundația acestei generații este creată astăzi. Depinde de designeri să dezvolte sisteme care să fie naturale pentru utilizatori.

Lectură conexe recomandată

„Ghid de proiectare Alexa”, Documentația pentru dezvoltatori Amazon
„Procesul de proiectare a conversației”, Google Assistant Docs
„Proiectarea interfețelor vocale cu utilizatorul: principiile experiențelor conversaționale”, Cathy Pearl (2017)
„Aplicarea hackurilor încorporate de conversație la interfața de utilizare a vocii”, James Giangola (video)
„Crearea unei persoane: Cum sună produsul tău? ”, Wally Brill (video)
„Voice Principles”, o colecție de resurse create de Clearleft.