Concevoir des expériences vocales

Publié: 2022-03-10
Résumé rapide ↬ Les interfaces vocales se banalisent. Les assistants vocaux tels que Siri et Cortana existent depuis quelques années, mais ces dernières années, les appareils à commande vocale d'Amazon et de Google ont fait leur chemin dans des millions de foyers. Une analyse récente de VoiceLabs estime que 24,5 millions d'appareils à commande vocale seront expédiés cette année, soit près de quatre fois plus que l'année dernière. En tant que designers d'expérience, nous avons désormais la possibilité de concevoir des expériences et des interfaces vocales !

Une analyse récente de VoiceLabs estime que 24,5 millions d'appareils à commande vocale seront expédiés cette année, soit près de quatre fois plus que l'année dernière. En tant que designers d'expérience, nous avons désormais la possibilité de concevoir des expériences et des interfaces vocales !

Une nouvelle interface ne signifie pas que nous devons ignorer tout ce que nous avons appliqué avec succès aux interfaces précédentes ; nous devrons adapter notre processus aux nuances des interfaces vocales, y compris les interactions conversationnelles et l'absence d'écran. Nous examinerons le fonctionnement d'un génie typique dans une bouteille, discuterons des étapes impliquées dans la conception d'expériences vocales et illustrerons ces étapes en concevant une application vocale pour Alexa (ou Skill, comme l'appelle Amazon).

### Lectures complémentaires sur SmashingMag :

  • Améliorer l'expérience utilisateur avec l'API Web Speech
  • Lignes directrices pour la conception avec audio
  • Expérimenter la synthèse vocale
  • Qu'est-ce que la conception de l'expérience utilisateur ? Présentation, outils et ressources
Plus après saut! Continuez à lire ci-dessous ↓
## Comprendre les interfaces vocales Tout comme les applications mobiles s'exécutent sur un système d'exploitation et un appareil, trois couches doivent fonctionner ensemble pour permettre les interactions vocales :
Couches de l'interface utilisateur vocale
Les couches qui permettent les interactions vocales
  1. application vocale (Amazon Skills et Actions pour Google) ;
  2. plateforme d'intelligence artificielle (Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana) ;
  3. appareil (Echo, Home, smartphones, ordinateurs).
Chaque couche utilise celle du dessous et prend en charge celle du dessus. L'interface vocale se situe dans les deux couches supérieures, qui résident toutes deux dans le cloud, et non sur l'appareil lui-même. Jetons un coup d'œil sous le capot pour voir comment ces couches fonctionnent ensemble, en utilisant Alexa Jeopardy ! La compétence comme exemple.

Fonctionnement des interfaces vocales - Exemple de compétence Jeopardy
Les couches qui permettent les interactions vocales. (Voir la grande version)

Les appareils à commande vocale tels que Amazon Echo et Google Home écoutent en permanence, attendant un mot de réveil («Alexa…» ou «OK, Google…») pour passer à l'action. Une fois activé, l'appareil envoie l'audio qui suit à la plate-forme d'IA dans le cloud ("… jouez à Jeopardy !"). La plate-forme utilise une combinaison de reconnaissance vocale automatique (ASR) et de compréhension du langage naturel (NLU) pour déchiffrer l'intention de l'utilisateur (pour démarrer un jeu-questionnaire) et l'envoyer à l'application de support (Jeopardy ! J6 Skill sur Alexa). L'application traite la demande et répond par texte (et un visuel le cas échéant). La plate-forme convertit le texte en parole et le lit via l'appareil ("Bienvenue dans Jeopardy J6. Voici les indices d'aujourd'hui..."). Tout cela en quelques secondes.

Construire des expériences vocales

L'année dernière, Mark Zuckerberg a relevé le défi personnel de créer une IA simple pour gérer sa maison. Il l'a fait, l'a appelé Jarvis et lui a donné la voix de Morgan Freeman.

Mark Zuckerberg présente Morgan Freeman à l'IA qui utilise sa voix
Mark Zuckerberg présente Morgan Freeman à l'IA qui utilise sa voix. (Photo : Mark Zuckerberg)

Le reste d'entre nous qui n'ont pas la capacité ou les ressources pour faire de même peut s'en tirer en créant des applications vocales qui s'exécutent sur des plateformes d'IA complexes qui ont déjà été construites. Cela nous libère de n'avoir à nous soucier que de la conception et du développement de l'application vocale, cela aussi avec un processus de développement simplifié. Amazon et Google ont fourni un accès libre aux modèles, au code et aux instructions détaillées étape par étape pour créer différents types d'applications vocales, au point que même les non-développeurs pourraient développer une application en environ une heure !

Leur investissement dans la simplification du développement d'applications porte ses fruits, avec des milliers de nouvelles applications vocales lancées chaque mois. La croissance des applications vocales rappelle la ruée vers l'or du Web des années 90, ainsi que l'explosion des applications mobiles qui a suivi le lancement des magasins d'applications.

Répartition des compétences Alexa par catégorie en mai 2017
Répartition des compétences Alexa par catégorie en mai 2017. (Voir la grande version)

Dans un marché vocal encombré, une bonne conception est ce qui différenciera votre application vocale des centaines d'autres applications similaires.

Concevoir des expériences vocales

La conception d'une bonne expérience utilisateur vocale est un processus en cinq étapes qui doit avoir lieu avant de commencer le développement. Bien qu'il puisse être tentant de se lancer directement dans le développement, le temps consacré à la bonne conception est du temps bien investi.

Étapes de la conception d'expériences vocales
Les étapes de la conception d'expériences vocales (Voir la grande version)

Nous discuterons et appliquerons chaque étape pour concevoir une application vocale, qui pourrait facilement être développée à l'aide de l'un des nombreux modèles de compétences pour Alexa.

1. Découvrir

Le parcours de conception commence par la question : « Comment cette application vocale apportera-t-elle de la valeur à mes utilisateurs ? » Cette question s'applique que vous développiez une application vocale autonome (comme dans notre exemple) ou que votre application vocale ne soit qu'un des nombreux points de contact pour vos clients. Prenez en considération pourquoi et où les gens utilisent des applications vocales. Les gens utilisent les interfaces vocales en raison des avantages de l'interaction mains libres, de la vitesse d'interaction et de la facilité d'utilisation, principalement à la maison ou dans la voiture, comme le montre le rapport sur les tendances Internet 2016 de Mary Meeker.

Principales raisons d'utiliser les interfaces vocales
Principales raisons d'utiliser les interfaces vocales (légendes par auteur) (Source : KPCB) (Voir la version agrandie)

La clé est de trouver des besoins utilisateur cohérents qui sont plus faciles ou plus pratiques via une application vocale plutôt qu'un téléphone ou un ordinateur. Certains exemples incluent des banques fournissant des informations de compte ou un cinéphile trouvant de nouveaux films à l'affiche à proximité.

Si vous avez des concurrents qui ont déjà des applications vocales, tenez compte de ce qu'ils font et des avis et commentaires que leurs applications ont reçus sur le marché des applications (comme Alexa Skill Store d'Amazon). Le but n'est pas d'imiter aveuglément, mais d'être conscient de la barre des capacités qui a été fixée, ainsi que des attentes des utilisateurs.

(Au moment d'écrire ces lignes, il y avait plus de 1 500 compétences Alexa "connaissances et anecdotes", ce qui en fait les catégories de compétences les plus encombrées sur Amazon. Cependant, il n'y avait pas une seule compétence d'anecdotes répondant au domaine de l'expérience utilisateur. Pour illustrer le processus de conception de la voix, nous créerons une compétence de conception UX, pour que nos lecteurs testent leurs connaissances ou peut-être même apprennent quelque chose de nouveau.)

2. Définir

Au cours de cette étape, nous définirons la personnalité de notre application et les capacités dont elle disposera.

Personnalité

Lors de la conception d'interfaces vocales, nous n'avons pas accès à de nombreux éléments visuels que nous utilisons dans les interfaces Web et mobiles pour montrer une personnalité. La personnalité doit passer par la voix et le ton des interactions verbales. Et contrairement à Zuckerberg, qui entend la voix apaisante de Freeman, nous sommes contraints d'entendre la voix par défaut de l'appareil. Cela rend le ton et la formulation cruciaux pour transmettre la personnalité que nous voulons transmettre.

La bonne nouvelle est que la plupart des travaux préparatoires dans ce domaine devraient déjà avoir été complétés et documentés dans un guide de marque d'entreprise ou un guide de style de site Web (indice : recherchez la section "ton de voix"). Tirez parti de ces directives pour votre application vocale, ainsi que pour maintenir une personnalité cohérente sur tous les canaux et points de contact.

Quand je pense à la personnalité et au ton, le groupe Virgin me vient immédiatement à l'esprit. Ils définissent clairement qui ils sont et comment ils le transmettent aux utilisateurs. Pour Virgin America, le ton idéal est « branché, facile à vivre, informel, enjoué et ironique », et il ressort clairement dans toute leur communication.

Personnalité de la marque Virgin America
Personnalité de la marque Virgin America (Source : Virgin America)

Si vous avez déjà demandé à Alexa de chanter ou essayé l'un des nombreux œufs de Pâques d'Alexa, vous saurez qu'elle a sa propre personnalité. Curieux, j'ai contacté l'équipe responsable de sa personnalité, et voici ce qu'ils avaient à dire :

Lors de la conception de la voix d'Alexa, nous avons essayé de lui donner une personnalité qui reflète les attributs que nous apprécions le plus chez Amazon. Nous voulions qu'elle se sente serviable, humble et intelligente, tout en conservant un sentiment de plaisir. Il s'agit d'un processus continu, et nous nous attendons à ce que la voix d'Alexa évolue à mesure que de plus en plus de développeurs s'efforcent de la rendre plus intelligente.

La personnalité peut également se refléter dans le nom, l'icône et la description de l'application qui sont affichés aux utilisateurs dans la liste du répertoire de l'application, ainsi que dans le nom utilisé pour appeler l'application (le nom d'appel). Alors, assurez-vous qu'il brille lors de la publication de votre application.

Pour notre compétence UX Design, nous pourrions adopter une approche simple ou amusante, et cela se refléterait dans le libellé des options de questions-réponses de notre quiz.

Un exemple de tonalité normale serait :

Quel principe de conception UX privilégie la simplicité à la complexité ?
  1. Le rasoir d'Occam
  2. Loi de Hick
  3. Effet esthétique-utilisabilité
  4. Satisfaisant

Et un exemple de ton amusant serait :

Apparemment, il existe un principe de conception UX qui privilégie la simplicité à la complexité. Vraiment! Pouvez-vous deviner comment ça s'appelle?
  1. Le rasoir d'Occam : Le meilleur qu'un gars UX puisse obtenir.
  2. Loi de Hick : cela ressemble à quelque chose qu'un crétin UX proposerait.
  3. Effet de convivialité esthétique : c'est un jargon UX sophistiqué.
  4. Satisfaisant : je ne peux pas obtenir de satisfaction… excuses aux Rolling Stones.

Ouais, restons avec la normale.

Capacités

C'est là que vous réfléchissez soigneusement à la fonctionnalité qui sera précieuse pour les utilisateurs de votre application vocale. Revoyez votre travail dès la première étape pour identifier les capacités essentielles ou liées à votre entreprise. Parfois, offrir des fonctionnalités de base est une évidence - comme une banque offrant des informations sur le solde, les transactions et les dates d'échéance. D'autres offrent de la valeur sous la forme de fonctionnalités connexes, telles que l'application vocale de guide d'élimination des taches de Tide ou les applications vocales de Glad (fabricants de stockage de nourriture et de sacs poubelles), dont l'une aide les utilisateurs à se souvenir où ils ont stocké leurs restes, ou l'autre celui qui permet aux utilisateurs de vérifier quels éléments doivent être recyclés ou jetés à la poubelle.

Si vous avez fait un exercice similaire en passant du Web au mobile, cela peut servir de point de départ. Pour les fonctionnalités vocales, réfléchissez aux fonctionnalités qui profiteraient à vos utilisateurs sur un appareil à commande vocale dans un espace partagé. Si une compétence a des implications en matière de sécurité ou de confidentialité, envisagez d'ajouter un niveau de protection (la compétence Capital One Alexa permet aux utilisateurs de créer une clé personnelle pour accéder au compte). Bien que vous puissiez vous retrouver avec une longue liste de fonctionnalités qui fonctionneraient sur la voix, commencez par une à cinq fonctionnalités principales et utilisez l'analyse vocale pour mettre à jour et améliorer après le lancement.

Les principales capacités d'une compétence de conception UX pourraient être :

  1. fournir un principe de conception UX à la demande ;
  2. interroger l'utilisateur (solo) sur un principe UX aléatoire ;
  3. interrogez l'utilisateur (joueur unique) sur le principe de l'expérience utilisateur multiple et enregistrez le score ;
  4. organiser un concours de quiz UX avec plusieurs joueurs.

Étant donné que nous construisons cette compétence de conception UX à l'aide des modèles de compétence d'Amazon, nos choix sont actuellement limités à la première (modèle de compétence factuelle) ou à la troisième (modèle de compétence triviale) option ci-dessus. En supposant que nos recherches ont montré que nos utilisateurs trouveraient un quiz plus précieux que d'entendre simplement un principe UX récité, notre capacité principale sera d'interroger l'utilisateur sur les principes UX et de garder le score.

3. Flux de conversation détaillé

Maintenant que vous avez présélectionné les fonctionnalités de votre application vocale, commencez à vous concentrer sur le flux de conversation détaillé que l'application aura avec ses utilisateurs. La conversation humaine est complexe ; il a souvent de nombreux rebondissements et peut pivoter à tout moment, les gens sautant souvent d'un sujet à l'autre. Les plates-formes Voice AI ont encore un long chemin à parcourir pour atteindre ce niveau de complexité, vous devez donc apprendre à votre Skill comment répondre aux utilisateurs.

Votre application vocale ne peut prendre en charge que les fonctionnalités que vous avez définies à l'étape précédente, mais les utilisateurs ont toujours la possibilité de demander à l'application n'importe quoi et dans n'importe quel format. Détailler un flux de conversation vous permet de répondre à l'utilisateur ou d'orienter la conversation vers ce que l'application peut faire pour l'utilisateur.

Pour chaque fonctionnalité prise en charge par l'application vocale, commencez à créer des dialogues conversationnels entre l'utilisateur et l'application, similaires aux dialogues d'un scénario. Lorsque vous écrivez ces dialogues, souvenez-vous de la personnalité ainsi que des caractéristiques de la voix et du ton. Commencez à créer et à organiser le contenu réel de votre application vocale ; pour notre quiz, cela signifierait construire la liste des questions du quiz.

Commencez par le "chemin heureux" - un flux de conversation dans lequel l'application vocale peut répondre à la demande de l'utilisateur sans aucune exception ni erreur. Ensuite, passez au détail du flux conversationnel pour les exceptions (dans lesquelles l'utilisateur ne fournit pas d'informations complètes) et les erreurs (dans lesquelles l'application vocale ne comprend pas ou ne peut pas faire ce que l'utilisateur demande).

Parce que la conversation sera entendue et non lue, une bonne pratique consiste à la lire à haute voix pour voir si elle ressemble à une conversation parlée naturelle et pour vérifier qu'elle transmet le ton de voix que vous avez voulu.

Si votre application vocale doit compléter la conversation avec du contenu affiché sur l'application téléphonique, concevez ces interactions ensemble, afin qu'elles apparaissent transparentes pour l'utilisateur. Par exemple, la compétence d'élimination des taches de Tide informe l'utilisateur qu'il peut également se référer aux étapes d'élimination des taches dans l'application Alexa, en plus d'entendre les instructions. Cela pourrait bientôt être nécessaire si les rumeurs d'un écran tactile sur le nouvel Echo sont vraies.

Voici un exemple de dialogue pour le chemin heureux de la capacité de base de notre compétence de conception UX :

Utilisateur : "Alexa, démarre le quiz de conception UX."

Alexa : "Je vais vous poser cinq questions, avec des réponses à choix multiples. Essayez d'en obtenir autant que vous le pouvez. Dites simplement le numéro de la réponse. Commençons. Question 1…"

Utilisateur : [répond correctement]

Alexa : "C'est exact ! Votre score est de 1. Voici la question 2… »

Utilisateur : [répond de manière incorrecte]

Alexa : "Oups, c'est la mauvaise réponse. La bonne réponse est [bonne réponse]. Votre score est de 1. Voici la question 3… »

Alexa (à la fin de cinq questions) : « C'est exact ! Vous avez répondu correctement à quatre questions sur cinq. Merci d'avoir joué!"

4. Décrivez des phrases alternatives

Les gens n'utilisent pas toujours les mêmes mots pour dire la même chose, et les applications vocales doivent apprendre cela. Le mappage de phrases est un exercice pour apprendre aux applications vocales à s'adapter aux variations dans la façon dont les utilisateurs formulent leurs demandes.

Pour chaque chemin de conversation que vous avez détaillé à l'étape précédente, réfléchissez aux différentes manières dont les utilisateurs pourraient formuler ces demandes. Ensuite, décomposez le libellé de chaque demande et identifiez les variations de mots et les synonymes qu'ils pourraient utiliser, en tenant compte des variations régionales et des dialectes. Vous aurez les mains pleines si votre application vocale traite des boissons gazeuses sucrées (soda, pop, coca, tonic, soft drink, soda), des sandwichs longs (sous, grinder, hoagie, hero, Poor boy, bomber, sandwich italien, baguette) ou des chaussures de sport (espadrilles, chaussures, chaussures de sport, chaussures de sable, pulls, chaussures de tennis, chaussures de course, runners, baskets).

Rendez cette liste de variantes aussi complète et exhaustive que possible, afin que votre application vocale puisse comprendre les demandes des utilisateurs. Alexa a besoin de ces variations sous la forme d'"énoncés" et recommande de fournir "... autant de phrases représentatives que possible". Selon les capacités de votre application vocale, le nombre d'énoncés peut facilement atteindre des centaines, mais il existe des moyens de simplifier la génération d'énoncés.

Voici un exemple de mappage de phrases pour une capacité de notre quiz de conception UX. La plate-forme d'intelligence artificielle d'Alexa traduit bien l'intention de l'utilisateur pour les compétences en fonction de leurs modèles. Cependant, si vous apportez des modifications (comme nous avons changé "jeu quiz" en "quiz"), ces phrases devront être ajoutées.

Exemple de mappage de phrases
Voir la grande version

5. Affiner

La dernière étape du processus de conception consiste à valider et à affiner l'application vocale avant de consacrer du temps et des efforts au développement. Au cours de l'étape «détail», la lecture à haute voix des flux de conversation a permis de s'assurer qu'ils semblaient naturels et conversationnels. L'étape actuelle consiste à tester l'interface vocale avec les utilisateurs.

Le moyen le plus simple de tester consiste à utiliser la technique du magicien d'Oz, avec une personne jouant le rôle de l'appareil à commande vocale et répondant à l'utilisateur en fonction du script de l'interface vocale. Une autre option consiste à utiliser un logiciel de prototypage tel que SaySpring pour créer et tester des prototypes interactifs.

Si votre application vocale est créée à l'aide de modèles de code (comme notre application), il peut être plus facile de créer l'application et de la tester à l'aide des outils de test fournis par Amazon et Google dans la zone de développement des compétences (comme indiqué ci-dessous), ou dans mode test sur un appareil réel.

Simulateur de compétences Alexa

Ce test vous donnera une bonne idée de l'expérience vocale dans le monde réel, y compris la gestion des erreurs, des réponses répétitives et des réponses non naturelles, forcées ou de type machine.

Développer

Maintenant que l'expérience vocale a été conçue, il est temps de passer à la phase de construction-test-soumission. Chaque plate-forme propose des guides et des didacticiels détaillés pour aider tout le monde à développer et à tester des compétences, notamment Alexa Skills Kit, Develop Actions for Google et Cortana, qui propose de réutiliser votre code de compétence Alexa personnalisé !

Pensez à votre boucle de rétroaction et aux analyses qui vous aideront à comprendre l'utilisation de votre application vocale. Vous pouvez obtenir des mesures de compétences (utilisateurs, sessions, énoncés, intentions) dans votre compte de développeur sans aucun codage supplémentaire, mais des analyses avancées sont disponibles via des services gratuits tels que VoiceLabs (je n'ai pas pu le faire fonctionner, probablement en raison de mon manque de codage compétences ou l'absence d'un guide d'installation VoiceLabs for Dummies ).

Une fois que vous avez terminé de créer et de tester votre application vocale, la dernière étape est un processus de soumission simplifié. Parce que le marché Alexa Skill s'est rapidement développé, il devient difficile de découvrir de nouvelles applications utiles. Jusqu'à ce qu'Amazon améliore cela, utilisez des éléments visibles de votre liste d'applications vocales pour aider les utilisateurs à trouver et à essayer votre compétence, y compris une icône de compétence accrocheuse et pertinente, un nom et une description.

La compétence compagnon qui a été construite à titre d'illustration peut être prise pour un essai routier sur la boutique Amazon Alexa Skill : UX Design Quiz

Des principes directeurs

Voici quelques principes directeurs pour la conception d'expériences vocales. Plus de principes et de choses à faire et à ne pas faire sont proposés par Amazon et Google.

Intégrez l'utilisateur et aidez-le à démarrer

Présentez l'application et les façons dont l'utilisateur peut interagir avec elle.

Bienvenue au quiz de conception UX. Je vais vous poser cinq questions sur la conception UX et voir combien vous obtenez de bonnes réponses. Vous pouvez me demander de répéter une question ou de faire une pause si nécessaire. Souhaitez-vous commencer un nouveau quiz ?

Gardez les échanges de conversation brefs pour réduire la charge cognitive.

Avec une interface utilisateur vocale, l'utilisateur doit utiliser sa mémoire à court terme tout en interagissant avec l'application vocale. Alors, soyez bref et doux.

Alexa : « Ce principe est attribué à un logicien et frère franciscain du XIVe siècle et porte le nom du village du comté anglais de Surrey où il est né. En un mot, il déclare que la simplicité vaut mieux que la complexité. Ce principe de résolution de problèmes peut facilement être appliqué à la conception de l'expérience utilisateur, en optant pour la solution de conception la plus simple. Comment s'appelle ce principe ?
  1. Votre première option est le rasoir d'Occam, parfois appelé rasoir d'Ockham, ou la loi de la parcimonie.
  2. Votre prochaine option est la loi de Hick, également connue sous le nom de loi de Hick-Hyman.
  3. Votre prochaine option est l'effet esthétique-utilisabilité.
  4. Votre dernière option s'appelle "satisfaire", à ne pas confondre avec "satisfaire" ou "sacrifier".

Veuillez dire A, B, C ou D pour faire votre choix.

Utilisateur : "Hein ? ! Alexa, répète. À la réflexion, fin du quiz !"

Les exemples fonctionnent mieux que les instructions

Instruction : "Veuillez indiquer votre date de naissance au format mois/jour/année." Exemple : "Veuillez indiquer votre date de naissance, par exemple le 15 avril 1990."

Délectez-vous sans interférer avec la tâche

C'est un exercice d'équilibre. Trop et ça devient vite lassant.

Utilisez des confirmations explicites pour les actions importantes et implicites pour les moins risquées

Si vous demandez à Alexa d'éteindre les lumières, vous pouvez le voir se produire et vous n'avez pas besoin d'une confirmation verbale, bien qu'elle confirme parfois avec un court "OK".

Ne pas interférer, réduire la répétitivité
Les commentaires des utilisateurs pour la compétence Glad Leftover mettent en évidence les deux principes ci-dessus.

Conception pour l'échec

Les choses iront mal : concevoir pour ces situations. Les exemples incluent des questions ou des informations inintelligibles, des informations incomplètes, des silences ou des demandes qui ne peuvent pas être traitées. Confirmez et donnez à l'utilisateur les options de récupération.

Respecter la vie privée et la sécurité de l'utilisateur

Respecter la vie privée et la sécurité des utilisateurs
Les commentaires des utilisateurs pour une compétence bancaire mettent en évidence des problèmes de sécurité, malgré le respect des exigences de sécurité d'Alexa Skill.

Conclusion

Chaque fois que vous essayez d'interagir avec un humain, vous devez considérer les humains comme des systèmes d'exploitation très avancés. Votre objectif le plus élevé est d'essayer de les imiter. – KK Barrett, concepteur de production de son film, Wired, 2014

Si vous n'avez pas vu le film Her, prenez quelques heures pour regarder ce film futuriste sur un écrivain solitaire qui développe une relation avec un système d'exploitation. Bien qu'il s'agisse de science-fiction, dans le monde d'aujourd'hui, les expériences vocales se multiplient avec l'adoption d'appareils autonomes à commande vocale, tels que la famille Amazon Echo et Google Home. Le développement d'une application vocale est un processus relativement simple, basé sur des modèles, avec des instructions de type IKEA fournies par Amazon et Google dans le but d'établir leurs plates-formes. Bien qu'il puisse être tentant de se lancer dans le développement, une bonne expérience utilisateur vocale ne se produit pas par hasard ; il doit être conçu en suivant les étapes décrites dans cet article.

Veuillez utiliser la zone de commentaires pour partager d'autres commentaires, astuces et ressources avec d'autres lecteurs.

Ressources

Outils de la plate-forme d'IA

  • Kit de compétences Alexa, Amazon
  • Actions pour Google
  • "Meilleures pratiques de conception vocale du kit de compétences Alexa", Amazon
  • Actions pour les ressources de conception Google

Ton de la voix

  • "L'impact du ton de la voix sur la perception de la marque par les utilisateurs", Kate Meyer, Nielsen Norman Group
  • "Trouver votre ton de voix", Robert Mills, Smashing Magazine
  • "Trouver la voix de votre marque", Harriet Cummings, distillée

Phrases et dialectes

  • "How Y'all, Youse and You Guys Talk (quiz interactif), New York Times
  • Définition de l'interface vocale (et des énoncés Alexa), Amazon
  • "Définir les énoncés pour le kit de compétences Alexa" (y compris l'outil), Maker Musings

Prototypage et test

Voici un exemple de mappage de phrases pour une capacité de notre quiz de conception UX. La plate-forme d'intelligence artificielle d'Alexa traduit bien l'intention de l'utilisateur pour les compétences en fonction de leurs modèles. Cependant, si vous apportez des modifications (comme nous avons changé "jeu quiz" en "quiz"), ces phrases devront être ajoutées.

Exemple de mappage de phrases
Voir la grande version

5. Affiner

La dernière étape du processus de conception consiste à valider et à affiner l'application vocale avant de consacrer du temps et des efforts au développement. Au cours de l'étape «détail», la lecture à haute voix des flux de conversation a permis de s'assurer qu'ils semblaient naturels et conversationnels. L'étape actuelle consiste à tester l'interface vocale avec les utilisateurs.

Le moyen le plus simple de tester consiste à utiliser la technique du magicien d'Oz, avec une personne jouant le rôle de l'appareil à commande vocale et répondant à l'utilisateur en fonction du script de l'interface vocale. Une autre option consiste à utiliser un logiciel de prototypage tel que SaySpring pour créer et tester des prototypes interactifs.

Si votre application vocale est créée à l'aide de modèles de code (comme notre application), il peut être plus facile de créer l'application et de la tester à l'aide des outils de test fournis par Amazon et Google dans la zone de développement des compétences (comme indiqué ci-dessous), ou dans mode test sur un appareil réel.

Simulateur de compétences Alexa

Ce test vous donnera une bonne idée de l'expérience vocale dans le monde réel, y compris la gestion des erreurs, des réponses répétitives et des réponses non naturelles, forcées ou de type machine.

Développer

Maintenant que l'expérience vocale a été conçue, il est temps de passer à la phase de construction-test-soumission. Chaque plate-forme propose des guides et des didacticiels détaillés pour aider tout le monde à développer et à tester des compétences, notamment Alexa Skills Kit, Develop Actions for Google et Cortana, qui propose de réutiliser votre code de compétence Alexa personnalisé !

Pensez à votre boucle de rétroaction et aux analyses qui vous aideront à comprendre l'utilisation de votre application vocale. Vous pouvez obtenir des mesures de compétences (utilisateurs, sessions, énoncés, intentions) dans votre compte de développeur sans aucun codage supplémentaire, mais des analyses avancées sont disponibles via des services gratuits tels que VoiceLabs (je n'ai pas pu le faire fonctionner, probablement en raison de mon manque de codage compétences ou l'absence d'un guide d'installation VoiceLabs for Dummies ).

Une fois que vous avez terminé de créer et de tester votre application vocale, la dernière étape est un processus de soumission simplifié. Parce que le marché Alexa Skill s'est rapidement développé, il devient difficile de découvrir de nouvelles applications utiles. Jusqu'à ce qu'Amazon améliore cela, utilisez des éléments visibles de votre liste d'applications vocales pour aider les utilisateurs à trouver et à essayer votre compétence, y compris une icône de compétence accrocheuse et pertinente, un nom et une description.

La compétence compagnon qui a été construite à titre d'illustration peut être prise pour un essai routier sur la boutique Amazon Alexa Skill : UX Design Quiz

Des principes directeurs

Voici quelques principes directeurs pour la conception d'expériences vocales. Plus de principes et de choses à faire et à ne pas faire sont proposés par Amazon et Google.

Intégrez l'utilisateur et aidez-le à démarrer

Présentez l'application et les façons dont l'utilisateur peut interagir avec elle.

Bienvenue au quiz de conception UX. Je vais vous poser cinq questions sur la conception UX et voir combien vous obtenez de bonnes réponses. Vous pouvez me demander de répéter une question ou de faire une pause si nécessaire. Souhaitez-vous commencer un nouveau quiz ?

Gardez les échanges de conversation brefs pour réduire la charge cognitive.

Avec une interface utilisateur vocale, l'utilisateur doit utiliser sa mémoire à court terme tout en interagissant avec l'application vocale. Alors, soyez bref et doux.

Alexa : « Ce principe est attribué à un logicien et frère franciscain du XIVe siècle et porte le nom du village du comté anglais de Surrey où il est né. En un mot, il déclare que la simplicité vaut mieux que la complexité. Ce principe de résolution de problèmes peut facilement être appliqué à la conception de l'expérience utilisateur, en optant pour la solution de conception la plus simple. Comment s'appelle ce principe ?
  1. Votre première option est le rasoir d'Occam, parfois appelé rasoir d'Ockham, ou la loi de la parcimonie.
  2. Votre prochaine option est la loi de Hick, également connue sous le nom de loi de Hick-Hyman.
  3. Votre prochaine option est l'effet esthétique-utilisabilité.
  4. Votre dernière option s'appelle "satisfaire", à ne pas confondre avec "satisfaire" ou "sacrifier".

Veuillez dire A, B, C ou D pour faire votre choix.

Utilisateur : "Hein ? ! Alexa, répète. À la réflexion, fin du quiz !"

Les exemples fonctionnent mieux que les instructions

Instruction : "Veuillez indiquer votre date de naissance au format mois/jour/année." Exemple : "Veuillez indiquer votre date de naissance, par exemple le 15 avril 1990."

Délectez-vous sans interférer avec la tâche

C'est un exercice d'équilibre. Trop et ça devient vite lassant.

Utilisez des confirmations explicites pour les actions importantes et implicites pour les moins risquées

Si vous demandez à Alexa d'éteindre les lumières, vous pouvez le voir se produire et vous n'avez pas besoin d'une confirmation verbale, bien qu'elle confirme parfois avec un court "OK".

Ne pas interférer, réduire la répétitivité
Les commentaires des utilisateurs pour la compétence Glad Leftover mettent en évidence les deux principes ci-dessus.

Conception pour l'échec

Les choses iront mal : concevoir pour ces situations. Les exemples incluent des questions ou des informations inintelligibles, des informations incomplètes, des silences ou des demandes qui ne peuvent pas être traitées. Confirmez et donnez à l'utilisateur les options de récupération.

Respecter la vie privée et la sécurité de l'utilisateur

Respecter la vie privée et la sécurité des utilisateurs
Les commentaires des utilisateurs pour une compétence bancaire mettent en évidence des problèmes de sécurité, malgré le respect des exigences de sécurité d'Alexa Skill.

Conclusion

Chaque fois que vous essayez d'interagir avec un humain, vous devez considérer les humains comme des systèmes d'exploitation très avancés. Votre objectif le plus élevé est d'essayer de les imiter. – KK Barrett, concepteur de production de son film, Wired, 2014

Si vous n'avez pas vu le film Her, prenez quelques heures pour regarder ce film futuriste sur un écrivain solitaire qui développe une relation avec un système d'exploitation. Bien qu'il s'agisse de science-fiction, dans le monde d'aujourd'hui, les expériences vocales se multiplient avec l'adoption d'appareils autonomes à commande vocale, tels que la famille Amazon Echo et Google Home. Le développement d'une application vocale est un processus relativement simple, basé sur des modèles, avec des instructions de type IKEA fournies par Amazon et Google dans le but d'établir leurs plates-formes. Bien qu'il puisse être tentant de se lancer dans le développement, une bonne expérience utilisateur vocale ne se produit pas par hasard ; il doit être conçu en suivant les étapes décrites dans cet article.

Veuillez utiliser la zone de commentaires pour partager d'autres commentaires, astuces et ressources avec d'autres lecteurs.

Ressources

Outils de la plate-forme d'IA

  • Kit de compétences Alexa, Amazon
  • Actions pour Google
  • "Meilleures pratiques de conception vocale du kit de compétences Alexa", Amazon
  • Actions pour les ressources de conception Google

Ton de la voix

  • "L'impact du ton de la voix sur la perception de la marque par les utilisateurs", Kate Meyer, Nielsen Norman Group
  • "Trouver votre ton de voix", Robert Mills, Smashing Magazine
  • "Trouver la voix de votre marque", Harriet Cummings, distillée

Phrases et dialectes

  • "How Y'all, Youse and You Guys Talk (quiz interactif), New York Times
  • Définition de l'interface vocale (et des énoncés Alexa), Amazon
  • "Définir les énoncés pour le kit de compétences Alexa" (y compris l'outil), Maker Musings

Prototypage et test

  • SaySpring "Logiciel de prototypage gratuit pour la voix"
  • Echosim.io "Outil de test de compétence Alexa"
  • "Simulateur Web", Actions pour Google

Reportage, Livre et Film

  • "Le rapport vocal 2017 par VoiceLabs"
  • Conception d'interfaces utilisateur vocales : principes des expériences conversationnelles , Cathy Pearl, O'Reilly Media
  • Elle (film)