Projetando experiências de voz

Publicados: 2022-03-10
Resumo rápido ↬ As interfaces baseadas em voz estão se tornando comuns. Assistentes de voz como Siri e Cortana já existem há alguns anos, mas na última temporada de festas, dispositivos acionados por voz da Amazon e do Google chegaram a milhões de lares. Análises recentes da VoiceLabs estimam que 24,5 milhões de dispositivos acionados por voz serão enviados este ano, quase quatro vezes mais do que no ano passado. Como designers de experiência, agora temos a oportunidade de projetar experiências e interfaces de voz!

Análises recentes da VoiceLabs estimam que 24,5 milhões de dispositivos acionados por voz serão enviados este ano, quase quatro vezes mais do que no ano passado. Como designers de experiência, agora temos a oportunidade de projetar experiências e interfaces de voz!

Uma nova interface não significa que devemos desconsiderar tudo o que aplicamos com sucesso às interfaces anteriores; precisaremos adaptar nosso processo às nuances das interfaces orientadas por voz, incluindo interações de conversação e a falta de uma tela. Veremos como funciona um gênio típico em uma garrafa, discutiremos as etapas envolvidas no design de experiências de voz e ilustraremos essas etapas projetando um aplicativo de voz para Alexa (ou Skill, como a Amazon o chama).

### Leitura adicional no SmashingMag:

  • Aprimorando a experiência do usuário com a API Web Speech
  • Diretrizes para projetar com áudio
  • Experimentando com a síntese de fala
  • O que é design de experiência do usuário? Visão geral, ferramentas e recursos
Mais depois do salto! Continue lendo abaixo ↓
## Entendendo as interfaces de voz Assim como os aplicativos móveis são executados em um sistema operacional e um dispositivo, três camadas precisam trabalhar juntas para permitir interações de voz:
Camadas de interface de usuário de voz
As camadas que permitem interações de voz
  1. aplicativo de voz (Amazon Skills and Actions for Google);
  2. plataforma de inteligência artificial (Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana);
  3. dispositivo (Echo, Home, smartphones, computadores).
Cada camada usa a que está abaixo e suporta a que está acima. A interface de voz fica nas duas camadas superiores, ambas residindo na nuvem, não no próprio dispositivo. Vamos espiar por baixo do capô para ver como essas camadas funcionam juntas, usando o Alexa Jeopardy! Habilidade como exemplo.

Como funcionam as interfaces de voz - exemplo de habilidade Jeopardy
As camadas que permitem interações de voz. (Ver versão grande)

Dispositivos acionados por voz, como o Amazon Echo e o Google Home, estão constantemente ouvindo, aguardando uma palavra de ativação (“Alexa…” ou “OK, Google…”) para entrar em ação. Uma vez ativado, o dispositivo envia o áudio que segue para a plataforma de IA na nuvem (“… play Jeopardy!”). A plataforma usa uma combinação de reconhecimento automático de fala (ASR) e compreensão de linguagem natural (NLU) para decifrar a intenção do usuário (iniciar um jogo de trivia) e enviá-lo para o aplicativo de suporte (Jeopardy! J6 Skill no Alexa). O aplicativo processa a solicitação e responde por meio de texto (e visual, se aplicável). A plataforma converte o texto em fala e o reproduz através do dispositivo (“Bem-vindo ao Jeopardy J6. Aqui estão as pistas de hoje…”). Tudo isso em questão de segundos.

Construindo experiências de voz

No ano passado, Mark Zuckerberg assumiu um desafio pessoal para construir uma IA simples para administrar sua casa. Ele o fez, chamou de Jarvis e deu a voz de Morgan Freeman.

Mark Zuckerberg apresenta Morgan Freeman à IA que usa sua voz
Mark Zuckerberg apresenta Morgan Freeman à IA que usa sua voz. (Imagem: Mark Zuckerberg)

O resto de nós que não tem capacidade ou recursos para fazer o mesmo pode se safar criando aplicativos de voz que são executados em plataformas de IA complexas que já foram construídas. Isso nos libera de ter que se preocupar apenas com o design e desenvolvimento do aplicativo de voz, também com um processo de desenvolvimento simplificado. A Amazon e o Google forneceram acesso aberto a modelos, código e instruções detalhadas passo a passo para criar diferentes tipos de aplicativos de voz, a ponto de até mesmo não desenvolvedores poderem desenvolver um aplicativo em cerca de uma hora!

Seu investimento na simplificação do desenvolvimento de aplicativos está valendo a pena, com milhares de novos aplicativos de voz sendo lançados todos os meses. O crescimento dos aplicativos de voz traz de volta memórias da corrida do ouro na web dos anos 90, bem como a explosão de aplicativos móveis que se seguiram ao lançamento das lojas de aplicativos.

Detalhamento de Alexa Skills por categoria em maio de 2017
Detalhamento de Alexa Skills por categoria em maio de 2017. (Ver versão ampliada)

Em um mercado de voz lotado, um bom design é o que diferenciará seu aplicativo de voz das centenas de outros aplicativos semelhantes.

Projetando experiências de voz

Projetar uma boa experiência de usuário de voz é um processo de cinco etapas que deve ocorrer antes de iniciar o desenvolvimento. Embora pular direto para o desenvolvimento possa ser tentador, o tempo gasto para acertar o design é um tempo bem gasto.

Etapas na criação de experiências de voz
As etapas na criação de experiências de voz (Ver versão ampliada)

Discutiremos e aplicaremos cada etapa para projetar um aplicativo de voz, que pode ser facilmente desenvolvido usando um dos muitos modelos de habilidade para Alexa.

1. Descubra

A jornada de design começa com a pergunta: “Como esse aplicativo de voz agregará valor aos meus usuários?” Essa pergunta se aplica se você estiver desenvolvendo um aplicativo de voz independente (como nosso exemplo) ou se seu aplicativo de voz for apenas um dos muitos pontos de contato com seus clientes. Leve em consideração por que e onde as pessoas usam aplicativos de voz. As pessoas usam interfaces de voz devido aos benefícios da interação com as mãos livres, a velocidade da interação e a facilidade de uso, principalmente em casa ou no carro, conforme mostrado no Relatório de Tendências da Internet de 2016 de Mary Meeker.

Principais razões para usar interfaces de voz
Principais motivos para usar interfaces de voz (frases por autor) (Fonte: KPCB) (Ver versão ampliada)

A chave é encontrar necessidades consistentes do usuário que sejam mais fáceis ou convenientes por meio de um aplicativo de voz em vez de um telefone ou computador. Alguns exemplos incluem bancos que fornecem informações de conta ou um espectador encontrando novos filmes passando nas proximidades.

Se você tiver concorrentes que já possuem aplicativos de voz, leve em consideração o que eles estão fazendo e as avaliações e comentários que seus aplicativos receberam no mercado de aplicativos (como a Alexa Skill Store da Amazon). O objetivo não é imitar cegamente, mas estar ciente da barra de recursos que foi definida, bem como das expectativas do usuário.

(No momento em que escrevo isso, havia mais de 1.500 habilidades de "conhecimento e curiosidades" Alexa Skills, tornando-as as categorias de habilidades mais lotadas da Amazon. No entanto, não havia uma única habilidade de curiosidades que atendesse à área de experiência do usuário. Para ilustrar no processo de design de voz, criaremos uma habilidade de design de UX, para que nossos leitores testem seus conhecimentos ou talvez até aprendam algo novo.)

2. Defina

Durante esta etapa, definiremos a personalidade do nosso aplicativo e os recursos que ele terá.

Personalidade

Ao projetar interfaces de voz, não temos acesso a muitos dos elementos visuais que usamos em interfaces web e móveis para mostrar uma personalidade. A personalidade tem que vir através da voz e do tom das interações verbais. E, ao contrário de Zuckerberg, que ouve a voz suave de Freeman, somos obrigados a ouvir a voz padrão do dispositivo. Isso torna o tom e as palavras cruciais para transmitir a personalidade que queremos transmitir.

A boa notícia é que a maior parte do trabalho de base nessa área já deve ter sido concluída e documentada em um guia de marca corporativa ou guia de estilo de site (dica: procure a seção “tom de voz”). Aproveite essas diretrizes para seu aplicativo de voz, bem como para manter uma personalidade consistente em todos os canais e pontos de contato.

Quando penso em personalidade e tom, o Virgin Group imediatamente vem à mente. Eles definem claramente quem são e como transmitem isso aos usuários. Para a Virgin America, o tom ideal é “hip, descontraído, informal, brincalhão e irônico”, e isso transparece claramente em todas as suas comunicações.

Personalidade da marca Virgin America
A personalidade da marca Virgin America (Fonte: Virgin America)

Se você já pediu a Alexa para cantar ou experimentou qualquer um dos inúmeros ovos de Páscoa da Alexa, saberá que ela tem uma personalidade própria. Curioso, entrei em contato com a equipe responsável por sua personalidade e aqui está o que eles tinham a dizer:

Ao arquitetar a voz de Alexa, tentamos dar a ela uma personalidade que refletisse os atributos que mais valorizamos na Amazon. Queríamos que ela se sentisse útil, humilde e inteligente, mantendo um senso de diversão. Este é um processo contínuo e esperamos que a voz da Alexa evolua à medida que mais desenvolvedores se concentrarem em torná-la mais inteligente.

A personalidade também pode ser refletida no nome, ícone e descrição do aplicativo que são exibidos aos usuários na listagem do diretório de aplicativos, bem como no nome usado para invocar o aplicativo (o nome de invocação). Portanto, certifique-se de que ele brilhe ao publicar seu aplicativo.

Para nossa habilidade de UX Design, poderíamos adotar uma abordagem direta ou engraçada, e isso se refletiria nas palavras das opções de perguntas e respostas do nosso questionário.

Um exemplo de tom normal seria:

Qual princípio de design de UX favorece a simplicidade sobre a complexidade?
  1. Navalha de Occam
  2. Lei de Hick
  3. Efeito de usabilidade estética
  4. Satisfatório

E um exemplo de tom engraçado seria:

Aparentemente, existe um princípio de design UX que favorece a simplicidade sobre a complexidade. Mesmo! Você consegue adivinhar como se chama?
  1. Navalha de Occam: O melhor que um cara de UX pode obter.
  2. Lei de Hick: Parece algo que um caipira de UX inventaria.
  3. Efeito de usabilidade estética: esse é um jargão sofisticado de UX.
  4. Satisfazendo: Eu não consigo ficar satisfeito... peço desculpas aos Rolling Stones.

Sim, vamos ficar com o normal.

Capacidades

É aqui que você pensa cuidadosamente na funcionalidade que será valiosa para os usuários do seu aplicativo de voz. Revisite seu trabalho desde a primeira etapa para identificar os recursos essenciais ou relacionados ao seu negócio. Às vezes, oferecer recursos essenciais é um acéfalo – como um banco que oferece informações sobre saldo, transações e datas de vencimento. Outros oferecem valor na forma de recursos relacionados, como o aplicativo de voz do guia de remoção de manchas da Tide ou os aplicativos de voz da Glad's (fabricantes de armazenamento de alimentos e sacos de lixo), um dos quais ajuda os usuários a lembrar onde armazenaram suas sobras, ou o outro aquele que permite aos usuários verificar quais itens devem ser reciclados ou descartados no lixo.

Se você fez um exercício semelhante ao passar da web para o celular, isso pode servir como ponto de partida. Para recursos de voz, considere quais recursos beneficiariam seus usuários em um dispositivo controlado por voz em um espaço compartilhado. Se uma habilidade tiver implicações de segurança ou privacidade, considere adicionar um nível de proteção (a habilidade Capital One Alexa permite que os usuários criem uma chave pessoal para acesso à conta). Embora você possa acabar com uma lista de funcionalidades que funcionariam por voz, comece com um a cinco recursos principais e use a análise de voz para atualizar e melhorar após o lançamento.

Os principais recursos de uma habilidade de design de UX podem ser:

  1. fornecer um princípio de design UX sob demanda;
  2. questionar o usuário (single player) em um princípio de UX aleatório;
  3. questione o usuário (single player) sobre o princípio de UX múltiplo e mantenha a pontuação;
  4. realizar uma competição de quiz UX com vários jogadores.

Como estamos construindo essa habilidade de design de UX usando os modelos de habilidades da Amazon, nossas escolhas estão atualmente restritas à primeira opção (modelo de habilidade de fato) ou terceira (modelo de habilidade de trivia) acima. Supondo que nossa pesquisa tenha mostrado que nossos usuários achariam um questionário mais valioso do que apenas ouvir um princípio de UX recitado, nossa capacidade principal será questionar o usuário sobre os princípios de UX e manter a pontuação.

3. Detalhar o fluxo de conversa

Agora que você selecionou os recursos do seu aplicativo de voz, comece a se concentrar no fluxo de conversa detalhado que o aplicativo terá com seus usuários. A conversação humana é complexa; muitas vezes tem muitas voltas e reviravoltas e pode girar a qualquer momento, com as pessoas muitas vezes pulando de um tópico para outro. As plataformas de IA de voz ainda têm um longo caminho a percorrer para atingir esse nível de complexidade, então você precisa ensinar sua habilidade a responder aos usuários.

Seu aplicativo de voz só pode oferecer suporte aos recursos que você definiu na etapa anterior, mas os usuários sempre podem perguntar qualquer coisa ao aplicativo e em qualquer formato. Detalhar um fluxo de conversa permite que você responda ao usuário ou direcione a conversa para o que o aplicativo pode fazer pelo usuário.

Para cada recurso que o aplicativo de voz oferecerá, comece a criar diálogos de conversação entre o usuário e o aplicativo, semelhantes aos diálogos em um roteiro. Ao escrever esses diálogos, lembre-se da personalidade, bem como das características de voz e tom. Comece a criar e organizar o conteúdo real do seu aplicativo de voz; para o nosso quiz, isso significaria construir a lista de perguntas do quiz.

Comece com o “caminho feliz” — um fluxo de conversação no qual o aplicativo de voz pode responder à solicitação do usuário sem exceções ou erros. Em seguida, avance para detalhar o fluxo conversacional para exceções (em que o usuário não fornece informações completas) e erros (em que o aplicativo de voz não entende ou não pode fazer o que o usuário está pedindo).

Como a conversa será ouvida e não lida, uma boa prática é lê-la em voz alta para ver se soa como uma conversa falada natural e verificar se ela transmite o tom de voz pretendido.

Se seu aplicativo de voz precisar complementar a conversa com o conteúdo exibido no aplicativo de telefone, crie essas interações em conjunto para que pareçam perfeitas para o usuário. Por exemplo, a habilidade de remoção de manchas da Tide informa ao usuário que eles também podem consultar as etapas de remoção de manchas no aplicativo Alexa, além de ouvir as instruções. Isso pode ser necessário em breve se os rumores de uma tela sensível ao toque no novo Echo forem verdadeiros.

Aqui está um exemplo de diálogo para o caminho feliz da capacidade principal da nossa habilidade de design de UX:

Usuário : “Alexa, inicie o teste de design de UX.”

Alexa : “Vou fazer cinco perguntas, com respostas de múltipla escolha. Tente acertar o máximo que puder. Basta dizer o número da resposta. Vamos começar. Questão 1…"

Usuário : [responde corretamente]

Alexa : “Isso mesmo! Sua pontuação é 1. Aqui está a pergunta 2…”

Usuário : [responde incorretamente]

Alexa : “Opa, essa é a resposta errada. A resposta correta é [resposta correta]. Sua pontuação é 1. Aqui está a pergunta 3…”

Alexa (no final de cinco perguntas): “Isso mesmo! Você acertou quatro das cinco questões. Obrigado por jogar!”

4. Descreva frases alternativas

As pessoas nem sempre usam as mesmas palavras para dizer a mesma coisa, e os aplicativos de voz precisam aprender isso. O mapeamento de frases é um exercício para ensinar os aplicativos de voz a acomodar variações na maneira como os usuários expressam suas solicitações.

Para cada caminho de conversação detalhado na etapa anterior, pense nas diferentes maneiras pelas quais os usuários podem formular essas solicitações. Em seguida, divida a redação de cada solicitação e identifique variações de palavras e sinônimos que eles possam usar, levando em consideração quaisquer variações e dialetos regionais. Você terá as mãos ocupadas se o seu aplicativo de voz lidar com bebidas carbonatadas açucaradas (refrigerante, refrigerante, coca, tônica, refrigerante, refrigerante), sanduíches longos (sub, moedor, sanduíche, herói, pobre menino, bomba, sanduíche italiano, baguete) ou calçado de atletismo (sapatilhas, sapatos, sapatilhas de ginástica, sandálias, camisolas, ténis, sapatilhas, sapatilhas, sapatilhas).

Faça esta lista de variações o mais completa e exaustiva possível, para que seu aplicativo de voz possa entender as solicitações dos usuários. Alexa precisa dessas variações na forma de “enunciados” e recomenda fornecer “… o maior número possível de frases representativas”. Dependendo dos recursos do seu aplicativo de voz, o número de enunciados pode facilmente chegar às centenas, mas há maneiras de simplificar a geração de enunciados.

Aqui está um exemplo de mapeamento de frase para um recurso do nosso teste de design de UX. A plataforma de IA da Alexa faz um bom trabalho ao traduzir a intenção do usuário para Skills com base em seus modelos. No entanto, se você fizer alterações (como alteramos “jogo de trivia” para “quiz”), essas frases terão que ser adicionadas.

Exemplo de mapeamento de frase
Ver versão grande

5. Refinar

A etapa final no processo de design é validar e refinar o aplicativo de voz antes de gastar tempo e esforço no desenvolvimento. Durante a etapa de “detalhe”, ler os fluxos de conversa em voz alta ajudou a garantir que eles soassem naturais e conversacionais. A etapa atual envolve testar a interface de voz com os usuários.

A maneira mais simples de testar é usar a técnica do Mágico de Oz, com uma pessoa desempenhando o papel do dispositivo acionado por voz e respondendo ao usuário com base no script da interface de voz. Outra opção é usar softwares de prototipagem como o SaySpring para criar e testar protótipos interativos.

Se seu aplicativo de voz está sendo construído usando modelos de código (como nosso aplicativo é), pode ser mais fácil criar o aplicativo e testá-lo usando ferramentas de teste fornecidas pela Amazon e Google na área de desenvolvimento de habilidades (como mostrado abaixo) ou em modo de teste em um dispositivo real.

Simulador de habilidades Alexa

Este teste lhe dará uma boa noção da experiência de voz no mundo real, incluindo o tratamento de erros, respostas repetitivas e respostas não naturais, forçadas ou semelhantes a máquinas.

Desenvolver

Agora que a experiência de voz foi projetada, é hora de passar para a fase build-test-submit. Cada plataforma possui guias e tutoriais detalhados para ajudar qualquer pessoa a desenvolver e testar habilidades, incluindo Alexa Skills Kit, Develop Actions for Google e Cortana, que oferece a reutilização de seu código de habilidade Alexa personalizado!

Pense no seu ciclo de feedback e nas análises que o ajudarão a entender o uso do seu aplicativo de voz. Você pode obter métricas de habilidades (usuários, sessões, enunciados, intenções) em sua conta de desenvolvedor sem qualquer codificação adicional, mas análises avançadas estão disponíveis por meio de serviços gratuitos, como VoiceLabs (não consegui fazê-lo funcionar, provavelmente devido à minha falta de codificação habilidades ou a falta de um guia de configuração do VoiceLabs for Dummies ).

Depois de terminar de criar e testar seu aplicativo de voz, a última etapa é um processo de envio simplificado. Como o mercado Alexa Skill cresceu rapidamente, está ficando difícil descobrir aplicativos novos e úteis. Até que a Amazon melhore isso, use elementos visíveis de sua lista de aplicativos de voz para ajudar os usuários a encontrar e testar sua habilidade, incluindo um ícone de habilidade atraente e relevante, nome e descrição.

A habilidade complementar que foi criada como ilustração pode ser feita para um test drive na loja Amazon Alexa Skill: UX Design Quiz

Princípios Orientadores

Aqui estão alguns princípios orientadores para projetar experiências de voz. Mais princípios e prós e contras detalhados são oferecidos pela Amazon e pelo Google.

Integrar o usuário e ajudá-lo a começar

Apresente o aplicativo e as maneiras pelas quais o usuário pode se envolver com ele.

Bem-vindo ao UX Design Quiz. Vou fazer cinco perguntas sobre UX design e ver quantas você acerta. Você pode me pedir para repetir uma pergunta ou fazer uma pausa, se necessário. Gostaria de iniciar um novo quiz?

Mantenha as trocas de conversas breves para reduzir a carga cognitiva.

Com uma interface de usuário de voz, o usuário precisa usar sua memória de curto prazo enquanto interage com o aplicativo de voz. Então, mantenha-o curto e doce.

Alexa : “Este princípio é atribuído a um lógico e frade franciscano do século XIV e recebeu o nome da vila no condado inglês de Surrey, onde ele nasceu. Em poucas palavras, afirma que a simplicidade é melhor do que a complexidade. Esse princípio de solução de problemas pode ser facilmente aplicado ao design da experiência do usuário, optando pela solução de design mais simples. Como se chama esse princípio?
  1. Sua primeira opção é a navalha de Occam, às vezes conhecida como navalha de Ockham, ou a lei da parcimônia.
  2. Sua próxima opção é a Lei de Hick, também conhecida como Lei de Hick-Hyman.
  3. Sua próxima opção é o efeito de usabilidade estética.
  4. Sua última opção é chamada de “satisfação”, que não deve ser confundida com “satisfação” ou “sacrifício”.

Por favor, diga A, B, C ou D para fazer sua seleção.”

Usuário : “Hein?! Alexa, repita. Pensando bem, termine o quiz!”

Exemplos funcionam melhor que instruções

Instrução: "Por favor, diga sua data de nascimento no formato mês/dia/ano." Exemplo: "Por favor, diga sua data de nascimento, como 15 de abril de 1990."

Deleite sem interferir na tarefa

Este é um ato de equilíbrio. Muito e fica cansativo rapidamente.

Use confirmações explícitas para ações importantes e implícitas para ações menos arriscadas

Se você pedir à Alexa para desligar as luzes, poderá ver isso acontecer e não precisará de uma confirmação verbal, embora às vezes ela confirme com um breve “OK”.

Não interfira, reduza a repetitividade
O feedback do usuário para a habilidade Glad Leftover destaca dois princípios acima.

Projeto para falha

As coisas vão dar errado: projete para essas situações. Exemplos incluem perguntas ou informações ininteligíveis, informações incompletas, silêncio ou solicitações que não podem ser tratadas. Reconheça e dê ao usuário opções de recuperação.

Respeite a privacidade e segurança do usuário

Respeite a privacidade e a segurança do usuário
O feedback do usuário para uma Skill bancária destaca problemas de segurança, apesar de passar pelos requisitos de segurança da Alexa Skill.

Conclusão

Sempre que você tenta interagir com um humano, você tem que pensar nos humanos como sistemas operacionais muito avançados. Seu maior objetivo é tentar imitá-los. – KK Barrett, seu designer de produção de filmes, Wired, 2014

Se você ainda não viu o filme Ela, reserve algumas horas para assistir a este filme futurista sobre um escritor solitário que desenvolve um relacionamento com um sistema operacional. Embora seja ficção científica, no mundo de hoje, as experiências de voz estão aumentando com a adoção de dispositivos autônomos de voz, como a família Amazon Echo e o Google Home. O desenvolvimento de um aplicativo de voz é um processo relativamente simples, orientado por modelos, com instruções semelhantes à IKEA fornecidas pela Amazon e pelo Google na tentativa de estabelecer suas plataformas. Embora saltar para o desenvolvimento possa ser tentador, uma boa experiência de usuário de voz não acontece por acaso; ele deve ser projetado, seguindo as etapas descritas neste artigo.

Por favor, use a área de comentários para compartilhar quaisquer outros comentários, dicas e recursos com outros leitores.

Recursos

Ferramentas do AI Platform

  • Kit de habilidades Alexa, Amazon
  • Ações para o Google
  • "Práticas recomendadas de design de voz do Alexa Skills Kit", Amazon
  • Ações para recursos de design do Google

Tom de voz

  • "O impacto do tom de voz na percepção da marca pelos usuários", Kate Meyer, Nielsen Norman Group
  • "Encontrando seu tom de voz", Robert Mills, Smashing Magazine
  • "Encontrando a voz da sua marca", Harriet Cummings, Destilado

Frases e dialetos

  • "Como vocês, você e vocês falam (quiz interativo), New York Times
  • Definindo a interface de voz (e os enunciados do Alexa), Amazon
  • "Definindo Enunciados para o Alexa Skills Kit" (incluindo a ferramenta), Maker Musings

Prototipagem e testes

Aqui está um exemplo de mapeamento de frase para um recurso do nosso teste de design de UX. A plataforma de IA da Alexa faz um bom trabalho ao traduzir a intenção do usuário para Skills com base em seus modelos. No entanto, se você fizer alterações (como alteramos “jogo de trivia” para “quiz”), essas frases terão que ser adicionadas.

Exemplo de mapeamento de frase
Ver versão grande

5. Refinar

A etapa final no processo de design é validar e refinar o aplicativo de voz antes de gastar tempo e esforço no desenvolvimento. Durante a etapa de “detalhe”, ler os fluxos de conversa em voz alta ajudou a garantir que eles soassem naturais e conversacionais. A etapa atual envolve testar a interface de voz com os usuários.

A maneira mais simples de testar é usar a técnica do Mágico de Oz, com uma pessoa desempenhando o papel do dispositivo acionado por voz e respondendo ao usuário com base no script da interface de voz. Outra opção é usar softwares de prototipagem como o SaySpring para criar e testar protótipos interativos.

Se seu aplicativo de voz está sendo construído usando modelos de código (como nosso aplicativo é), pode ser mais fácil criar o aplicativo e testá-lo usando ferramentas de teste fornecidas pela Amazon e Google na área de desenvolvimento de habilidades (como mostrado abaixo) ou em modo de teste em um dispositivo real.

Simulador de habilidades Alexa

Este teste lhe dará uma boa noção da experiência de voz no mundo real, incluindo o tratamento de erros, respostas repetitivas e respostas não naturais, forçadas ou semelhantes a máquinas.

Desenvolver

Agora que a experiência de voz foi projetada, é hora de passar para a fase build-test-submit. Cada plataforma possui guias e tutoriais detalhados para ajudar qualquer pessoa a desenvolver e testar habilidades, incluindo Alexa Skills Kit, Develop Actions for Google e Cortana, que oferece a reutilização de seu código de habilidade Alexa personalizado!

Pense no seu ciclo de feedback e nas análises que o ajudarão a entender o uso do seu aplicativo de voz. Você pode obter métricas de habilidades (usuários, sessões, enunciados, intenções) em sua conta de desenvolvedor sem qualquer codificação adicional, mas análises avançadas estão disponíveis por meio de serviços gratuitos, como VoiceLabs (não consegui fazê-lo funcionar, provavelmente devido à minha falta de codificação habilidades ou a falta de um guia de configuração do VoiceLabs for Dummies ).

Depois de terminar de criar e testar seu aplicativo de voz, a última etapa é um processo de envio simplificado. Como o mercado Alexa Skill cresceu rapidamente, está ficando difícil descobrir aplicativos novos e úteis. Até que a Amazon melhore isso, use elementos visíveis de sua lista de aplicativos de voz para ajudar os usuários a encontrar e testar sua habilidade, incluindo um ícone de habilidade atraente e relevante, nome e descrição.

A habilidade complementar que foi criada como ilustração pode ser feita para um test drive na loja Amazon Alexa Skill: UX Design Quiz

Princípios Orientadores

Aqui estão alguns princípios orientadores para projetar experiências de voz. Mais princípios e prós e contras detalhados são oferecidos pela Amazon e pelo Google.

Integrar o usuário e ajudá-lo a começar

Apresente o aplicativo e as maneiras pelas quais o usuário pode se envolver com ele.

Bem-vindo ao UX Design Quiz. Vou fazer cinco perguntas sobre UX design e ver quantas você acerta. Você pode me pedir para repetir uma pergunta ou fazer uma pausa, se necessário. Gostaria de iniciar um novo quiz?

Mantenha as trocas de conversas breves para reduzir a carga cognitiva.

Com uma interface de usuário de voz, o usuário precisa usar sua memória de curto prazo enquanto interage com o aplicativo de voz. Então, mantenha-o curto e doce.

Alexa : “Este princípio é atribuído a um lógico e frade franciscano do século XIV e recebeu o nome da vila no condado inglês de Surrey, onde ele nasceu. Em poucas palavras, afirma que a simplicidade é melhor do que a complexidade. Esse princípio de solução de problemas pode ser facilmente aplicado ao design da experiência do usuário, optando pela solução de design mais simples. Como se chama esse princípio?
  1. Sua primeira opção é a navalha de Occam, às vezes conhecida como navalha de Ockham, ou a lei da parcimônia.
  2. Sua próxima opção é a Lei de Hick, também conhecida como Lei de Hick-Hyman.
  3. Sua próxima opção é o efeito de usabilidade estética.
  4. Sua última opção é chamada de “satisfação”, que não deve ser confundida com “satisfação” ou “sacrifício”.

Por favor, diga A, B, C ou D para fazer sua seleção.”

Usuário : “Hein?! Alexa, repita. Pensando bem, termine o quiz!”

Exemplos funcionam melhor que instruções

Instrução: "Por favor, diga sua data de nascimento no formato mês/dia/ano." Exemplo: "Por favor, diga sua data de nascimento, como 15 de abril de 1990."

Deleite sem interferir na tarefa

Este é um ato de equilíbrio. Muito e fica cansativo rapidamente.

Use confirmações explícitas para ações importantes e implícitas para ações menos arriscadas

Se você pedir à Alexa para desligar as luzes, poderá ver isso acontecer e não precisará de uma confirmação verbal, embora às vezes ela confirme com um breve “OK”.

Não interfira, reduza a repetitividade
O feedback do usuário para a habilidade Glad Leftover destaca dois princípios acima.

Projeto para falha

As coisas vão dar errado: projete para essas situações. Exemplos incluem perguntas ou informações ininteligíveis, informações incompletas, silêncio ou solicitações que não podem ser tratadas. Reconheça e dê ao usuário opções de recuperação.

Respeite a privacidade e segurança do usuário

Respeite a privacidade e a segurança do usuário
O feedback do usuário para uma Skill bancária destaca problemas de segurança, apesar de passar pelos requisitos de segurança da Alexa Skill.

Conclusão

Sempre que você tenta interagir com um humano, você tem que pensar nos humanos como sistemas operacionais muito avançados. Seu maior objetivo é tentar imitá-los. – KK Barrett, seu designer de produção de filmes, Wired, 2014

Se você ainda não viu o filme Ela, reserve algumas horas para assistir a este filme futurista sobre um escritor solitário que desenvolve um relacionamento com um sistema operacional. Embora seja ficção científica, no mundo de hoje, as experiências de voz estão aumentando com a adoção de dispositivos autônomos de voz, como a família Amazon Echo e o Google Home. O desenvolvimento de um aplicativo de voz é um processo relativamente simples, orientado por modelos, com instruções semelhantes à IKEA fornecidas pela Amazon e pelo Google na tentativa de estabelecer suas plataformas. Embora saltar para o desenvolvimento possa ser tentador, uma boa experiência de usuário de voz não acontece por acaso; ele deve ser projetado, seguindo as etapas descritas neste artigo.

Por favor, use a área de comentários para compartilhar quaisquer outros comentários, dicas e recursos com outros leitores.

Recursos

Ferramentas do AI Platform

  • Kit de habilidades Alexa, Amazon
  • Ações para o Google
  • "Práticas recomendadas de design de voz do Alexa Skills Kit", Amazon
  • Ações para recursos de design do Google

Tom de voz

  • "O impacto do tom de voz na percepção da marca pelos usuários", Kate Meyer, Nielsen Norman Group
  • "Encontrando seu tom de voz", Robert Mills, Smashing Magazine
  • "Encontrando a voz da sua marca", Harriet Cummings, Destilado

Frases e dialetos

  • "Como vocês, você e vocês falam (quiz interativo), New York Times
  • Definindo a interface de voz (e os enunciados do Alexa), Amazon
  • "Definindo Enunciados para o Alexa Skills Kit" (incluindo a ferramenta), Maker Musings

Prototipagem e testes

  • SaySpring "Software de prototipagem gratuito para voz"
  • Echosim.io "Ferramenta de teste de habilidade Alexa"
  • "Web Simulator," Ações para o Google

Relatório, livro e filme

  • "O Relatório de Voz de 2017 da VoiceLabs"
  • Projetando interfaces de usuário de voz: princípios de experiências de conversação , Cathy Pearl, O'Reilly Media
  • Ela (filme)