Projetando para o futuro com protótipos de voz

Publicados: 2022-03-10
Resumo rápido ↬ A comunicação homem-máquina está se expandindo rapidamente para abranger a interação escrita e falada, e é essencial estar pronto para projetar tanto para visual quanto para voz. Como a prototipagem para voz é nova para muitos designers, pode não estar claro por onde começar e qual processo seguir.

(Este artigo foi gentilmente patrocinado pela Adobe.) As interfaces habilitadas para voz estão desafiando o longo domínio das interfaces gráficas do usuário e estão rapidamente se tornando uma parte comum de nossas vidas diárias. De acordo com uma pesquisa realizada pela Adobe, 76% dos proprietários de alto-falantes inteligentes aumentaram o uso de assistentes de voz no último ano.

Neste artigo, compartilharei um fluxo que você pode usar para criar experiências baseadas em voz. Mas antes de nos aprofundarmos nas recomendações específicas sobre como projetar para voz, é importante entender as expectativas do usuário sobre isso.

Por que as pessoas esperam mais da voz?

As Interfaces de Usuário de Voz (VUIs) não apenas introduzem uma mudança na maneira como as pessoas interagem com as máquinas, mas também aumentam o nível de qualidade da interação . Quando as pessoas interagem com as GUIs e têm problemas com elas, geralmente se culpam, mas quando as pessoas interagem com as VUIs e não conseguem concluir uma tarefa, culpam o sistema.

Por que é que? Bem, falar é o meio mais naturalmente conveniente para a comunicação entre as pessoas, e as pessoas confiam em suas habilidades de fala. Isso pode ter uma influência direta na taxa de retenção: um relatório de 2017 da Voicelabs afirma que há apenas 6% de chance de um usuário estar ativo na segunda semana após o download de um aplicativo de voz.

Processo de design

Muitos designers pensam que projetar experiências baseadas em voz é completamente diferente das interfaces gráficas do usuário. Isso não é verdade.

Projetar experiências baseadas em voz não é uma nova direção no design de UX; é um próximo passo natural. É possível adaptar o processo de design que usamos para interfaces visuais para produtos baseados em voz.

Há cinco etapas que devem ocorrer antes de iniciar o desenvolvimento de um produto de voz:

  1. Pesquisa
  2. Definir
  3. Crio
  4. Teste
  5. Refinar

O melhor desse processo é que ele pode ser aplicado a todos os tipos de interfaces de voz, sejam elas habilitadas para voz, somente voz ou primeiro.

1. Pesquisa

Semelhante a qualquer outro produto digital que projetamos, precisamos aplicar o design que prioriza o usuário no contexto das interfaces de usuário de voz. O objetivo da pesquisa do usuário é entender as necessidades e comportamentos do usuário-alvo. As informações coletadas durante esta etapa serão a base para os requisitos do produto.

Identifique o público-alvo

Definir e pesquisar o público-alvo de um produto deve ser um dos primeiros passos no processo de design.

Aqui está o que focar durante esta etapa:

  • Veja a experiência atual e como os usuários estão resolvendo seus problemas agora. Ao identificar os pontos problemáticos , você encontrará os casos em que a voz pode beneficiar seus usuários.
  • Idioma do usuário . As frases exatas que um usuário-alvo usa quando fala com outras pessoas. Essas informações nos ajudarão a projetar um sistema para diferentes enunciados.

2. Defina

Durante esta etapa, precisamos moldar nosso produto futuro e definir suas capacidades.

Definir cenários-chave de interação

Cenários vêm antes de ideias específicas para aplicativos – eles são uma maneira de pensar sobre os motivos pelos quais alguém pode ter que usar uma VUI. Você precisa de cenários de design que tenham alto valor para seus usuários-alvo. Se você tem muitos cenários e não sabe quais são importantes e quais não são, crie uma matriz de casos de uso para avaliar cada cenário individual. A matriz lhe dirá quais cenários são primários, quais são secundários e quais são bons de se ter.

casos de uso de interações de voz
Aplicando a matriz de casos de uso às interações de voz. Imagem: Justin Baker. (Visualização grande)

Certifique-se de que os principais cenários funcionem com voz

Deve haver uma razão convincente para usar a voz. Os usuários devem ser capazes de resolver o problema com mais rapidez ou eficiência usando a voz do que qualquer uma das experiências alternativas.

Alguns casos comuns em que a interação por voz pode ser preferível para os usuários:

  • Quando as mãos do usuário estão ocupadas (enquanto dirige ou cozinha);
  • Quando usar a voz é uma maneira mais fácil e natural de interagir (por exemplo, é muito mais fácil dizer ao seu alto-falante inteligente para “Tocar Jazz” em vez de pular para uma central de mídia e selecionar a opção certa usando uma GUI).

Seu objetivo para esta etapa é identificar casos comuns e específicos dos quais seus usuários se beneficiarão. Também é importante considerar as limitações das interações de voz. Por exemplo, selecionar em uma longa lista de itens de menu é problemático com interações de voz. Uma boa regra é manter as escolhas curtas e diretas – 3 seleções no máximo. Se você achar que tem mais de 3, é melhor reformular o cenário.

3. Criar

Com protótipos de voz, é importante começar na prancheta. O primeiro passo é lidar com os fluxos de usuários de voz da sua experiência, que é a base para a qual toda a interação do usuário será mapeada.

Usar storyboards

Os storyboards visualizam interações e fluxos no contexto e os tornam mais realistas.

storyboard
Um storyboard que ilustra o fluxo. Imagem: BBC. (Visualização grande)

Escrever diálogos

Os diálogos são os blocos de construção dos fluxos de usuários de voz. Para cada cenário-chave que o aplicativo de voz oferecerá, comece a criar diálogos de conversação entre o usuário e o aplicativo. Esforce-se para tornar a interação com o aplicativo tão familiar quanto uma conversa regular com uma pessoa real. A conversação humana é complexa; muitas vezes tem muitas voltas e reviravoltas. Será importante levar isso em consideração ao trabalhar com seus cenários e escrever diálogos.

Algumas recomendações gerais para criar ótimos diálogos:

  • Reduza o número de etapas necessárias para concluir uma tarefa.
    Tente eliminar informações e perguntas desnecessárias sempre que possível. O design deve resolver o problema do usuário com o mínimo de etapas. Lembre-se de que quanto mais tempo levar para concluir a tarefa, menos agradável será a experiência. Ninguém gosta de produtos que consomem seu valioso tempo, e isso é especialmente verdadeiro para tarefas repetitivas. Seu aplicativo deve fornecer uma experiência de usuário agradável, seja a primeira vez que um usuário conclui a tarefa ou a 100ª vez este mês.
  • Não ensine “comandos”.
    Dado o quão difícil pode ser a descoberta na voz, alguns designers tentam ensinar comandos aos usuários para que eles saibam o que dizer. Não faça isso. O fraseado deve ser natural e intuitivo, para que os usuários saibam o que dizer em determinadas situações.
  • Seja breve com suas perguntas e respostas.
    É relativamente fácil sobrecarregar os usuários com muitas informações quando você usa frases longas. Tente simplificar as mensagens à sua essência sempre que possível. Os usuários desfrutam de informações concisas e bem definidas da VUI. Pense em quais informações são primárias e quais são secundárias. Siga o princípio do Máximo de Quantidade, que diz que um falante fornece ao ouvinte o máximo de informações necessárias para avançar o propósito percebido da interação, mas não demais.

Aqui está um diálogo que não segue o princípio do Máximo de Quantidade:

Usuário : “Onde é um bom lugar para comer pizza?”

Sistema : “Tenho cinco lugares para você. A primeira é “Pizza & Pasta” está localizada na 1300-1398 Diamond St San Francisco, a 15 minutos de você, aberta das 8h às 20h, a segunda é a “Itália”, localizada na 4100- 4148 20th St San Francisco, a 1 hora de distância de você, aberto das 9h às 18h,...”

O diálogo tenta apresentar todas as opções em um único turno. É melhor tentar diminuir a lista fazendo uma pergunta esclarecedora:

Usuário : “Onde é um bom lugar para comer pizza?”

Sistema : “Existem várias pizzarias na área – você gostaria de caminhar ou dirigir?”

Lidar com erros

Não importa quão boa seja sua VUI, uma coisa é certa: as coisas vão dar errado. E você precisa projetar para essas situações. A manipulação graciosa de erros é um dos maiores desafios que você enfrentará ao projetar para voz e é vital começar a pensar nisso no momento em que escreve seus diálogos.

Aqui estão alguns casos comuns que podem causar estados de erro:

  • Erros de ortografia
    Alguns usuários podem pronunciar palavras incorretamente e o sistema de processamento de linguagem natural não entenderá a solicitação.
  • Ambiguidade
    Mesmo entre humanos, a fala às vezes é ambígua. Por exemplo, alguém pode dizer “Bom” e isso pode ser definido como “Sim, concordo” ou apenas ser uma indicação de que está ouvindo.
  • Casos em que o sistema não consegue fornecer informações valiosas aos usuários . Por exemplo, o usuário deseja reservar um voo, mas o sistema não possui opções relevantes.

Em todos os casos, o diálogo não deve terminar em um beco sem saída; o sistema deve fornecer opções valiosas. Sempre tente colocar o diálogo de volta nos trilhos.

Vejamos o primeiro exemplo:

Usuário : “Reserve-me um voo de San Diego para Dallas na segunda-feira.”

Sistema : “Não encontrei nenhum voo de San Diego para Dallas na segunda-feira.”

É evidente que os usuários enfrentam um beco sem saída. No entanto, é relativamente fácil modificar a caixa de diálogo para fornecer algumas opções aos usuários:

Usuário : “Reserve-me um voo de San Diego para Dallas na segunda-feira.”

Sistema : “Não encontrei nenhum voo de San Diego para Dallas na segunda-feira. Você gostaria de procurar outra data?”

Outro exemplo de aplicativo de pedidos de comida:

Usuário : “Qual é o CEP para entrega?”

Sistema : “Hmm, 811415”

Usuário : “Este ZIP é inválido. Tente novamente."

Não apenas a palavra “inválido” é muito técnica, mas também não ajuda a colocar o usuário de volta nos trilhos. É melhor oferecer uma dica ao usuário para que ele entenda o que deve fazer em seguida:

Sistema : “Qual é o CEP para entrega?”

Usuário : “Hmm, 811415”

Sistema : “Este ZIP é mais longo do que o esperado. Deve ser cinco dígitos, não seis.”

Usuário : “81415”

Reflita sua identidade única

Todas as vozes projetam uma persona, quer você planeje uma ou não. Não deixe sua persona VUI ao acaso, reflita sua marca e identidade únicas nos diálogos que você escreve. Imagine como seu funcionário ideal deve interagir com os clientes e tente refletir isso nas palavras de seus diálogos.

O tom de voz tem impactos mensuráveis ​​nas percepções dos usuários sobre um produto. É por isso que é importante considerar as necessidades emocionais de seus usuários ao escolher um tom.

O tom de voz de um produto pode ser expresso em função das 4 dimensões de tom. Imagem: NNGroup. (Visualização grande)

Asse empatia nas interações

As interfaces de voz devem levar em consideração as emoções do usuário. As pessoas gostam não apenas de pessoas amigáveis, mas também de computadores amigáveis. Por exemplo, quando alguém deseja reservar uma passagem para um voo e fornece informações sobre uma viagem, o sistema pode responder 'Parece uma viagem divertida!' A resposta deve ser ligeiramente diferente a cada vez para evitar uma sensação de interação com uma máquina.

Confirmar quando uma tarefa foi concluída

É vital pensar em onde no fluxo da conversa os usuários precisam de confirmações. Normalmente, as pessoas esperam uma confirmação final no final de um diálogo. Por exemplo, quando um usuário agenda um evento, ele pode querer ouvir "O evento está na sua agenda agora". Outro cenário típico é um fluxo de checkout — informe ao usuário que a transação foi registrada com sucesso.

Use confirmação explícita para ações importantes e implícita para tarefas rotineiras. Por exemplo, se você pedir ao seu Alexa para enviar dinheiro para seu amigo, um usuário provavelmente quer ouvir “A [quantidade de dinheiro] foi enviada para [nome da pessoa]” em vez de apenas “OK”. Ao mesmo tempo, quando você pede ao Alexa para desligar as luzes de uma garagem, ouvir “As luzes da garagem estão apagadas” o tempo todo pode ser demais, portanto, certifique-se de testar as confirmações com cuidado para descobrir quais confirmações seus usuários sentir é fundamental para se sentir bem-sucedido com a VUI.

Contexto de Alavancagem

Um bom sistema de conversação acompanha o diálogo, memorizando todos os turnos anteriores e as interações anteriores. Um sistema sólido usará essas informações para criar uma experiência melhor para os usuários, oferecendo uma experiência mais personalizada.

Por exemplo, quando um usuário pede pizza, o sistema pode lembrá-lo do pedido anterior:

Usuário : “Quero pedir uma pizza.”

Sistema : “A última vez que você pediu Quattro Formaggio da Pizza & Pasta. Quer pedir de novo?”

Usuário : “Yay, eu faço!”

Frases alternativas de capa

As pessoas podem usar palavras diferentes para descrever a mesma coisa, e é vital levar esse momento em consideração ao projetar sua VUI. Para cada fluxo de usuário de voz que você projetou na etapa anterior, pense nas diferentes maneiras pelas quais os usuários podem formular essas solicitações. Considere variações de palavras e sinônimos que eles possam usar.

Dependendo dos recursos do seu produto de voz, o número de enunciados que os usuários podem vocalizar ao interagir com a VUI pode facilmente chegar às centenas, tornando a tarefa de mapeá-los realmente complexa. Felizmente, existem ferramentas especiais disponíveis para ajudá-lo com isso. Por exemplo, se você criar aplicativos para Alexa, poderá usar o Amazon Echo Utterance Expander para essa finalidade.

Teste seus diálogos

Agora que você tem todos os seus diálogos escritos, é hora de começar a testá-los. Por quê? Porque a forma como falamos é muito menos formal do que a forma como escrevemos. Para garantir que você crie diálogos que pareçam naturais, é vital testá-los antes de passar para a prototipagem. Duas técnicas simples irão ajudá-lo a fazer isso:

  • Grave e reproduza áudio com seus diálogos. Você ouvirá nuances de palavras e frases que simplesmente não são naturais.
  • Interprete as conversas para garantir que sejam naturais e intuitivas. Uma técnica chamada 'O Mágico de Oz' irá ajudá-lo a identificar rapidamente os problemas em seus diálogos. Se você é usuário de Mac, pode usar uma ferramenta chamada Say Wizard para facilitar as coisas.

Protótipo do seu aplicativo

Agora que escrevemos, mapeamos e testamos nossos diálogos, podemos finalmente passar a projetar e prototipar a experiência. O Adobe XD facilita para os designers criar um protótipo funcional para aplicativos da Amazon ou Google habilitados para voz e testá-lo com usuários reais. A ferramenta permite prototipar as entradas e saídas de voz reais para o aplicativo. Uma interação típica consiste na entrada do usuário e nas respostas do sistema:

  • Para projetar solicitações de usuários, precisamos criar acionadores de voz. Para adicionar um novo acionador de voz, arraste um conector de um elemento em uma prancheta para outra. Quando o menu de atributos for aberto, selecione Voice no menu Trigger e adicione seu enunciado no campo Command.
  • Speech Playback simulará a resposta do aplicativo de voz. Para adicionar a Reprodução de Fala, você precisa selecionar Tempo como o Trigger e definir a ação como Speech Playback .
Prototipagem com voz no Adobe XD

O Adobe XD permite que você crie protótipos de produtos que priorizam a voz, como o Amazon Echo Show, e produtos somente de voz, como o Google Home.

Por último, mas não menos importante, se você projetar o Amazon Alexa Skill para Amazon Echo Show ou Amazon Echo Spot, o XD fornecerá um kit VUI para esses dispositivos. Você pode baixá-lo aqui. Este kit VUI fornece todos os blocos de construção necessários para começar a criar uma habilidade do Alexa.

Kit VUI para Amazon Echo Show e Spot. (Visualização grande)

4. Teste

O teste é uma parte obrigatória do processo de design. Sem testes, você não pode dizer se seu aplicativo funcionará para seus usuários ou não.

Teste seus protótipos com usuários-alvo

Realize sessões de teste de usabilidade com representantes do seu público-alvo e observe como os usuários interagem com seu aplicativo. Acompanhe a taxa de conclusão de tarefas e CSAT (Customer Satisfaction Score). Se possível, tente gravar um vídeo para cada sessão.

Usar simuladores de teste

Tanto a Amazon quanto o Google fornecem ferramentas de teste que permitem testar sua habilidade ou ação na simulação dos dispositivos de hardware e suas configurações. Este teste lhe dará uma boa noção da experiência de voz no mundo real.

5. Refinar

Refine o aplicativo de voz após enviá-lo ao mercado.

Coletar análises

Depois de lançar seu aplicativo, você deve acompanhar como o aplicativo está sendo usado com análises. Aqui estão algumas das principais métricas a serem observadas:

  • Intenções e enunciados,
  • Métricas de engajamento do usuário,
  • Fluxos de comportamento.

A maioria das métricas necessárias você encontrará em sua conta de desenvolvedor Skill sem qualquer codificação adicional.

Conclusão

A interação humano-computador nunca foi sobre interfaces gráficas de usuário. Em primeiro lugar, sempre foi sobre comunicação. É evidente que a voz será uma maneira natural para a nova geração de usuários interagir com a tecnologia e, como designer, você deve estar pronto para esses novos desafios e as oportunidades que eles abrem para novas formas de ver o design de interação.

Este artigo faz parte da série de design UX patrocinada pela Adobe. A ferramenta Adobe XD é feita para um processo de design de UX rápido e fluido, pois permite que você vá da ideia ao protótipo mais rapidamente. Projete, prototipe e compartilhe - tudo em um aplicativo. Você pode conferir mais projetos inspiradores criados com o Adobe XD no Behance e também se inscrever no boletim informativo de design de experiência da Adobe para se manter atualizado e informado sobre as últimas tendências e insights para design de UX/UI.