Artigos

Fala que eu te escuto

Comando de voz é expoente da nova internet

Já se perguntou por que as principais empresas de tecnologia do mundo têm investido pesado investindo em comando de voz e alto-falantes inteligentes?

A maioria das pessoas, em algum momento da vida, provavelmente já utilizaram a fala para executar ao menos uma tarefa no seu smartphone. Entretanto, boa parte delas talvez não esteja acompanhando o crescimento dessa área.

Os recursos digitais estão moldando o nosso estilo de vida — a forma como as organizações dialogam com seus clientes, as interações cotidianas entre os ambientes físicos e virtuais. Mas os assistentes de voz prometem elevar essa transformação para outro nível.

O comando de voz vive um de seus melhores momentos

Antes de analisarmos o cenário atual do recurso de comando de voz, é importante entender a sua linha do tempo — qual a origem do sistema, qual o processo evolutivo que ele passou até chegar nos dias atuais, bem como as perspectivas para o futuro.

A ferramenta foi introduzida na década de 1960, pela empresa IBM, que implementou o assistente de voz Shoebox no seu dispositivo. Era algo totalmente primitivo, que compreendia 16 palavras e 9 dígitos, porém, uma peça fundamental para criar insights do que viria depois.

A partir daí, os assistentes de comando de voz foram disponibilizados para os consumidores. Em 1972, a Universidade Carnegie Mellon, Pensilvânia, Estados Unidos finalizou o Harpy Program, com a capacidade de entendimento de 1000 palavras.

Algumas décadas mais tarde, a Dragon lançou o primeiro software capaz de fazer o reconhecimento de fala e transcrição de voz.

Embora nunca tenha sido popular, o Clippy, assistente virtual baseado em texto da Microsoft, mostrou como a linguagem natural pode ser rastreada, interpretada e usada como base para feedbacks interativos.

O Clippy também ensinou algumas lições sobre o que não fazer ao criar assistentes virtuais. Em suma: eles só devem ouvir quando explicitamente solicitados.

Fora do ambiente empresarial, o reconhecimento de voz apenas se tornou comum depois que a Apple lançou seu assistente de voz baseado em telefone, a Siri, em 2011.

A tecnologia continuou evoluindo e, hoje, temos poderosas ferramentas de comando de voz funcionando muito bem no processo de interação com o público. Sendo as principais delas:

  • Alexa, da Amazon;
  • Siri, da Apple;
  • Cortana, da Microsoft;
  • Assistente Virtual, do Google.

Por que tantas pessoas amam comando de voz?

De forma resumida, as pessoas amam o comando de voz porque são sistemas que garantem praticidade no seu dia a dia, o que vai de encontro à expectativa por inovações que tornarão a sua vida mais fácil, melhor e com interações mais ricas.

Quando o assunto é comando de voz, os adolescentes correspondem à parcela da população que mais está habituada e propensa ao uso dessa funcionalidade para realizar tarefas on-line regulares.

A probabilidade de um jovem usar assistentes de comando por voz durante o processo de compra, por exemplo, é muito mais comum que pessoas em um estágio de vida mais maduro. Isso talvez se explique pelo fato de que essa geração já nasceu em uma era de tecnologias avançadas.

Um estudo do Google Mobile Voice de 2014 mostrou que 55% dos adolescentes usam a pesquisa por voz pelo menos uma vez por dia e 89% concordam que os assistentes pessoais são o futuro. Mas, ao contrário do que muitos podem imaginar, o comando de voz está ganhando adeptos em todas as faixas etárias. 

Levantamentos recentes do Google revelam um panorama que, atualmente, cerca de 20% de todas as consultas são pesquisas por voz em dispositivos móveis — e esse número está crescendo. 

Segundo informações da MindMeld, fornecedora do assistente de voz do Google, em dezembro de 2015, mais de 40% dos entrevistados começaram a fazer buscas com voz nos 6 meses anteriores à pesquisa. Outras projeções mostram um aumento para 50% desse tipo de consulta até 2020.

Diante dessa aceitação do público, podemos dizer que o comando de voz é uma tendência que veio para ficar e que o comércio contextual não desaparecerá tão cedo.

Com a chegada da realidade aumentada e a realidade virtual ao mercado, o comércio eletrônico terá que moldar a sua estrutura de funcionamento para continuar criando experiências diferenciadas ao seu público.

O desafio desse novo cenário digital é grande, mas também existem oportunidades para que as empresas façam com que as compras sejam mais fáceis e que as mãos livres funcionem a seu favor.

Empresas investem pesado na tecnologia

Com a nova perspectiva de serviços habilitados para Inteligência Artificial, há uma necessidade das gigantes da tecnologia reformularem suas as atividades — melhorando os efeitos de comunicação, gerenciamento de tarefas, produtividade do trabalho e navegação on-line — tudo focado no voice first.

Ao fornecer informações ricas e corretas em tempo real, as versões mais modernas dos assistentes digitais ativados por voz são capazes de alterar o curso de nossas interações diárias com dispositivos móveis, e geram um fluxo de informações instantâneas entregues com um processo inteligente.

Ter um bot ativado por voz também significa utilizar um sistema com excelentes recursos de dados que fornecem referências confiáveis ​​aos clientes em todas as interações possíveis. 

A tecnologia de bot de bate-papo por voz da AI também traz uma solução integrada que ajuda a melhorar a experiência do cliente, isso é devido ao fato de estabelecer uma conexão perfeita entre o consumidor final e os recursos oferecidos.

Adequar-se à nova realidade e oferecer diferenciais para o mercado é uma questão de sobrevivência para quem atua nessa área, sobretudo com a velocidade que as inovações acontecem.

Google Assistente não tem nome, mas tem poder

Embora comando de voz do Google não receba um nome específico como os sistema das outras empresas — Siri (Apple), Alexa (Amazon), Cortana (Microsoft) —, o software já mostrou que tem muito poder. Atualmente, esse é o assistente de voz utilizado com mais frequência.

Para tornar a experiência dos seus usuários ainda mais completa, a empresa anunciou o lançamento do recurso Your News Update, que funcionará como apresentador de notícias nos dispositivos conectados à ferramenta.

No entanto, o destaque desse programa não para por aí. O Google Assistente oferecerá notícias veiculadas por parceiros da marca, como: 

  • CNN; 
  • Fox News; 
  • CBS.

Graças à Inteligência Artificial, um histórico de preferências é construído de acordo com as escolhas, localização e interesses de cada pessoa. Assim, se um usuário faz muitas pesquisas sobre o universo da tecnologia, o Google Assistente vai personalizar suas ofertas com base nessa característica. 

Como se trata de algo muito recente, em princípio o recurso está disponível apenas no idioma inglês, nos Estados Unidos. Porém, em breve será expandido internacionalmente.

Siri e o ecossistema da Apple

A Siri, assistente de voz do ecossistema Apple, é um recurso bastante conhecido, pelo menos entre os usuários da marca. No entanto, com o lançamento do novo sistema operacional, o iOS 13, a ferramenta trouxe inovações significativas.

Agora, ela oferecerá sugestões personalizadas no Safari, Maps, Podcasts e Música. Além de poder reproduzir podcasts, ela também toca audiolivros e rádio com aplicativos de terceiros.

A versão mais recente da Siri apresenta opções aprimoradas para detectar se os usuários são multilíngues. Além do mais, uma nova voz com sotaque de inglês indiano foram incorporados a fim de agradar aos usuários subcontinentais da Apple.

A comunicação com outros produtos da companhia, como HomePod e Apple Watch, tende a ficar cada vez mais forte.

Cortana e Alexa querem ser mais brasileiras

A Inteligência Artificial como comando de voz não é novidade entre os brasileiros. Quem nunca recorreu à Siri para tirar alguma dúvida, ou ditou uma pesquisa para o Google Assistente? Pois bem, não é de hoje que alguns dispositivos já reconhecem e executam esse tipo de ação.

O que há de novo nesse cenário é que a tecnologia está se expandindo para gerar o máximo de praticidade, com o uso de outras ferramentas além dos smartphones.

A ideia é, por exemplo, comandar algumas tarefas domésticas por meio da voz — acenda as luzes, desligue a TV, verifique os compromissos da minha agenda para hoje. Enfim, o uso da fala como elemento de integração entre mundo físico e virtual é uma tendência que já faz parte do nosso cotidiano.

Nesse contexto, um dos principais obstáculos das gigantes que trabalham com a tecnologia, a exemplo da Amazon, Apple, Google e Microsoft é atender aos seus usuários com o maior grau de personalização.

Isso significa que para cada região é preciso ter um alinhamento com a cultura local. Assim, no Japão e na Inglaterra a Alexa apresenta uma postura mais formal, ao passo que para fazer sucesso entre os brasileiros a Amazon investe em uma postura mais descontraída.

O futuro da relação entre Inteligência Artificial e seres humanos é proporcionar uma interação mais humanizada, na qual as pessoas não sintam que estão conversando com um robô.

No mercado brasileiro, a disputa é bastante acirrada, apesar de o Google Assistente ter o nosso português como segunda língua mais popular e já ter clientes utilizando suas caixas Google Home e Home Mini que falam o idioma nativo. Alexa e Cortana também estão investindo pesado para se adequar ao perfil de consumidor desse mercado. 

A Amazon, inclusive, criou duas línguas para o seu assistente de voz atuar no Brasil: o português brasileiro e o brazilian english, tendo em vista que usamos algumas palavras em inglês, porém com um sotaque próprio.

Disrupção e comando de voz

Criar dispositivos e aplicações capazes de interagir por meio da fala já representou a quebra de barreiras inimagináveis no nosso sistema de comunicação. No entanto, o que temos hoje ainda tem grande potencial para evoluir. Por isso as empresas têm investido tanto no segmento.

Em um futuro próximo, veremos assistentes de voz surgindo em todos os lugares — as pessoas vão conversar com suas casas, carros e inúmeros outros objetos, com um alto nível de inteligência e personalização.

Na próxima década, espera-se que as aplicações baseadas no diálogo tenham a capacidade significativa de aprendizado; sofisticando seu conhecimento à medida que interagem com o usuário.

A tendência é que haja melhorias na usabilidade e design da interface de voz, sempre se prezando pela eficiência e flexibilidade, requisitos indispensáveis no aprimoramento dos assistentes de voz. Ademais, espera-se que dispositivos comuns suportem perfis de usuários exclusivos.

Alexa, Siri, Cortana, Google Assistente: vocês estão me ouvindo?

Apesar de todas as facilidades proporcionadas por uma interface de voz, a preocupação com a segurança e sigilo de dados também é algo bastante recorrente. Em especial quando o uso da ferramenta é feito para o acesso de serviços importantes, como bancos e compras de um modo geral.

Normalmente, para executar esse tipo de ação é preciso concluir um processo de autenticação. Se a Alexa comprou da conta associada à Amazon, ativada por padrão, teoricamente esse consumidor já está cadastrado e com capacidade de realizar compras. 

Porém, qual a garantia de que o sistema, apenas pela voz, reconhecerá a pessoa certa? Para campos em que o posicionamento do microfone está distante, por exemplo, o processo de reconhecimento e fiscalização da voz pode ser prejudicado.

Esse tipo de operação ainda parece ser um pouco frágil e ainda gera insegurança por parte dos clientes. Além disso, o fato de a Alexa e demais assistentes usarem o histórico de solicitações também nos faz questionar que outros dados podem ser capturados de nossos dispositivos.

Como solução mais provável, alguns apontam na autenticação de voz nos moldes da biometria. Porém, infelizmente, as ferramentas biométricas de voz parecem insustentáveis ​​como uma solução individual. Até porque, como existem softwares de manipulação de fotos, o mesmo pode acontecer com um programa para edição de áudio. 

A tecnologia avança em ritmo acelerado, e isso faz com que os produtos se tornam muito mais intuitivos, fáceis de usar e agreguem diversas funcionalidades no dia a dia dos seus usuários. Com o comando de voz, isso não é diferente — embora ainda haja muitos pontos para evoluir, as pessoas já estão bem íntimas desse recurso e provavelmente vão responder de forma positiva ao que ainda está por vir.

Após conhecer o cenário atual da tecnologia de comando de voz e como as marcas estão lidando com essa ferramenta para gerar experiências únicas ao seu público-alvo, aprofunde os seus conhecimentos sobre como a experiência criativa influencia na evolução do customer experience.

Publicações relacionadas
Artigos

O líder que não continua a aprender está fadado a fracassar

Artigos

Metas da ONU continuam a ser uma preocupação de grandes empresas

Artigos

Comunidade LGBTQ+ sabe o que quer das marcas e também sabe cobrar

Artigos

No meio do caminho tinha uma loja