omarsoncosta Publicado: 9 de novembro de 2017

Sua voz pode valer US$ 1 trilhão

Crédito: Jason Rosewell

(*) Omarson Costa em Nov/2017

Porque a Amazon e o Google talvez se tornem  as maiores operadoras de telecom do mundo?

US$ 1 trilhão. É a marca a ser batida. Qual será a primeira empresa a ultrapassar a casa dos 12 dígitos em valor de mercado? Esta é a pergunta que não quer calar e tem sido feita repetidamente pelos investidores e analistas financeiros com a rápida ascensão e consolidação nas últimas décadas das grandes de tecnologia como as maiores empresas do mundo, desbancando a soberania que parecia imbatível da indústria petrolífera.

Agora responda rápido: qual será o fator preponderante que irá definir nos próximos anos o vencedor desta corrida? Resposta: a sua voz. Mas, pasmem leitores, não são as operadoras de telecom que irão romper a barreira do trilhão, mesmo sendo elas que processam há anos o maior volume de tráfego em voz.

Tráfego, vale sublinhar, é a definição dada pelas operadoras. As empresas de software têm uma denominação diferente: “volume de dados de voz”. E o motivo é simples. Elas transformam sua voz em dados, que, cada vez mais, são matérias primas essenciais para estruturar e monetizar negócios em diversos setores. Ao final do dia, dados se traduzem em software. Como disse Marc Andreessen em 2011, “software is eating the world”.

A informação (transmitida também por sua voz) é o novo petróleo.

Por isso, elementar, as principais candidatas ao trilhão são todas do setor de tecnologia e ocupam o topo da lista em valores de mercado(1), segundo o ranking da S&P 500 – Apple (US$ 873,1 bilhões), Alphabet (Google) (US$ 715,8 bilhões), Microsoft (US$ 640,7 bilhões), Amazon (US$ 531 bilhões) e Facebook (US$ 522,9 bilhões).

Não chega a ser surpresa, a soma do “valuation” das empresas de tecnologia da informação já representa nada menos que 24,5% entre as 500 maiores do mundo. Em comum, todas as top 5 (e nenhuma delas é uma operadora) estão neste momento travando uma batalha nada silenciosa para dominar a próxima plataforma que se tornará a chave para conquistar market share no futuro nada longínquo da Internet das Coisas. E, não tenham dúvidas, ela será a VUI – Voice User Interface.

Basicamente, qualquer coisa poderá estar conectada na Web para receber e obedecer seus comandos de voz – seu carro, sua casa, seus eletrodomésticos e, você ainda vai ter um, seu robô. E é por isso que te OUVIR nunca foi tão importante e será tão determinante nesta nova revolução já em curso.

Até aqui, a interface predominante foi a gráfica, inventada pela Xerox na década de 70, aprimorada pela Apple nos anos 80 com o lançamento do Macintosh e popularizada pela Microsoft com o Windows nos anos 90. A partir de agora, é a vez da voz.

Foi a transformação das linhas de código em ícones e janelas, mais compreensíveis pelos mortais que nunca aprenderam programação, que levaram Steve Jobs e Bill Gates e suas empresas ao estrelato. Suas invenções permitiram a explosão nas vendas de computadores de mesa e criaram o grande universo de usuários que, tempos depois, se conectaram em rede e nunca mais largaram o mouse.

No auge, em 27 de dezembro de 1999, o valuation da Microsoft atingiu o recorde de US$ 613 bilhões (ou US$ 873 bilhões em valores atualizados, coincidentemente o mesmo valor de mercado atual da maçã arqui-inimiga). Se tomou uma rasteira do Windows, a Apple deu o troco com o touchscreen, que fez do iPhone um produto ícone, símbolo do novo milênio e um precursor seguido por todas as fabricantes de smartphones e tablets.

A invenção da interface por toque na tela abriu um novo mercado (de telefones inteligentes e tablets) e a Web foi parar nos bolsos, ao alcance dos dedos, a qualquer hora e lugar, trazendo bilhões de novos usuários (consumidores) para o mundo digital. Olhos grudados nas telas, não sabemos mais como (sobre)viver sem nossos apps e nos tornamos dependentes dos mobile devices para as tarefas mais rotineiras e, nunca é demais lembrar, para comunicação.

Darwinianamente nos adaptamos aos pequenos teclados QWERT e nunca uma geração escreveu e leu tanto – o WhatsApp divulga 1 bilhão de usuários únicos trocando mensagens todos os dias e já há apps disponíveis que transformam voz em texto em telefones Android e iOS.

As mensagens de texto e os comandos por cliques ainda serão, por algum tempo, nosso principal meio de comunicação e de interface com as máquinas. Mas a transição para voz será rápida e sem volta. O motivo? É muito mais fácil falar do que teclar. É muito mais ‘humano’. E criar interfaces mais ‘humanas’ é o que hoje tira o sono das top 5 da tecnologia. Elas sabem que quem primeiro conseguir ouvir sua voz, compreender o que você diz e responder aos seus anseios será a primeira empresa trilhardária.

E agora? Quem estará mais preparado para ouvir sua voz?

Os robôs domésticos serão apenas mais um dos dispositivos conectados que estarão prontos para te ouvir e brigar pela atenção da sua voz. O mercado de voicebots é só a ponta do iceberg do que virá por aí. A VUI já está embarcada em smartphones, em laptops, em carros, em headphones (o Google acaba de lançar um que faz tradução simultânea em 40 línguas) e em muitas outras coisas que chegarão nas prateleiras nos próximos anos.

As top 5 dos Estados Unidos (FAAMG) estão todas neste jogo – o Facebook com o Messenger, a Amazon com o Alexa, a Apple com o Siri, a Microsoft com o Cortana e a Alphabet/Google com o Google Now,. Também estão nesta disputa ao menos outros três players importantes: a Samsung com o Bixby, a IBM com o Watson e o buscador chinês Baidu (um mercado com bilhões de usuários) com o DuEr.

A voz começou a falar mais alto com a evolução da Inteligência Artificial e, mais especificamente, do deep learning, que permite ensinar as máquinas a entender, processar e aprender a realizar funções a partir da integração com uma grande base de dados.

Todas as postulantes ao trilhão querem te ouvir simplesmente porque sua voz diz muito a seu respeito – que músicas mais pede para tocar, o que costuma jantar aos sábados ou que notícias são do seu interesse. E quanto mais sabem sobre você, mais conseguirão sua fidelidade (e seu bolso) como consumidor.

As previsões para o mercado de voz são animadoras. De acordo com levantamento do Gartner, em 2021 o mercado de devices dotados de tecnologia de reconhecimento de voz será de US$ 3,5 bilhões. O mesmo estudo indica que os varejistas que investirem em sistemas de busca por voz, ainda incipientes, poderão ter aumento de 30% nas vendas online. É um crescimento de receita considerável e que certamente não será ignorado pelos lojistas. Resta saber qual plataforma irão escolher para conversar com seus consumidores.

Outra pesquisa da Strategy Analytics prevê que este ano serão vendidos 24 milhões de voicebots (smart speakers) com a empresa de Jeff Bezos na liderança com seu personal assistant Amazon Echo (65% das vendas), seguida pelo Google Home (18%). Com isso, a Amazon irá terminar o ano com 71% da base instalada de voicebots e o Google com 15%, restando menos de 14% para todas as demais marcas.

Não deixa de ser um indicativo de quem está na dianteira do mercado de voz. Amazon e Google, vale registrar, foram as duas primeiras a lançar a funcionalidade de reconhecimento de múltiplas vozes, permitindo que vários usuários conversem com o Echo e o Home e criem perfis individuais.

Com isso, os assistentes poderão, por exemplo, personalizar informações para cada usuário e, óbvio, identificar as particularidades de comportamento de consumo, sugerir produtos ou informar como está o trânsito no caminho do trabalho para cada um deles. Será, também, o fim das senhas para acessar lojas e fechar o carrinho de compras.

Como o marketing e as marcas serão impactados? Sua agência ou sua marca já possuem “especialistas em voz”? Qual será o modelo de negócio para as marcas interagirem com seus consumidores nestes dispositivos?

Mas se a líder em vendas de assistentes pessoais é a Amazon, o Google, em contrapartida, é quem mais tem evoluído no campo da inteligência artificial. Um estudo realizado pelos cientistas Feng Lui, Yong Shi e Ying Liu concluiu que em dois anos, entre 2014 e 1016, a Google AI alcançou um incremento de 78%. Será que o fato da IA do Google aprender tão rápido se deve ao fato de ter seu sistema operacional rodando em aproximadamente 80% dos smartphones? Provavelmente.

O estudo busca determinar qual o Q.I. de sistemas de inteligência artificial fazendo comparações entre Google Brain, Baidu Brain, Bing (Microsoft), Siri (Apple) e outros. Os resultados mostraram que o Google Brain tem o sistema mais sofisticado com um QI de 47,28 (uma criança de 6 anos tem QI de 55.5) e o Siri tem metade do QI do Google.

As aplicações para voz são infinitas e várias indústrias serão impactadas.

Quer um carro que te escute? O setor automotivo é um dos que certamente passará por uma grande reviravolta com a voz se tornando a interface mais usada. Através do Nissan Connect Services, a montadora japonesa é a mais nova a colocar no mercado um automóvel que você pode ‘conversar’ com ele através do Alexa, da Amazon, para dar partida, abrir e fechar as portas, acender os faróis, regular o ar condicionado ou tocar a buzina.

Em meu último artigo sobre energia limpa, comentei que a interface de um automóvel dotado de todas estas tecnologias e sem motorista talvez será mais parecida com uma sala de estar do que com o automóvel inventado por Henry Ford (mesma analogia da capa da revista Veja de 01/11/2017).

Na mesma estrada, Hyundai, Mercedes-Benz, Ford, BMW e SEAT também fecharam acordo com a Amazon para integrar sua plataforma de voz ao cockpit. Elas prometem transformar o Amazon Echo em um voicebot “dirigível”, disponível para realizar seus desejos, como fazer compras na Amazon ou pagar suas contas no banco digital enquanto está no engarrafamento a caminho de casa.

O varejo é outro segmento que nunca mais será o mesmo. A Amazon já integrou o Echo ao seu marketplace e basta pedir em alto e bom som o que quer para receber as compras em casa. Através do serviço Google Express, já é possível também fazer compras falando com o Google Home na rede Target e em breve em mais de 50 varejistas por smartphones Android e iOS. Não vai demorar muito para que possa fechar seu pedido diretamente pela TV ou pela própria geladeira.

Para quem gosta do mundo fashion, a Amazon já lançou também o Echo Look (preço de US$ 199,00), que irá mudar completamente a indústria da moda. Você tira suas fotos em frente ao equipamento usando basicamente sua voz e pede auxílio do ‘style check’, que avalia sua roupa e a compara com os padrões da moda (cores, estilos etc). Dá pra imaginar a escala de poder que a Amazon tem se esta tecnologia tornar-se um padrão? Não preciso saber qual o melhor tênis. Preciso apenas perguntar para Alexa. Aliás, a moda passará a ser ditada pela Alexa.

Quanto maior o uso da VUI em “coisas conectadas”, maior será o valor de mercado das gigantes da tecnologia. Elas provavelmente se tornarão as maiores empresas de dados de voz (não de tráfego de voz) do planeta. Seu desejo é uma ordem e sua voz está no comando. É você quem irá dizer quem será a empresa do trilhão.

Só nos resta torcer para que os bots não comecem a inventar suas próprias linguagens, incompreensíveis para nós, pobres humanos, como já aconteceu em uma experiência do Facebook. Caso contrário, poderemos viver um cenário do filme “O Exterminador do Futuro”, estrelado por Arnold Schwarzenegger.


Este é meu último artigo do ano. Obrigado aos que têm me acompanhado nesta jornada até aqui. Minha intenção não é, longe disso, ser assertivo em minhas colocações, mas sim convocar reflexões e abrir espaço ao debate. Sou apaixonado pela tecnologia e todas as transformações que ela já está e continuará promovendo no futuro. Sua opinião e crítica construtivas são sempre bem-vindas.

(*) Omarson Costa é formado em Análise de Sistemas e Marketing, tem MBA e especialização em Direito em Telecomunicações. Em sua carreira, registra passagens em empresas de telecom, meios de pagamento e Internet.