Google lança chat de IA com tecnologia de voz para as massas do Android
O logotipo do Google Gemini.
Ampliar / O logotipo do Google Gemini.

Google

Na quinta-feira, o Google fez Gêmeos ao vivoseu recurso de chatbot de IA baseado em voz, disponível gratuitamente para todos os usuários do Android. O recurso permite que os usuários interajam com o Gemini por meio de comandos de voz em seus dispositivos Android. Isso é notável porque o recurso Advanced Voice Mode do concorrente OpenAI do ChatGPT, que é semelhante ao Gemini Live, ainda não foi totalmente lançado.

O Google revelou o Gemini Live durante sua Evento de lançamento do Pixel 9 mês passado. Inicialmente, o recurso era exclusivo para assinantes Gemini Advanced, mas agora está acessível a qualquer um que use o aplicativo Gemini ou sua sobreposição no Android.

O Gemini Live permite que os usuários façam perguntas em voz alta e até interrompam as respostas da IA ​​no meio da frase. Os usuários podem escolher entre várias opções de voz para as respostas do Gemini, adicionando um nível de personalização à interação.

Gêmeos sugere os seguintes usos do modo de voz em seus documentos de ajuda oficiais:

Falar para frente e para trás: Fale com Gemini sem digitar, e ele responderá verbalmente.
Faça um brainstorming de ideias em voz alta: Peça uma ideia de presente, planeje um evento ou faça um plano de negócios.
Explorar: Descubra mais detalhes sobre tópicos do seu interesse.
Pratique em voz alta: Ensaie para momentos importantes de uma forma mais natural e coloquial.

Curiosamente, embora a OpenAI tenha demonstrado originalmente seu Modo de Voz Avançado em maio com o lançamento do GPT-4oele apenas enviou o recurso para um número limitado de usuários começando no final de julho. Alguns especialistas em IA especulam que uma implementação mais ampla foi dificultada pela falta de poder computacional disponível, já que o recurso de voz é presumivelmente muito intensivo em computação.

Para acessar o Gemini Live, os usuários podem tocar em um novo ícone de forma de onda no canto inferior direito do aplicativo ou sobreposição. Essa ação ativa o microfone, permitindo que os usuários façam perguntas verbalmente. A interface inclui opções para “segurar” a resposta do Gemini ou “encerrar” a conversa, dando aos usuários controle sobre o fluxo da interação.

Atualmente, o Gemini Live suporta apenas inglês, mas o Google anunciou planos para expandir o suporte a idiomas no futuro. A empresa também pretende levar o recurso para dispositivos iOS, embora nenhum cronograma específico tenha sido fornecido para essa expansão.

Fonte