A IA do Google, Gemini, já faz com que conversar com um assistente virtual pareça mais natural do que ao comandar o Google Assistant. Mas nada é perfeito, então sempre há espaço para melhorias. Gemini agora está recebendo algumas atualizações para melhorar sua qualidade de conversação.
Hoje, o Google anunciou que está lançando uma atualização para Gemini 2.5 Flash Native Audio para agentes de voz ao vivo. Para esta atualização, o Google se concentrou em três áreas principais:
- Chamada de função mais nítida: A confiabilidade foi melhorada ao acionar funções externas. Gemini agora pode identificar com mais precisão quando coletar informações em tempo real durante uma conversa. Ele pode então incluir perfeitamente esses dados em sua resposta de áudio, sem interromper o fluxo da conversa.
- Instrução a seguir: O modelo agora tem uma taxa de adesão de 90% às instruções do desenvolvedor, melhorando em relação aos 84% anteriores. Como resultado, ele pode lidar melhor com instruções complexas e fornecer resultados mais confiáveis.
- Conversas mais tranquilas: O Gemini 2.5 Flash Native Audio agora pode recuperar o contexto de pontos anteriores da conversa de forma mais eficaz, permitindo conversas mais coesas.
Além dessas melhorias, Josh Woodward, vice-presidente do Google Labs, Gemini e AI Studio, compartilhou duas outras melhorias. Uma melhoria faz com que o Gemini Live não interrompa você no meio da frase se você fizer uma pausa por muito tempo. O outro permite silenciar o microfone enquanto o Gemini Live está falando, para que você não o interrompa acidentalmente.
O Google afirma que esta atualização visa tornar o modelo melhor no manuseio de fluxos de trabalho complexos, na navegação pelas instruções do usuário e na manutenção de conversas que pareçam naturais. A atualização começou a ser implementada no Gemini Live, Search Live, Google AI Studio e Vertex AI. Além deste anúncio, o Google também anunciou algumas mudanças no aplicativo Tradutor.
