Ryan Haines / Autoridade Android
Tl; Dr
- Na versão beta mais recente do aplicativo Gemini Android, vimos uma opção para anexar arquivos de áudio, como MP3s, para bate -papos.
- Um prompt de “conversa ao vivo sobre isso” também aparece, mas o áudio ainda não está processado com precisão.
- Embora o recurso possa não estar totalmente operacional, sabemos que Gemini pode compreender o áudio.
Já desejou que você pudesse jogar um MP3 em Gemini e explicar o que se trata? Isso pode estar em breve, pois vimos sinais iniciais de suporte a arquivos de áudio no aplicativo Gemini para Android.
⚠️ Um Apk desmontagem Ajuda a prever recursos que possam chegar a um serviço no futuro com base no código de trabalho em andamento. No entanto, é possível que esses recursos previstos não cheguem a um lançamento público.
Na versão 16.30.59.SA.Arm64 do Google App Beta, conseguimos ativar um novo recurso de anexo de arquivo ao conversar com Gemini. Agora você pode anexar arquivos de áudio como MP3s e, quando o fizer, Gêmeos mostra uma nova sugestão: “Converse ao vivo sobre isso”. Isso parece promissor, mas ainda não funciona.
Depois de fazer upload de um arquivo de áudio, você pode digitar uma pergunta regular ou optar por “conversar ao vivo” sobre isso. Nos dois casos, Gemini parece não entender ou responder ao arquivo de maneira significativa. Às vezes, ignora completamente o áudio. Outras vezes, ele constitui com confiança, como visto na terceira captura de tela abaixo, mas as alucinações de chatbot não são exclusivas de arquivos de áudio ou Gemini.
Ainda assim, não é difícil ver para onde isso está indo. No lado do desenvolvedor, Gemini já suporta a entrada de áudio através da API. Você pode alimentá -lo em áudio e pedir para descrever o que ele ouve, resumir ou transcrever o que está sendo dito. Ele até lida com solicitações de registro de data e hora como “de 2:30 às 3:29” e trabalha com formatos como MP3, WAV e FLAC.
É provável que o Google esteja aumentando no aplicativo Android – ainda não estamos lá. Por enquanto, é mais como um espaço reservado do que um recurso final, e também não há garantia quando ou se for lançado. No entanto, com os uploads de imagens agora amplamente disponíveis no aplicativo Gemini, o suporte de áudio parece uma próxima etapa lógica.
Obrigado por fazer parte da nossa comunidade. Leia nossa política de comentários antes de postar.

