Desde que o Gemini Live ficou disponível para mim no meu Pixel 8 Pro no final da semana passada, eu me peguei usando-o com muita frequência. Não porque seja a última e mais quente tendência, não, mas porque quase tudo que eu odiava em falar com o Google Assistente não é mais um problema com o Gemini Live. A diferença é impressionante.
Tenho muito a dizer sobre o assunto, mas hoje quero me concentrar em alguns aspectos que tornam a conversa com o Gemini Live uma experiência muito melhor em comparação ao uso do Google Assistente ou do Gemini comum.
Mas tenha em mente que se você comprou um telefone Pixel 9 Pro, você ganhará um ano inteiro do Google AI Premium gratuitamente, o que permite que você experimente o Gemini Live sem assinar.
Você já experimentou o Gemini Live?
1 votos
1. Gemini Live me entende, a maneira como falo
Rita El Khoury / Autoridade Android
Inglês é apenas minha terceira língua e, embora eu fale há décadas, ainda não é a língua mais natural para mim usar. Além disso, tenho o tipo de cérebro que dispara para todo lado. Então, toda vez que eu queria acionar o Google Assistente, eu tinha que pensar no frase ou pergunta exata antes de dizer, “Hey Google.” Por essa razão, e somente por essa razão, falar com o Assistente nunca pareceu natural para mim. É sempre premeditado, e sempre requer que eu pause o que estou fazendo e dê a isso minha total atenção.
O Google Assistente quer que eu fale como um robô para se encaixar em seu molde. O Gemini Live me deixa falar como eu quiser.
O Gemini Live entende a fala humana natural. Para mim, ele funciona em torno das idiossincrasias da minha própria fala, então posso começar a falar sem pensar ou preparar minha pergunta completa de antemão. Posso dizer “uhm” e “ah” no meio da frase, repetir, virar a pergunta principal e descobrir as coisas enquanto falo, e o Live ainda entenderá tudo isso.
Posso até fazer várias perguntas e ser o mais vago ou preciso possível. Não há realmente nenhuma restrição sobre como falar ou o que dizer, nenhum comando específico, nenhuma maneira específica de formular perguntas — simplesmente nenhuma restrição. Isso muda completamente a usabilidade dos chatbots de IA para mim.
2. É assim que conversas reais e contínuas devem ser
Rita El Khoury / Autoridade Android
O Google Assistente adicionou uma configuração para Conversas Contínuas há muitos anos, mas isso nunca pareceu natural ou tão contínuo. Eu dizia “Ok Google”, pedia algo, esperava pela resposta completa, esperava um segundo extra para que ele começasse a ouvir novamente e então dizia meu segundo comando. Se eu ficasse em silêncio por alguns segundos, a conversa terminava e eu tinha que reativar o Assistente novamente.
Além disso, o Assistant trata cada comando separadamente. Não há uma sensação real de “bate-papo”, apenas uma série de perguntas ou comandos e respostas independentes.
Interrupções, correções, esclarecimentos, continuidade de ideias, mudanças de tópicos — o Gemini Live cuida de tudo isso.
O Gemini Live funciona de forma diferente. Cada sessão é uma conversa realmente aberta, onde posso falar de um lado para o outro por um tempo, e ele ainda se lembra de tudo o que aconteceu antes. Então, se eu disser que gosto de Happy Endings e pedir recomendações de programas de TV semelhantes, posso ouvir, fazer mais perguntas, e ele manterá em mente minha preferência por programas semelhantes a Happy Endings.
Também posso interrompê-lo a qualquer momento e corrigi-lo se ele me entendeu mal ou se a resposta não me satisfizer. Não preciso gritar manualmente para ele parar ou esperar que ele continue falando por dois minutos com uma resposta errada. Também posso mudar o tópico da conversa em um instante ou dar perguntas mais precisas, se necessário.
Além disso, o Gemini Live não desliga nosso chat após alguns segundos de silêncio. Então, posso levar alguns segundos para assimilar adequadamente a resposta e pensar em outros esclarecimentos ou perguntas para fazer, sabe, como um humano normal, em vez de um robô que tem os acompanhamentos prontos em um segundo.
Melhor ainda, posso minimizar o Live e usar outros aplicativos enquanto ainda mantenho o chat. Descobri isso excelente enquanto navego ou converso com amigos. Posso invocar o Live no meio da navegação para fazer perguntas e obter esclarecimentos sobre o que estou lendo, ou iniciar um chat regular do Live e abrir um navegador para verificar novamente o que o Gemini está me dizendo.
3. TL;DR? Peça um resumo
Rita El Khoury / Autoridade Android
Como mencionei antes, cada comando é uma instância separada para o Google Assistant. O Gemini Live considera um chat inteiro como uma entidade, o que me permite fazer algo que eu nunca conseguiria fazer com o Assistant: pedir um resumo.
Então, se eu tivesse um bate-papo sobre lugares para correr em Paris e testar o novo modo Panorama na série Pixel 9, eu poderia pedir um resumo no final, e ele listaria todos eles. Isso é incrivelmente útil ao tentar entender tópicos complexos ou obter uma lista de sugestões, por exemplo.
4. Quer falar mais sobre um tópico específico? Retomar um chat mais antigo
Rita El Khoury / Autoridade Android
Em um ponto, eu abri o Gemini Live e disse algo como, “Ei, podemos continuar nosso bate-papo sobre fotos panorâmicas de Paris?” E ele disse sim. Eu fiquei um pouco chocado. Então eu continuei, e ele pareceu realmente saber onde paramos. Eu tentei isso de novo algumas vezes, e funcionou todas as vezes. O Google Assistente simplesmente não tem nada parecido com isso.
Outra maneira de acionar isso de forma mais confiável é abrir o Gemini, expandir o aplicativo Gemini completo e tocar em Recente e abra um chat anterior. Tocar no ícone Gemini Live no canto inferior direito aqui permite que você continue um chat existente como se nunca o tivesse parado ou saído dele.
5. Verifique os chats mais antigos e compartilhe-os no Drive ou no Gmail
Rita El Khoury / Autoridade Android
Ver meu histórico do Google Assistente sempre foi um processo complicado que exigia acessar minha conta do Google, encontrar meu histórico pessoal e verificar os últimos comandos que fiz.
Com o Gemini, é muito fácil abrir chats anteriores do Live e ler tudo o que foi dito neles. Melhor ainda, cada chat pode ser renomeado, fixado no topo ou excluído por completo. Além disso, cada resposta pode ser copiada, compartilhada ou exportada rapidamente para o Google Docs ou Gmail. Isso facilita o gerenciamento dos meus dados do Gemini Live, a exclusão do que precisa ser excluído e o compartilhamento ou salvamento do que me interessa.
O Google Assistente ainda tem uma vantagem (significativa)
Rita El Khoury / Autoridade Android
Apesar de tudo que o Gemini Live faz bem, há muitos casos em que senti suas limitações ao usá-lo. Por um lado, a sessão Live é separada da experiência principal do Gemini, e o Live trata apenas de questões de conhecimento geral, não de dados pessoais. Então, posso perguntar ao Gemini (não ao Live) sobre meu calendário, enviar mensagens com ele, iniciar cronômetros, verificar meus documentos do Drive, controlar minha casa inteligente e muito mais, assim como eu poderia com o Assistente, mas não posso fazer nada disso com o Gemini Live. Este último é mais uma experiência animada de Pesquisa do Google e todas as extensões regulares do Gemini não estão acessíveis no Live. O Google disse que estava trabalhando para trazê-las, no entanto, e essa é a perspectiva mais empolgante para mim.
O Gemini Live ainda não tem acesso a dados pessoais, calendários, casa inteligente, serviços de música, etc…
Por causa de como ele é construído e o que ele faz atualmente, o Gemini Live requer uma conexão constante com a internet e não há nada que você possa fazer sem ela. O Assistant é capaz de lidar com alguns comandos locais básicos, como controles de dispositivos, temporizadores e alarmes, mas o Gemini Live não.
E por enquanto, minha experiência com vários idiomas no suporte do Gemini Live tem sido duvidosa na melhor das hipóteses — não que o suporte do Assistente para vários idiomas seja estelar, mas funciona. No meu telefone, que está definido para inglês (EUA), o Gemini Live me entende apenas quando falo em inglês. Posso dizer para ele responder em francês, e ele atenderá, mas ele não me entenderá nem reconhecerá minhas palavras se eu começar a falar francês. Espero que o Google traga uma experiência multilíngue mais natural para ele, porque isso pode mudar a vida de alguém como eu, que pensa e fala em três idiomas ao mesmo tempo.
Rita El Khoury / Autoridade Android
Logisticamente, meu maior problema com o Gemini Live é que ainda não consigo controlá-lo por voz. Meu comando “Hey Google” abre a interface principal de comando de voz do Gemini, o que é legal, mas preciso tocar manualmente no botão Live para acionar um bate-papo. E quando termino de falar, o bate-papo não termina, a menos que eu toque manualmente para encerrá-lo. Nenhuma quantidade de “obrigado”, “é isso”, “terminamos”, “adeus” ou outras palavras foi suficiente para encerrar o bate-papo. Apenas o vermelho Fim o botão faz.
O Google Assistente era muito rigoroso quanto à origem de cada informação; o Gemini Live não se importa com fontes.
Realisticamente, porém, meu maior problema com o Gemini Live é que não há nenhuma fonte para nenhuma das informações que ele compartilha. O Assistant costumava ser um defensor da fonte para tudo; quantas vezes você já ouviu algo como: “De acordo com [website];” ou, “no [website]eles dizem…?” Gemini Live apenas afirma fatosem vez disso, sem nenhuma maneira imediata de verificá-las. Tudo o que posso fazer é encerrar o chat, ir para a transcrição e verificar o botão do Google que aparece abaixo de certas mensagens, o que me mostra pesquisas relacionadas que posso fazer para verificar essas informações. Não é muito intuitivo, Google, e não respeita os milhões de sites que você rastreou para obter sua resposta, como, uh, não sei… Autoridade Android talvez?