No evento Made by Google de hoje, o Google revelou uma série de novos hardwares, incluindo quatro telefones da série Pixel 9, o novo Pixel Watch 3 e o Pixel Buds Pro 2. No entanto, pode-se argumentar que o hardware ficou em segundo plano no lançamento, com o Gemini sendo a verdadeira estrela do show.
Um novo recurso que o Google lançou dentro da caixa de ferramentas Gemini em constante expansão é o Gemini Live. Ele promete uma versão muito mais conversacional do sistema de IA generativa. Essencialmente, em vez de emitir um comando para Gemini e então ouvir uma resposta, você tem um vai e vem natural. Isso permite que você o interrompa, esclareça o que quer dizer por meio de linguagem natural ou apenas, você sabe… mastigue o rum para matar o tempo. É muito semelhante à versão própria da OpenAI dessa tecnologia dentro do GPT-4o, que ainda não foi totalmente lançada ao público.
Durante o lançamento, o Google mostrou como isso funciona no palco por meio de uma demonstração ao vivo. Mas, como de costume, eu queria experimentar por mim mesmo para ver como funciona em um ambiente menos controlado. Embora eu não tenha conseguido pegar um Pixel 9 e fazer o que eu quisesse com ele ainda, consegui ter uma conversa com o Gemini Live que o Google não me prescreveu. Inesperadamente, o Gemini Live foi muito bom… quase bom demais para eu me sentir confortável com ele.
15%desligado
Google Pixel 9 Pro XL
As melhores especificações da série Pixel 9
Exibição deslumbrante
Sete anos de atualizações de software
16%desligado
Google Pixel 9 Pro
Tudo Pro, tamanho razoável
Exibição de alta qualidade
Sete anos de suporte de software
11%desligado
Google Pixel 9
O Pixel 9 mais acessível
Sete anos de atualizações
Design atualizado
Experimentando o Gemini Live
Edgar Cervantes / Autoridade Android
Antes de entrar na minha experiência, deixe-me definir o cenário. Depois que a transmissão ao vivo do Made by Google terminou, o Google nos conduziu, jornalistas, para o que eles chamam de “a sandbox”, que são essencialmente várias áreas de demonstração para os produtos recém-anunciados. Duas dessas áreas de demonstração envolveram o Gemini Live, uma usando o novo Pixel Buds Pro 2 e outra usando um Pixel 9 Pro. Meu colega Ryan Haines fez a demonstração do Pixel Buds Pro 2 e disse que ficou um pouco desconfortável com o quão natural a conversa do Gemini Live realmente foi. Ele disse que era um pouco “vale misterioso”, mas, no geral, foi muito impressionante.
Enquanto isso, experimentei a demonstração que usava o telefone. Você pode ver parte da minha experiência no vídeo no topo deste artigo. Nesta cabine, um Googler que trabalha na equipe Gemini nos explicou como o Gemini Live funciona, tendo uma conversa sobre como organizar um jantar para amigos. A conversa deles foi totalmente natural, com muitas idas e vindas e até piadas. Gemini não tropeçou nem uma vez. Depois da demonstração, perguntei se eu poderia tentar, e ele me mostrou uma lista de possíveis tópicos sobre os quais eu poderia perguntar. Mas eu queria ter uma conversa minha para ter uma experiência que o Google não planejou totalmente. Eu escolhi videogames.
Não perguntei ao Gemini Live sobre as coisas que o Google sugeriu que eu perguntasse e, em vez disso, escolhi meu próprio tópico.
Comecei pedindo para Gemini sugerir um novo videogame para jogar. Contei a ele o jogo que estou jogando agora — Horizon Forbidden West — e disse que queria algo assim. Quase instantaneamente, Gemini começou a me dar sugestões. No entanto, ele não começou apenas a listar os jogos — ele me contou os jogos e até mesmo fez referência aos aspectos desses jogos que atrairiam alguém que gostasse de HFW. Ele fez isso da mesma forma que um amigo sugeriria um jogo para você por meio de uma linguagem natural e humana.
Em um ponto, ele mencionou Elden Ring. Enquanto ele continuava seu discurso, eu o interrompi para dizer que Elden Ring era muito difícil e que ele deveria sugerir algo mais fácil. Sem perder o ritmo, ele mencionou Ghosts of Tsushima e começou a explicar por que aquele poderia ser melhor para mim do que Elden Ring.
A demonstração ocorreu sem problemas. Não houve alucinações, e Gemini se comunicou comigo de uma forma que parecia orgânica. Quase parecia que eu não estava me comunicando com um algoritmo.
Usando Gemini Live: Minha opinião
Houve duas coisas notáveis que colhi dessa conversa no Gemini Live. Primeiro, a velocidade e a cadência da voz do Gemini Live fizeram parecer que eu estava falando com uma pessoa real. Não tinha aquele tom robótico do Google Assistente — parecia muito mais presente e real. Isso tornou a informação mais fácil de digerir, ao mesmo tempo em que parecia integral. Sabe quando você pede um fato ao Google Assistente e ele dispara e começa a lhe dizer todo tipo de lixo com o qual você não se importa? Isso não aconteceu aqui. Parecia que um humano estava respondendo à minha pergunta, um humano que entende o que é informação essencial e o que pode ser deixado de fora.
Falar com o Gemini Live pareceu tão “normal”, mas não tenho certeza se isso é realmente legal ou realmente assustador.
Segundo, foi muito preciso. Obviamente, essa pergunta não foi muito difícil, mas há muitos jogos que a Gemini Live poderia ter recomendado que alguém poderia pensar que seriam uma boa opção para um jogador de HFW, mas não são. Os jogos Monster Hunter, por exemplo, parecem jogos que os jogadores de HFW gostariam, mas na verdade há muito pouca sobreposição entre eles. Os jogos que a Gemini Live recomendou — The Witcher 3: Wild Hunt, Elden Ring, Ghosts of Tsushima e Horizon Zero Dawn — são todos jogos que alguém que amou Horizon provavelmente também gostaria.
Se tivéssemos tido tempo, eu poderia ver isso se tornando uma conversa completa. Eu poderia ter perguntado mais sobre Ghosts of Tsushima e talvez contado mais a Gemini sobre o que eu amo em Horizon Forbidden West. Poderíamos ter apenas sentado lá e conversado sobre jogos por um tempo. Isso não teria parecido estranho. Mas isso, por si só, é estranho. Não há um ser humano surgindo com essas respostas — são apenas linhas de código juntando tudo. Foi só depois que nosso bate-papo terminou que comecei a me sentir estranho sobre isso.
Gemini Live não é humano, mas conversar com ele não pareceu muito diferente de falar com um humano.
De qualquer forma, estou animado para submeter o Gemini Live a mais alguns testes extremos. Quão pessoal isso pode ficar? Quanto tempo a conversa pode durar antes de começar a alucinar ou simplesmente cair completamente como aconteceu no palco durante o evento Made by Google (eu me senti tão mal por aqueles apresentadores, deve ter sido tão mortificante)?
Poderemos nos aprofundar mais no Gemini Live em breve, assim que colocarmos os telefones Pixel 9 à prova. Até lá, deixe-me saber o que você acha nos comentários abaixo. Você vai falar com o Gemini Live? Sobre o que você vai falar?