Edgar Cervantes / Autoridade Android
DR
- O Google introduziu o suporte ao Gemini Nano nas versões mais recentes do Chrome Canary.
- O recurso está bloqueado por dois sinalizadores do Chrome e requer um download manual do modelo de idioma.
- O Gemini Nano funciona totalmente offline, com tempos de resposta inferiores a um segundo para consultas simples em computadores modernos.
O modelo de linguagem Gemini Nano do Google é pequeno o suficiente para caber e funcionar inteiramente em um Pixel 8, mas ainda não vimos muitos casos de uso para ele. O modelo é usado apenas para recursos como Resposta Inteligente do Gboard ou resumos gerados por IA no aplicativo Gravador.
Felizmente, o Google parece ter ambições maiores no lado do desktop, já que agora começou a testar a integração do Gemini Nano no Chrome. Isso significa que você pode conversar com um modelo moderno de linguagem grande inteiramente em um navegador da web — mesmo se estiver offline!
Gemini Nano para Chrome foi anunciado no mês passado, com o Google prometendo abrir acesso a desenvolvedores para testes em breve. O recurso foi detectado na versão 127 do Chrome Canary há algumas semanas e desenvolvedores empreendedores já criaram aplicativos da web que mostram os recursos do modelo local. Uma dessas demonstrações é cortesia do usuário do Twitter/X Morten Just, que demonstrou a rapidez com que o Gemini Nano pode responder.
O vídeo mostra o Gemini Nano respondendo em tempo real, com valores de latência variando na casa das centenas de milissegundos. No entanto, o desenvolvedor admitiu ter executado a demonstração em um Mac com Apple Silicon M3 Max, que tem um desempenho um pouco melhor do que um desktop comum. Ainda assim, estamos falando em receber uma resposta mais rápida do que o tempo médio de resposta humana, portanto, hardware ainda mais lento deve ser capaz de lidar com o Gemini Nano.
Caso em questão: instalei o Chrome Canary no meu desktop que está equipado com uma CPU AMD Ryzen 5600X e uma GPU Nvidia RTX 3060 Ti. Essas são especificações de PC de médio porte, mas o suficiente para rodar modelos maiores como o Llama 3 da Meta.
Como ativar o Gemini Nano no Chrome: minha experiência
Depois de ativar alguns sinalizadores de recursos no Chrome Canary, pude ver um tráfego persistente da Internet indicando que o navegador havia iniciado o download do modelo. O Google ainda não oferece uma interface para conversar com o Gemini Nano, mas o usuário do Twitter, Lightning Joyce, desenvolveu um aplicativo da web de código aberto que você pode usar enquanto isso. Parece qualquer outro chatbot na superfície, apenas reduzido ao essencial. Basta carregar a página, desconectar seu computador da Internet e você poderá testar o desempenho offline do Gemini Nano.
Com a preparação resolvida, como foi o desempenho do modelo em meu sistema? Surpreendentemente bem e quase no mesmo nível do vídeo de demonstração acima. A velocidade por si só não é inovadora, pois meu hardware pode gerar 50 tokens por segundo (aproximadamente o equivalente a 50 palavras por segundo) enquanto processa respostas via Llama 3. Em vez disso, o ponto principal aqui é que o Gemini Nano pode ser usado como um chatbot improvisado e pode ser executado facilmente em uma variedade maior de hardware devido ao seu tamanho menor.
Calvin Wankhede / Autoridade Android
No entanto, percebi que o Gemini Nano não respondia sempre que eu inseria uma solicitação aberta como “Escreva um ensaio sobre…” ou “História do Android”. Sempre que isso acontecia, o uso da GPU do meu computador aumentava – até 90% de carga por alguns segundos antes de voltar ao normal. Isso pode ser um bug no aplicativo da web, mas vale lembrar que o Gemini Nano no Chrome é, afinal, um recurso experimental. O modelo poderia lidar perfeitamente com respostas de um único parágrafo.
A boa notícia é que o Gemini Nano ocupará apenas 2 GB da memória de vídeo da sua GPU (ou RAM se o seu computador não tiver hardware gráfico dedicado). E mesmo com as outras advertências acima, o Gemini Nano permanece impressionantemente rápido e utilizável. Sem mencionar que executá-lo inteiramente no Chrome pode torná-lo muito mais acessível do que qualquer outro modelo de linguagem offline que vimos.
Se desejar usar o Gemini Nano em sua própria máquina, siga estas etapas:
- Instale o Chrome Canary versão 128 ou mais recente.
- Navegar para cromo: // sinalizadores
- Habilite o prompt-api-para-gemini-nano e sinalizadores de modelo de guia de otimização no dispositivo.
- Navegar para chrome://componentesprocure “Guia de otimização no modelo do dispositivo”
- Aguarde o download do modelo ser concluído — isso pode demorar um pouco, dependendo da velocidade da sua internet. O Gemini Nano tem aproximadamente 2 GB de tamanho.
- Navegue até um aplicativo da web como chromeai.pages.dev, desconecte sua conexão com a Internet e envie sua primeira mensagem. Você deverá ver uma resposta quase instantaneamente.