O novo LLM tem muito potencial, construído desde o início para ser multimodal. Anteriormente, a criação de modelos multimodais envolvia muitos ajustes e costuras para fazê-los funcionar, enquanto a solução do Google foi projetada para acomodar diferentes modos adaptados para casos de uso específicos.
Existem três versões distintas do Gemini, todas projetadas com diferentes vantagens e desvantagens. Vamos começar e dar uma olhada mais de perto em Gemini Ultra vs Gemini Pro vs Gemini Nano.
O que é o Google Gemini e qual é a diferença entre Gemini Nano, Pro e Ultra?
Em termos mais simples, Gemini é o mais recente Large Language Model (LLM) do Google que irá potencializar os recursos de IA de vários produtos do Google e já está substituindo o PaLM2 no Bard. A maneira mais fácil de explicar um LLM é pensar nele como o motor por trás da IA, enquanto chatbots como o Google Bard são os carros que o dirigem.
Então, qual é a diferença entre Gemini Ultra, Gemini Pro e Gemini Nano? Todas as três versões são construídas a partir do mesmo código e funcionam de forma semelhante, mas têm casos de uso diferentes.
Você não equiparia um minúsculo Honda hatchback com motor V10, certo? A mesma ideia geral também se aplica às diferentes versões de Gêmeos. O Google Gemini Nano é o seu motor confiável de 4 cilindros, perfeitamente capaz de levá-lo aonde você precisa, ao mesmo tempo que é leve e eficiente. O Google Gemini Pro é efetivamente o seu V6, um tamanho de mecanismo padrão que se aplica a uma ampla gama de tarefas. Por fim, temos o Google Gemini Ultra, que equivale a um V10 com toneladas de capacidades, mas ao custo da eficiência, pois precisa de muita energia para funcionar.
Google Gêmeos x GPT
Calvin Wankhede / Autoridade Android
Como os três modos do Google Gemini se comparam ao GPT? O Google Gemini Nano não tem uma comparação direta, mas o Gemini Pro e o Ultra são efetivamente a resposta do Google ao GPT 3.5 e GPT 4, respectivamente. O Gemini não apenas tem o poder da Pesquisa Google para recuperar informações mais atuais, mas também está à frente de ambos os mecanismos na grande maioria das métricas. Por exemplo, o Gemini Ultra superou o GPT 4 nos benchmarks MATH e GSM8K e está muito acima do GPT para geração de código Python.
Na próxima seção, detalharemos cada versão do Google Gemini, bem como mais alguns detalhes sobre como cada versão se compara ao respectivo equivalente GPT.
Google Gemini Nano: uma história de dois tamanhos
Rita El Khoury / Autoridade Android
O Google Gemini é o mais leve e eficiente dos modelos, projetado para rodar diretamente em dispositivos móveis. O Google não se contentou com apenas três versões do Gemini, já que o Nano tem duas variantes próprias: Nano-1 e Nano-2. O primeiro pode lidar com 1,8 bilhão de parâmetros, enquanto o último é capaz de 3,25 bilhões.
Embora ambos sejam projetados para rodar diretamente em hardware de menor potência, o Nano-1 é para dispositivos com pouca memória e o Nano-2 é voltado para produtos com muita memória.
Google Gemini Pro: o mecanismo que executa a experiência atualizada do Bard
C. Scott Brown / Autoridade Android
Gemini Pro é o modo de nível intermediário e o que atualmente alimenta o Google Bard. A boa notícia é que Bard deverá ser capaz de competir melhor com o ChatGPT agora que roda no Gemini Pro, pelo menos se as afirmações do Google forem precisas.
Alegadamente, o Pro é mais capaz que o GPT-3.5 em seis benchmarks diferentes e é especialmente otimizado para tarefas como brainstorming, resumir conteúdo e escrever. Embora esta não seja a versão mais recente do GPT, é a mais frontal, pois é o que alimenta o popular serviço ChatGPT.
Google Gêmeos Ultra
O Google Gemini Ultra representa o nível mais alto e é o modelo LLM que dá ao GPT-4 uma corrida pelo seu dinheiro, conforme mencionado acima. O Ultra excede 30 dos 32 benchmarks acadêmicos para resultados atuais de última geração usados para LLMs e supera o GPT-4 em todas as categorias fora do raciocínio de bom senso para tarefas diárias.
Embora o GPT-4 possa compreender o contexto apenas de palavras e imagens, o Gemini vai um passo além e pode compreender informações diferenciadas de palavras, imagens, áudio, codificação e tópicos ainda mais complicados relacionados à matemática e à física. Também pode responder rapidamente às suas perguntas, essencialmente em tempo real. Infelizmente, ainda não está disponível de nenhuma forma e, portanto, permanece mais uma promessa do que qualquer coisa.
Como acessar o chatbot Bard do Google Gemini
Edgar Cervantes / Autoridade Android
A maneira mais fácil de acessar o Bard é acessar bard.google.com. Você precisará fazer login em sua conta do Google, caso ainda não o tenha feito. É isso! Você não precisa fazer nada para mudar o Bard para o Gemini, pois isso foi feito pelo Google no back-end. Claro, é importante notar que o Bard está disponível apenas em inglês, embora você possa encontrá-lo em mais de 170 países.
O novo Bard impulsionado por Gemini estará inicialmente disponível em inglês em mais de 170 países, embora surpreendentemente não no Reino Unido ou na Europa. Isto se deve a obstáculos regulatórios, que esperamos que sejam resolvidos em breve.
Data de lançamento do Google Gemini: quando você poderá usá-lo?
C. Scott Brown / Autoridade Android
A data de lançamento do Google Gemini é um pouco complicada, pois varia dependendo da versão do LLM e dos aplicativos aos quais será integrado. Ainda aqui está uma análise básica:
- O Google Gemini Nano chegará como uma prévia do novo aplicativo AI Core do Google, que começou a chegar aos usuários do Pixel 8 Pro em 6 de dezembro. Espera-se que eventualmente chegue a outros dispositivos Android 14 também, mas pelo menos por enquanto continua sendo um Pixel exclusivo .
- O Google Gemini Pro foi lançado em 6 de dezembro como uma atualização interna do Google Bard. Também se espera que seja implementado para clientes corporativos que usam Vertex AI em 13 de dezembro.
- O Google Gemini Ultra é a versão mais poderosa do LLM e espera-se que seja um concorrente mais adequado do ChatGPT. Infelizmente, ainda não está chegando. Embora o Google ainda não tenha definido a data de lançamento do Gemini Ultra, isso não é esperado até 2024.
Perguntas frequentes
O Google Bard foi lançado inicialmente em 21 de março de 2023 usando LaMDA como mecanismo, até ser atualizado para PaLM 2. Em 6 de dezembro, Bard trocou o PaLM por uma versão otimizada do Gemini Pro.
Sim e não, pois depende da versão e do que você procura. O Gemini Ultra está (pelo menos no papel) um passo à frente do GPT-4 em quase todas as métricas, exceto no raciocínio de bom senso para tarefas diárias. Enquanto isso, o Gemini Pro está indiscutivelmente entre o GPT 3.5 e o GPT 4 em termos de desempenho e capacidades.
Sim, o uso do Google Bard é gratuito, semelhante ao ChatGPT. Ao contrário do último serviço, o Bard permite analisar imagens e outros elementos gratuitamente, enquanto o OpenAI mantém alguns desses recursos do ChatGPT bloqueados em seu nível premium.
Sim, você pode usar o Google Bard em seu telefone, mas precisará usar o Chrome ou outro navegador para acessá-lo. O Google está trabalhando para trazer a funcionalidade Bard para o Google Assistant, mas esse é um experimento que está sendo implementado lentamente por enquanto.