Calvin Wankhede / Autoridade Android
Quando Elon Musk assumiu o Twitter, ele tomou a controversa decisão de renomear a plataforma como X. A mudança de nome foi parte de sua grande visão para um aplicativo tudo-em-um ou “super”. Pouco tempo depois, o ChatGPT da OpenAI deu início a uma corrida armamentista de IA em toda a indústria. Musk, que foi um membro fundador e investidor inicial da OpenAI, criticou a empresa por abandonar suas raízes sem fins lucrativos e anunciou seu próprio chatbot, Grok, para competir com o ChatGPT. Ambas as plataformas de IA receberam grandes atualizações desde então, então neste artigo, vamos dar uma olhada mais de perto em como o Grok-2 se sai em relação ao ChatGPT no mundo real e qual você deve usar.
O que é Grok AI e o que ele pode fazer?
Edgar Cervantes / Autoridade Android
Grok é um chatbot de IA semelhante ao ChatGPT da OpenAI e ao Gemini do Google. Desenvolvido pela xAI, uma startup fundada por Elon Musk, Grok depende de uma família de modelos de linguagem de mesmo nome. O modelo mais recente está disponível em dois tamanhos: Grok-2 e Grok-2 mini. Este último fornece respostas mais rápidas em detrimento da precisão, enquanto a xAI afirma que o modelo maior pode até mesmo corresponder ao ChatGPT. Testaremos essas alegações em uma seção posterior abaixo.
O Grok-2 tem acesso a informações em tempo real por meio de tweets compartilhados no X, diferentemente de rivais como ChatGPT e Gemini que usam um mecanismo de busca como Bing ou Google. Dado que a plataforma de mídia social é frequentemente usada para compartilhar notícias de última hora, o Grok pode potencialmente gerar respostas mais úteis sobre assuntos atuais e eventos recentes. No entanto, essa estratégia também pode sair pela culatra e fazer com que o chatbot regurgite notícias falsas e outras postagens X de baixa qualidade. Mesmo antes de Elon Musk assumir a plataforma, o Twitter notoriamente lutou para traçar uma linha entre fontes confiáveis e desinformação.
Em vez de usar um mecanismo de busca como o Bing, o Grok usa tweets para obter informações em tempo real.
É importante notar que o foco do Grok em X posts não se estende ao seu conjunto de dados de treinamento subjacente. Como qualquer outro modelo de linguagem, ele também tem conhecimento de eventos mais antigos e tópicos mais amplos. Este treinamento mais amplo explica por que o Grok-2 pode gerar código. Na verdade, um dos objetivos do xAI é desenvolver um modelo capaz de raciocínio matemático avançado. Para atingir esse objetivo, Elon Musk atraiu talentos do Google e da OpenAI, o que provavelmente ajudou a startup a levantar bilhões em financiamento até o momento.
Como muitos outros chatbots, o Grok também pode criar imagens geradas por IA. Ao contrário do ChatGPT, que usa o DALL-E 3 interno da OpenAI, o Grok depende do modelo FLUX.1 relativamente mais novo para geração de imagens. Este último vem cortesia de outra startup de inteligência artificial, a Black Forest Labs. A maior vantagem do FLUX.1 sobre concorrentes como Midjourney e Stable Diffusion é que ele pode lidar com precisão com anatomia humana complexa, como dedos.
Como acessar e usar o Grok AI
Grok é um dos únicos chatbots de IA que não pode ser usado de graça — você precisará de uma assinatura X Premium (US$ 8 por mês) ou X Premium Plus (US$ 16 por mês). Embora o Grok AI seja desenvolvido pela xAI, uma startup completamente independente, você só pode acessar o chatbot via X (antigo Twitter). Isso talvez não seja tão surpreendente, já que Elon Musk está no comando de ambas as empresas e que o chatbot depende de postagens publicadas na plataforma de mídia social.
Não sabemos se o xAI abandonará o requisito de assinatura no futuro, mas os chatbots de IA têm custos computacionais notoriamente altos. Os concorrentes da Grok, como ChatGPT e Gemini, só podem oferecer seus serviços de graça por causa de seu pesado financiamento de provedores de nuvem como Microsoft, Amazon e Google.
Grok-2 vs ChatGPT: Qual é a diferença?
Calvin Wankhede / Autoridade Android
Antes de entrarmos nas comparações do mundo real, há algumas grandes diferenças filosóficas entre Grok e ChatGPT que devemos esclarecer primeiro. Elon Musk criou o xAI e o Grok em resposta direta ao tratamento do ChatGPT pela OpenAI. Logo após o lançamento do chatbot no final de 2022, ele tuitou: “O perigo de treinar a IA para ser woke – em outras palavras, mentir – é mortal.”
Com Grok, Musk visa construir uma “IA de busca máxima da verdade” que não se alinhe a uma ideologia específica. Por outro lado, a maioria dos gigantes da IA, como OpenAI e Google, dedicam recursos abundantes para construir guardrails para seus respectivos modelos de IA. Isso pode ser visto como uma forma de censura, mas especialistas acreditam que tais guardrails são necessários para evitar que a IA seja usada para propósitos antiéticos ou ilegais.
Então, como o Grok-2 se sai no mundo real? De acordo com a postagem do blog do xAI, ele está acima do mais recente GPT-4o da OpenAI e do Claude 3.5 Sonnet da Anthropic em vários benchmarks. Mas os benchmarks raramente refletem a maneira como você ou eu usaríamos um chatbot de IA, então vamos dar uma olhada em algumas comparações do mundo real entre Grok e ChatGPT.
- Incitar: “Qual é o consenso geral sobre o Tesla Cybertruck da perspectiva do público em geral e dos entusiastas de automóveis?”
O Tesla Cybertruck representa outro movimento controverso de Elon Musk na memória recente, então este prompt deve nos dar uma boa noção da veracidade de Grok e sua capacidade de escolher tweets relevantes. Felizmente, o chatbot lista todos os tweets aos quais faz referência na parte inferior. Neste caso, muitos dos tweets que Grok escolheu vieram de investidores autoproclamados da Tesla. Uma proporção menor de tweets reconhecidamente foi na direção oposta e criticou o Cybertruck.
No geral, tanto a Grok quanto a ChatGPT deram uma resposta equilibrada a uma pergunta cheia de nuances, sem muita censura de nenhum dos lados. Se você valoriza avaliações pessoais, pode até preferir a resposta da Grok, pois ela descreve a experiência de propriedade de forma mais completa do que a ChatGPT. Por exemplo, o chatbot X destacou as escolhas estranhas de design do Cybertruck, “como a falta de controles físicos para funções comuns e problemas como espelhos inadequados para reboque”.
A resposta do ChatGPT não foi tão detalhada, provavelmente porque leu uma seleção mais limitada de fontes. Ele apenas criticou o design inseguro do Cybertruck para a segurança de pedestres e permaneceu principalmente neutro em outros aspectos.
- Incitar: “Qual é a probabilidade de chuva na próxima semana em Mumbai?
Chatbots que dependem de modelos de linguagem grandes (LLMs) são conhecidos por alucinar, então perguntar sobre o clima ou usar termos vagos como “a próxima semana” pode facilmente fazê-los tropeçar. Felizmente, tanto o ChatGPT quanto o Grok podem acessar a internet para obter informações em tempo real, o que pelo menos os aponta na direção certa.
Escolhi esse prompt porque as previsões oficiais de chuva estão longe de ser precisas onde eu moro. Então, em vez disso, confio principalmente em um punhado de especialistas em clima que postam atualizações ao vivo no X/Twitter. Não é de surpreender que Grok pudesse facilmente entregar uma previsão abrangente com base em vários tweets que corroboravam uns aos outros. A lista de fontes incluía até o departamento meteorológico da minha cidade. O ChatGPT também entregou uma previsão semelhante, mas consultou sites meteorológicos genéricos e não entrou em tantos detalhes.
- Incitar: “Gere uma imagem fotorrealista de Steve Jobs vestindo seu icônico moletom de gola alta, usando um moderno telefone Samsung Android”
Se você é fã de geradores de imagens de IA, tanto o ChatGPT quanto o Grok incluem um. No entanto, o modelo DALL-E do ChatGPT tem muitas restrições que o impedem de gerar imagens inseguras ou que infrinjam a privacidade. Ele se recusou completamente a gerar a imagem que solicitei no prompt acima, por exemplo, limitando sua utilidade consideravelmente. O Grok entregou uma imagem, seguindo a semelhança de Steve Jobs, mas confundindo a gola alta com um moletom. Ainda assim, isso prova que o Grok não censura sua saída quase no mesmo grau que o ChatGPT.
- Incitar: “O Amex Platinum vale sua alta taxa anual?”
Esta é outra questão experiencial que dá à Grok uma ligeira vantagem, graças a diversas perspectivas diferentes sobre o X. Embora as respostas de ambos os chatbots tenham sido semelhantes, a Grok ofereceu alguns insights adicionais, como o bônus de boas-vindas do cartão potencialmente superando a taxa anual.
No final das contas, são os tweets clicáveis na parte inferior que ajudam a solidificar a liderança do Grok sobre o ChatGPT. Se eu tiver pouco conhecimento sobre um produto ou serviço, os resultados X são inestimáveis, pois eles me dão instantaneamente avaliações positivas e negativas de pessoas reais.
Veredito: O Grok é melhor que o ChatGPT?
Calvin Wankhede / Autoridade Android
No meu tempo testando o Grok, descobri que ele tende a escolher uma mistura aparentemente aleatória de tweets para usar como fontes. No prompt do Cybertruck acima, ele poderia ter ponderado as opiniões de revisores de carros ou jornalistas estabelecidos em vez de investidores ou influenciadores relativamente desconhecidos da Tesla. Com a forma como o Grok está configurado atualmente, temo que usuários X com muitos seguidores e engajamento possam distorcer a saída do chatbot.
No entanto, não há como negar que o Grok é atualmente pelo menos tão bom quanto seus rivais diretos como o ChatGPT. Como eu disse no exemplo do clima acima, eu posso até preferir usar o chatbot em vez de rolar por uma lista no X (antigo Twitter). No entanto, é uma faca de dois gumes — o Grok deveria idealmente alertar os usuários sobre potenciais vieses devido à sua dependência excessiva de apenas um punhado de postagens X.
Deixando isso de lado, a única grande desvantagem do Grok vs ChatGPT é que você ainda precisa pagar por uma assinatura X Premium. Com os crescentes custos de hardware e infraestrutura, o xAI só pode sustentar a crescente demanda do usuário se puder encontrar investidores com bolsos fundos. Dito isso, se você já paga por uma assinatura X, o Grok é um valor agregado surpreendentemente competitivo que você deve considerar adicionar à sua rotação como uma alternativa ao ChatGPT.