Calvin Wankhede / Autoridade Android
Sabemos que a OpenAI está desenvolvendo ativamente seu modelo de linguagem GPT-5 de próxima geração já há algum tempo. Mas no início desta semana, a empresa nos surpreendeu com uma atualização incremental para o GPT-4 Turbo. Chamado de GPT-4o, o novo modelo é uma grande atualização que traz interação de voz em tempo real, recursos de vídeo e respostas mais rápidas e precisas. Mas deixando de lado as demonstrações chamativas, o GPT-4o também marca a primeira maior atualização para usuários gratuitos do ChatGPT em mais de um ano. Veja por que isso é tão importante.
O que é ChatGPT-4o?
Edgar Cervantes / Autoridade Android
ChatGPT-4o ou GPT-4o é o modelo de linguagem mais recente e avançado da OpenAI que pode raciocinar através de áudio, vídeo e texto em tempo real. O modelo pode responder a entradas de áudio em média apenas 320 milissegundos, quase tão rápido quanto o tempo de resposta humano, tornando-o capaz de uma conversa natural.
No ano passado, escrevi sobre o recurso de conversação por voz do ChatGPT e como ele já imitava quase perfeitamente uma conversa da vida real. O GPT-4o eleva ainda mais essa experiência. Embora o recurso anterior usasse modelos diferentes para reconhecimento de fala e geração de resposta, o GPT-4o foi treinado para lidar com todo o processo de ponta a ponta. Armado com os recursos de um grande modelo de linguagem como o GPT-4, o OpenAI afirma que a IA pode até detectar emoções em vozes.
O GPT-4o é mais rápido, preciso e pode até detectar emoções em sua voz.
A capacidade de voz aprimorada do GPT-4o seria um grande negócio por si só, mas esse não é o único novo recurso que a OpenAI exibiu. O novo modelo de linguagem também oferece respostas significativamente mais rápidas, graças a um novo tokenizer. Em idiomas diferentes do inglês, e especialmente naqueles que não usam o alfabeto latino, a OpenAI diz que o novo modelo será duas vezes mais rápido que o modelo GPT-4 Turbo anterior.
O anúncio bombástico do evento foi que o GPT-4o está chegando a todos os usuários do ChatGPT. É isso mesmo – você pode acessar a versão mais recente e mais capaz do chatbot gratuitamente, sem necessidade de assinatura do ChatGPT Plus. Isso marca a primeira atualização de precisão e velocidade para usuários gratuitos desde o lançamento do chatbot, no final de 2022.
As boas notícias para usuários gratuitos não terminam aí. Como o GPT-4o é uma extensão do modelo de linguagem GPT-4 da OpenAI, ele também é capaz de pesquisar na Internet e verificar os fatos de suas respostas. Até agora, os usuários gratuitos estavam presos ao modelo GPT-3.5, que era significativamente menos inteligente e tinha limite de conhecimento em janeiro de 2022.
GPT-4o em ação: como usá-lo
Se você não faz login no ChatGPT há algum tempo, agora é a hora de mudar isso. A OpenAI afirma que está abrindo o acesso ao GPT-4o a todos os usuários em ondas, com efeito imediato. Uso o Microsoft Copilot há cerca de um ano, pois ele oferece acesso gratuito ao GPT-4 e, conseqüentemente, raramente usei o ChatGPT nesse período. Ainda assim, fui recebido com acesso ao GPT-4o em “capacidade limitada” assim que fiz login.
É importante notar que o recurso de conversas por voz do GPT-4o ainda não está disponível. O CEO da OpenAI, Sam Altman, disse que o lançamento começará nas próximas semanas. As conversas por voz também estarão disponíveis exclusivamente para usuários do ChatGPT Plus, pelo menos no futuro próximo.
Com essa isenção de responsabilidade fora do caminho, o GPT-4o ainda é uma atualização impressionante por si só – especialmente para usuários não pagantes. Digite um prompt e você notará que o modelo responde de forma impressionantemente rápida em comparação ao GPT-4. No entanto, pode não ser necessariamente tão rápido quanto o modelo legado GPT-3.5, que tem sido incansavelmente ajustado e otimizado desde seu lançamento inicial, há quatro anos.
Testando GPT-4o: é realmente mais preciso?
Deixando de lado a velocidade, o grande destaque do GPT-4o é que ele oferece respostas significativamente mais precisas. E, ao contrário do GPT-3.5, ele também não tem uma data limite de conhecimento. Isso significa que você pode finalmente fazer perguntas factuais ao chatbot sem ter que se preocupar com a possibilidade de ele ter alucinações ou cuspir respostas falsas. Quanto de atualização é o GPT-4o? Um grande problema em meus testes. Aqui está uma comparação lado a lado onde faço uma pergunta factual simples ao GPT-3.5 e ao GPT-4o:
Como você pode ver neste exemplo relativamente simples, ambos os modelos de linguagem fornecem a resposta correta. No entanto, o GPT-4o estava significativamente mais confiante na sua resposta e forneceu uma resposta detalhada. O modelo GPT-3.5 mais antigo (que era o único modelo disponível para usuários gratuitos do ChatGPT até agora) respondeu de memória, o que explica por que nos pediu para verificar as informações com uma fonte oficial.
Curiosamente, não consegui mudar de GPT-4o para GPT-3.5 para esta questão específica, pois a opção estava esmaecida com a mensagem “Este modelo não suporta o uso de ferramentas”. Portanto, se você fizer uma pergunta factual ao ChatGPT, ele navegará automaticamente na Internet e usará o modelo mais recente. Aqui está outro exemplo em que perguntei ao ChatGPT qual chip contém o Galaxy S24 Ultra, com a condição de comprá-lo no Reino Unido.
Graças à capacidade do GPT-4o de pesquisar na internet, ele disse corretamente que o S24 Ultra vem com o Snapdragon 8 Gen 3 em todo o mundo. Esclareceu ainda que as variantes regular e Plus S24 virão com o Exynos 2400 na Europa. Já fiz a mesma pergunta a outros chatbots no passado, apenas para obter uma resposta que parecia confiante, mas imprecisa. Basta olhar para a resposta do GPT-3.5 acima.
Embora ainda estejamos a algumas semanas de experimentar todo o potencial do GPT-4o, nomeadamente as suas capacidades de voz, a experiência de base ainda é impressionante por si só. Melhor ainda, é universalmente acessível a todos gratuitamente. Portanto, se você usa o Microsoft Copilot ou o Google Gemini em vez do ChatGPT, agora pode ser a hora de voltar atrás.
Você pode gostar