
Um equipe internacional de pesquisadores lançou um sistema de inteligência artificial capaz de conduzir pesquisas científicas de forma autônoma em diversas disciplinas – gerando artigos desde o conceito inicial até o manuscrito pronto para publicação em aproximadamente 30 minutos por cerca de US$ 4 cada.
O sistema, chamado denáriopode formular ideias de pesquisa, revisar a literatura existente, desenvolver metodologias, escrever e executar códigos, criar visualizações e redigir artigos acadêmicos completos. Numa demonstração da sua versatilidade, a equipa usou Denario para gerar papéis abrangendo astrofísica, biologia, química, medicina, neurociência e outras áreas, com um artigo gerado por IA já aceito para publicação em um conferência acadêmica.
"O objetivo do Denario não é automatizar a ciência, mas desenvolver um assistente de pesquisa que possa acelerar a descoberta científica," escreveram os pesquisadores em um artigo divulgado na segunda-feira descrevendo o sistema. A equipe está fazendo o software disponível publicamente como uma ferramenta de código aberto.
Esta conquista marca um ponto de viragem na aplicação de grandes modelos de linguagem ao trabalho científico, potencialmente transformando a forma como os investigadores abordam as investigações em fase inicial e as revisões de literatura. No entanto, a investigação também destaca limitações substanciais e levanta questões prementes sobre validação, autoria e a natureza mutável do trabalho científico.
Dos dados ao rascunho: como os agentes de IA colaboram para conduzir pesquisas
Em sua essência, denário opera não como um único cérebro de IA, mas como um departamento de pesquisa digital onde agentes especializados em IA colaboram para levar um projeto desde a concepção até a conclusão. O processo pode começar com o "Módulo de ideias," que emprega um fascinante processo adversário onde um "Criador de ideias" agente propõe projetos de pesquisa que são então examinados por um "Odiador de ideias" agente, que os critica quanto à viabilidade e valor científico. Este ciclo iterativo refina conceitos brutos em direções de pesquisa robustas.
Uma vez que uma hipótese é solidificada, um "Módulo de Literatura" vasculha bancos de dados acadêmicos como o Semantic Scholar para verificar a novidade da ideia, seguido por uma "Módulo Metodologia" que apresenta um plano de pesquisa detalhado e passo a passo. O trabalho pesado é então feito pelo "Módulo de Análise," um burro de carga virtual que escreve, depura e executa seu próprio código Python para analisar dados, gerar gráficos e resumir descobertas. Finalmente, o "Módulo de papel" pega os dados resultantes, traça e elabora um artigo científico completo em LaTeX, o padrão para muitos campos científicos. Em uma etapa final e recursiva, um "Módulo de revisão" pode até atuar como revisor de IA, fornecendo um relatório crítico sobre os pontos fortes e fracos do artigo gerado.
Este design modular permite que um pesquisador humano intervenha em qualquer etapa, fornecendo sua própria ideia ou metodologia, ou simplesmente utilize o Denario como um sistema autônomo ponta a ponta. "O sistema possui uma arquitetura modular, permitindo realizar tarefas específicas, como gerar uma ideia ou realizar análises científicas ponta a ponta," o jornal explica.
Para validar as suas capacidades, a equipa do Denario testou o sistema, gerando um vasto repositório de artigos de diversas disciplinas. Numa impressionante prova de conceito, um artigo totalmente gerado por Denario foi aceito para publicação no Conferência Agents4Science 2025 — um local revisado por pares onde os próprios sistemas de IA são os autores principais. O jornal, intitulado "Análise de subestrutura multiescala aprimorada por QITT com incorporações topológicas aprendidas para estimativa de parâmetros cosmológicos de árvores de fusão de Halo de matéria escura," combinou com sucesso ideias complexas de física quântica, aprendizado de máquina e cosmologia para analisar dados de simulação.
O fantasma na máquina: resultados “vácuos” e alarmes éticos da IA
Embora os sucessos sejam notáveis, o artigo de pesquisa é refrescantemente sincero sobre as limitações significativas e os modos de falha do Denario. Os autores salientam que o sistema atualmente "comporta-se mais como um bom aluno de graduação ou pós-graduação do que como um professor titular em termos de visão geral, conexão de resultados… etc." Esta honestidade proporciona uma verificação crucial da realidade num campo frequentemente dominado pelo exagero.
O artigo dedica seções inteiras a "Modos de falha" e "Implicações Éticas," um nível de transparência que os líderes empresariais devem observar. Os autores relatam que, em um caso, o sistema "alucinou um artigo inteiro sem implementar o solucionador numérico necessário," inventar resultados para se adequar a uma narrativa plausível. Em outro teste sobre um problema de matemática pura, a IA produziu um texto que tinha o forma de uma prova matemática, mas foi, nas palavras dos autores, "matematicamente vazio."
Estas falhas sublinham um ponto crítico para qualquer organização que pretenda implementar IA de agente: os sistemas podem ser frágeis e propensos a erros que parecem confiantes e que requerem supervisão humana especializada. O artigo Denario serve como um estudo de caso vital sobre a importância de manter um ser humano informado para validação e avaliação crítica.
Os autores também confrontam as profundas questões éticas levantadas pela sua criação. Eles avisam que "Os agentes de IA poderiam ser utilizados para inundar rapidamente a literatura científica com afirmações motivadas por uma agenda política específica ou por interesses comerciais ou económicos específicos." Eles também tocam no "Armadilha de Turing," um fenômeno onde o objetivo passa a ser imitar a inteligência humana em vez de aumentá-la, potencialmente levando a um "homogeneização" de pesquisa que sufoca a verdadeira inovação que muda o paradigma.
Um copiloto de código aberto para os laboratórios do mundo
Denario não é apenas um exercício teórico trancado num laboratório acadêmico. Todo o sistema é código aberto sob uma licença GPL-3.0 e é acessível à comunidade em geral. O projeto principal e sua interface gráfica de usuário, DenarioApp, são disponível no GitHubcom instalação gerenciada por meio de ferramentas Python padrão. Para ambientes corporativos focados em reprodutibilidade e escalabilidade, o projeto também fornece imagens oficiais do Docker. Uma demonstração pública hospedada em Abraçando espaços faciais permite que qualquer pessoa experimente suas capacidades.
Por enquanto, Denario continua sendo o que seus criadores chamam de assistente poderoso, mas não um substituto para a intuição experiente de um especialista humano. Este enquadramento é deliberado. O projeto Denario tem menos a ver com a criação de um cientista automatizado e mais com a construção do copiloto definitivo, projetado para lidar com os aspectos tediosos e demorados da pesquisa moderna.
Ao entregar o árduo trabalho de codificação, depuração e rascunho inicial a um agente de IA, o sistema promete libertar os investigadores humanos para a única tarefa que não pode automatizar: o pensamento crítico e profundo necessário para fazer as perguntas certas em primeiro lugar.

