Edgar Cervantes / Autoridade Android
Embora imagens falsas e adulteradas existam desde a Internet, os recentes avanços no aprendizado de máquina tornaram trivial para qualquer pessoa se envolver na prática. Graças aos geradores de imagens de IA como Midjourney, Microsoft Designer e DALL-E 3, qualquer pessoa pode criar uma cena de aparência convincente em segundos. É fácil ver como tais imagens podem facilmente manipular populações inteiras e espalhar desinformação. Felizmente, nem toda esperança está perdida – aqui estão algumas estratégias que podemos empregar para detectar imagens geradas por IA.
Como identificar uma imagem gerada por IA
Os geradores de imagens de IA são o resultado de duas novas tecnologias: grandes modelos de linguagem e modelos de difusão. Você já deve estar familiarizado com grandes modelos de linguagem como o GPT-4, que podem compreender nuances da linguagem humana. Enquanto isso, os modelos de difusão foram treinados em milhões de imagens e podem reconstruir cenas de aparência realista a partir de ruído aleatório.
Os geradores de imagens de IA combinam essas duas tecnologias de IA. Eles podem usar apenas algumas palavras e construir progressivamente uma imagem realista. Felizmente para nós, porém, o processo é imperfeito e a IA muitas vezes deixa sinais sutis que podemos detectar. Aqui está o que você deve observar, sem nenhuma ordem específica:
1. Características anatômicas
Os modelos de IA são treinados em enormes conjuntos de dados de imagens reais, permitindo-lhes aprender os detalhes intrincados dos ambientes. Esse conhecimento permite que eles juntem novas imagens sob demanda. No entanto, isso não significa que eles possam recriar detalhes perfeitamente. Isto é especialmente verdadeiro para partes do corpo.
Outro dia, me deparei com a imagem de duas pessoas sentadas de pernas cruzadas que não parecia muito certa. Após uma inspeção mais detalhada, notei que uma pessoa tinha um terceiro membro. A IA estudou milhares de humanos durante seu treinamento, mas a posição de pernas cruzadas não era tão comum. O mesmo vale para os dedos. Geradores rudimentares de imagens de IA tendem a adicionar dedos extras ou se esquecem de adicionar articulações e outras características anatômicas.
Na imagem acima, de um Papa Francisco gerado por IA vestindo uma jaqueta inflável, por exemplo, observe atentamente seus dedos. Mesmo que ele pareça estar segurando um objeto, a IA claramente transformou seus dedos em uma só massa.
2. Cabelo não natural
Se a anatomia estiver correta, você poderá ir ainda mais fundo com características finas, como pêlo e cabelo. Afinal, o cabelo pode variar em espessura e textura. Capturar a forma como a luz interage com fios individuais e como eles caem e fluem de forma realista pode ser um desafio para a IA.
Precisamos procurar inconsistências nos penteados, principalmente onde o cabelo interage com outros objetos. Olhando para os exemplos acima, o gerador de imagens Imagine AI da Meta fez um trabalho melhor ao representar o estado natural do cabelo. Comparativamente, a imagem do DALL-E 3 apresenta cabelos com uma textura lisa que parece uma massa congelada. Não cai sobre os ombros da mulher e esperamos ver alguns fios soltos ao redor da área do pescoço.
3. Texto ilegível ou com falhas
Embora as ferramentas modernas de IA possam detectar e gerar padrões, os geradores de imagens têm dificuldade em imitar texto. Isso é especialmente verdadeiro para escrita à mão, mas você terá dificuldade em encontrar uma imagem convincente gerada por IA contendo também muito texto impresso perfeitamente. Outro sinal revelador é a mensagem geral transmitida pelo texto. A IA pode colocar palavras isoladas com precisão onde necessário, mas quase certamente ainda não consegue formar frases completas.
O primeiro passo é procurar texto que pareça borrado ou pixelado, mesmo que o resto da imagem pareça impecável. Em seguida, inspecione cada personagem de perto para procurar símbolos ou letras sem sentido. Por fim, pergunte-se se o texto faz sentido no contexto da imagem. Por exemplo, a imagem inclui texto predominantemente em inglês num ambiente asiático?
Dê uma olhada na imagem acima, onde Midjourney tentou gerar texto na parte inferior. Meu melhor palpite é que a IA estava tentando emular uma marca d’água que aprendeu durante o treinamento. O resultado de má qualidade fala por si.
4. Sombras, iluminação e reflexos
Se você já se interessou por fotografia, sabe que a iluminação de uma cena pode ter um grande impacto na aparência final de uma imagem. Sombras e reflexos, em particular, podem parecer diferentes dependendo da hora do dia e da fonte de luz.
A IA pode ter dificuldade em renderizar reflexos realistas, então procure inconsistências na forma como a luz reflete em superfícies como água ou vidro. O mesmo vale para sombras. Faça a si mesmo estas perguntas: todos os objetos na imagem projetam uma sombra na mesma direção e a fonte de luz garante sombras suaves ou fortes? Finalmente, o tamanho ou a forma da sombra difere do objeto que ela representa?
5. Pele e superfícies lisas ou cerosas
Embora a versão mais recente do Midjourney tenha dificultado a percepção de quase todas as imperfeições anteriores que discutimos até agora, ela continua apresentando dificuldades em um aspecto: a textura da superfície. Os geradores de imagens de IA não conseguem recriar as variações sutis de objetos do mundo real, especialmente em materiais orgânicos como a pele. O resultado? Obtemos imagens que parecem quase fotorrealistas, mas com sinais de alerta óbvios, como pele cerosa e rostos lisos. Os resultados muitas vezes se assemelham às primeiras câmeras de smartphones com a configuração agressiva do modo de beleza habilitada.
Se a imagem contiver um ser humano, procure uma pele que pareça perfeita demais, sem manchas, poros ou rugas. Na verdade, todo o corpo do sujeito pode ter uma aparência plástica ou cerosa que parece estranha à primeira vista e claramente gerada por IA quando você sabe como procurá-lo.
6. Fundos fora de foco
Imagem de IA
A profundidade de campo, ou a área em foco em uma imagem, é comumente usada na fotografia profissional para chamar a atenção do observador para um assunto. No entanto, também pode ter o efeito oposto de parecer pouco natural em muitos cenários. Voltando às câmeras dos smartphones, as primeiras versões do modo retrato adicionariam um desfoque uniforme atrás dos assuntos, sem levar em conta a distância ou adicionar uma transição suave.
Da mesma forma, você pode notar fundos excessivamente desfocados em imagens geradas por IA. A profundidade de campo geralmente segue um gradiente natural, conhecido como queda, com objetos distantes ficando progressivamente desfocados à medida que se afastam. Se uma imagem parecer inconsistente nesta área, você pode ter uma amostra gerada por IA em mãos.
7. Dica bônus: use um serviço de detecção de imagens de IA
Na ausência de marcas d’água ou impressões digitais óbvias, teremos que recorrer a computadores para detectar o envolvimento de um gerador de imagens. Basta fazer upload de uma imagem para WasItAI ou AI ou Not e eles indicarão sua autenticidade.
Embora nenhum dos serviços identifique com precisão o conteúdo gerado por IA todas as vezes, ainda é um bom teste decisivo se você estiver em cima do muro.
8. Experimente a pesquisa reversa de imagens
Em 2023, o Google lançou uma nova ferramenta que informa quando a imagem foi indexada pela primeira vez pelo mecanismo de busca. Ele também pode detectar variações da mesma imagem, portanto, um simples corte ou edição não o enganará. Para acessar esse recurso, expanda uma imagem na pesquisa de imagens do Google e clique em Sobre esta imagem. Pode ser necessário abrir o menu flutuante (três pontos).
Você também pode enviar suas fotos e ativar a ferramenta para encontrar possíveis correspondências. Acesse images.google.com, toque no ícone da câmera e carregue sua imagem. Você verá um botão na parte superior que diz “Encontrar fonte da imagem”. Se o Google não conseguir encontrar nenhuma correspondência e a imagem envolver uma figura ou evento histórico famoso, provavelmente é gerada por IA.