
Autoridade Mishaal Rahman / Android
Tendo passado algum tempo com a IA generativa, pensei em ter uma boa idéia do que esperar do Veo 3-gerador de vídeo de AI de ponta do Google. Mas quando eu finalmente acelerei os US $ 20 por uma assinatura do Google AI Pro algumas semanas atrás, fiquei surpreso ao descobrir que ele superou até as minhas expectativas mais otimistas. Ao contrário dos primeiros geradores de imagens de IA que produziriam deformidades óbvias, como dedos extras ou arquitetura absurda, o VEO 3 do Google pode gerar vídeos que parecem surpreendentemente semelhantes aos seus equivalentes do mundo real.
De fato, alguns dos vídeos da Veo podem parecer tão convincentes nas mídias sociais que eu tive que verificar se estava olhando para o conteúdo gerado pela IA ou em um clipe de ações. Naturalmente, isso levou à pergunta: quão bom é o VEO 3, realmente-e a pessoa comum poderia dizer que está olhando para um vídeo gerado pela IA? Para descobrir, montei um pequeno questionário abaixo com seis clipes gerados por veo contra vídeos do mundo real. Você pode dizer a diferença?
Vídeos gerados pela IA com Veo 3: assustadoramente bom

Autoridade Mishaal Rahman / Android
A capacidade do Veo 3 de gerar clipes extremamente convincentes é impressionante por si só, mas também vai um passo adiante: também pode produzir efeitos de fala ou sonora sincronizados. Isso significa que os resultados que produz podem parecer quase indistinguíveis do negócio real para o olho não treinado.
Obviamente, existem sinais reveladores apontando para as origens da IA de um vídeo sintético, se você olhar de perto, mas pode esperar que essas pequenas imperfeições sejam desaparecidas mais cedo ou mais tarde. O Google já enviou inúmeras correções para o VEO 3 desde a sua estréia na E/S, incluindo uma recente que impede que o texto de legenda viscível apareça.
Para gerar um vídeo usando o VEO 3, você precisará de uma assinatura do Google AI Pro ou Ultra. Isso custará um mínimo de US $ 20 por mês, para não falar nada do nível mais alto que custa US $ 250 por mês. E mesmo assim, você obtém apenas uma quantidade limitada de créditos de geração por mês.
O Google VEO 3 é caro e extremamente limitado, mas ainda é muito capaz.
A lista de limitações do VEO 3 não termina aí. Você só pode gerar vídeos extremamente curtos no momento – não mais que oito segundos cada. Dito isto, o Google Flow, uma ferramenta experimental de cinema de IA, permite encadear vários clipes gerados por Veo para criar um vídeo mais longo. Duração à parte, a outra grande limitação é que você só pode gerar vídeos de 720p com o VEO 3 no momento.
O VEO 3 custa muito dinheiro ao Google em termos de processamento – e, embora não saibamos o custo interno exato para o Google, sabemos o que os desenvolvedores são cobrados para usar o VEO 3 por meio de uma API. Cada segundo de vídeo com áudio custa US $ 0,75 para gerar, enquanto os clipes silenciosos custam US $ 0,50 por segundo. Isso significa que um vídeo de 8 segundos custa aos desenvolvedores de até US $ 6 por geração. Multiplique isso por apenas alguns clipes e fica claro por que o Google limita quantas gerações você recebe com uma assinatura de US $ 20 Pro. O custo dessa tecnologia provavelmente está longe de ser trivial.
Então, o VEO 3 vale esse preço principesco? Isso nos leva de volta à pergunta original: você pode realmente dizer a diferença entre um vídeo do mundo real e um gerado pela IA? Abaixo, alinhei seis clipes curtos – vamos ver se você pode identificar qual é qual.
VÍDEO 1: Combine Harvester
Vamos começar com um fácil. Este é relativamente simples de escolher se você estiver olhando de perto. A versão gerada pela IA não replica muitos dos detalhes do mundo real que você esperaria em uma cena agrícola genuína. O céu, as máquinas agrícolas e os elementos de fundo menores parecem um pouco limpos e uniformes. Mas, para ser justo, dei ao VEO 3 um prompt bastante curto e não descritivo.
Considerando isso, o VEO 3 realmente fez um excelente trabalho. Se você não estivesse olhando para o vídeo lado a lado com imagens reais, ele poderia facilmente passar pela coisa real. O mais impressionante é que eu pedi um esquema de cores de máquinas específico e até mencionei o nome da marca, e o Veo 3 entregue nas duas frentes. Isso mostra o quão bom é esse modelo no seguinte contexto e direção – mesmo que ainda não acerte os detalhes mais delicados.
Vídeo 2: esquilo comendo uma noz
Outra relativamente fácil. Enquanto a versão do Veo 3 chega impressionantemente, especialmente com os movimentos sutis do corpo e o som ambiente surpreendentemente convincente, ela fica aquém quando colocada ao lado de filmagens reais. O esquilo da IA parece um pouco limpo e o fundo é muito escuro – embora meu aviso possa ser o culpado. A parte mais impressionante, no entanto? Eu instruí o VEO 3 a me concentrar no pêlo do esquilo com uma profundidade de campo rasa e ele entregue.
Eu acho que o que o revela é a falta de qualquer autenticidade imprevisível que você obtém com animais reais. No clipe de estoque, o esquilo se atrapalha com a porca, morde mais do que pode mastigar (literalmente) e tem um pouco mais de caráter. Ainda assim, se você visse o clipe da IA por conta própria, provavelmente nunca o questionaria.
Vídeo 3: Um mercado noturno movimentado na Tailândia
O VEO 3 mostra seus pontos fortes aqui, pregando a atmosfera geral – a movimentada energia e o senso de movimento. Se você nunca esteve na Tailândia, os dois vídeos podem parecer igualmente convincentes.
Mas olhe mais de perto e as rachaduras começam a aparecer. As barracas são uniformes demais e carecem da desordem visual que você veria em um mercado noturno real. Os fornecedores também parecem estar vendendo itens aleatórios e incompatíveis que não fazem muito sentido lado a lado. E se você olhar para os movimentos das mãos dos fornecedores, verá que eles são bastante naturais. Este é um sinal revelador clássico de IA generativa, e o gerador de vídeo do Google não é imune a esse problema.
Ainda assim, esta é uma cena difícil de fazer e, considerando a complexidade, a tentativa do Veo 3 é meio decente.
Vídeo 4: um caminhante e nolling névoa
Essa cena é talvez a mais impressionante do grupo. Sem a desordem de elementos da cidade ou interações complexas de personagens, o VEO 3 pode realmente brilhar. Mesmo com iluminação dramática, paisagens cênicas e efeitos atmosféricos como o nevoeiro, ela realmente não suará. Ajuda que o clipe do mundo real também pareça impressionante, quase como algo fora de um videogame.
Isso torna este genuinamente complicado de adivinhar. Precisa de uma dica? Olhe atentamente para a mão esquerda do caminhante e você notará um soluço sutil de renderização que quebra a ilusão.
Vídeo 5: rebanho de cabras
Outro difícil. O VEO 3 oferece um resultado impressionante aqui e, à primeira vista, é realmente difícil contar ao vídeo gerado pela IA, além da coisa real. O ritmo e o movimento das cabras parecem convincentes o suficiente.
Não sei se seria capaz de diferenciá-los, mas sabendo qual é gerado pela IA, posso escolher esquisitices sutis. Por exemplo, o chão no clipe da IA parece um pouco plano demais. Os rostos e corpos das cabras também são estranhamente suaves, enquanto os animais reais têm alguma sujeira neles. Ainda assim, não há uma única falha gritante – é mais uma sensação.
Com que precisão você pode identificar vídeos gerados pela IA?
Quantos vídeos você adivinhou corretamente?
1 votos
Alguns dos clipes acima eram mais fáceis de detectar do que outros, mas se você se viu a adivinhar até mesmo os óbvios, você não está sozinho. Quando os vídeos gerados pela IA recebem a iluminação, os ângulos da câmera e os assuntos, principalmente, pode se tornar surpreendentemente difícil de identificar. Não tenho certeza se teria pegado muitas das falsificações sem uma comparação direta, apesar de ter olhado para centenas ou milhares de imagens geradas pela IA.
À medida que a tecnologia se torna mais barata, você pode esperar que os vídeos feitos usando o VEO 3 se tornem mais comuns. O Google atualmente adiciona uma pequena marca d’água ao canto inferior direito de todos os vídeos gerados pela IA, mas se você não percebeu acima, é porque eu o cortei em todos os clipes. Isso levou alguns minutos por vídeo, o que significa que precisamos encontrar uma maneira nova e mais eficaz de lidar com o dilúvio iminente de vídeos falsos na Internet. Não sei qual é a solução, mas espero que a equipe de ética da IA do Google faça.
Obrigado por fazer parte da nossa comunidade. Leia nossa política de comentários antes de postar.
