DR
- O CTO da OpenAI afirma que o gerador de texto para vídeo da empresa estará disponível ao público ainda este ano.
- Ela planeja eventualmente incorporar áudio nos vídeos gerados por IA.
- A empresa afirma que está tentando disponibilizar a ferramenta com custos semelhantes ao DALL-E.
No início deste ano, o criador do ChatGPT, OpenAI, exibiu seu novo modelo de IA generativa de texto para vídeo, chamado Sora. Na época, a ferramenta de IA estava disponível apenas para os Red Teamers. No entanto, parece que a empresa está planejando lançar publicamente a ferramenta em breve.
Em entrevista com Jornal de Wall Street, A diretora de tecnologia (CTO) da OpenAI, Mira Murati, falou sobre os planos da empresa para Sora. Durante a entrevista, Murati mencionou que a ferramenta de IA estaria disponível “este ano” e que poderia estar pronta em alguns meses.
O CTO prosseguiu dizendo que a OpenAI quer possibilitar que os usuários possam editar os vídeos produzidos pela Sora. E no futuro, a empresa também planeja incorporar áudio aos vídeos gerados por IA.
Parece que Sora é um modelo de IA caro para operar, já que Murati disse à publicação que é “muito mais caro” para alimentar do que outros modelos. Apesar disso, a OpenAI pretende tornar a ferramenta “disponível a custos semelhantes” ao DALL-E – sua ferramenta de IA de texto para imagem.
Como outras ferramentas generativas de IA, Sora precisa ser treinado em dados para produzir conteúdo relevante. Quando questionado sobre quais dados foram usados para treinar Sora, o CTO pareceu hesitante em fornecer uma resposta. “Não vou entrar em detalhes sobre os dados que foram usados, mas eram dados publicamente disponíveis ou licenciados”, disse Murati ao WSJ. Embora ela tenha confirmado que Sora usa conteúdo do Shutterstock – com o qual a OpenAI tem parceria – ela não tinha certeza se Sora também pegou emprestado do YouTube, Facebook e Instagram.
Quanto às barreiras de proteção para ajudar a prevenir a propagação da desinformação, Murati diz que os vídeos terão marca d’água e provavelmente não serão capazes de gerar imagens de figuras públicas. Resta saber se isto será suficiente para deter a desinformação, mas as marcas de água já foram quebradas antes.