Edgar Cervantes / Autoridade Android
DR
- OpenAI anunciou Voice Engine, um novo sistema de IA capaz de recriar vozes humanas.
- A empresa está testando este produto com “um pequeno grupo de empresas”.
- A OpenAI está mantendo a privacidade por enquanto para examinar os perigos potenciais (e óbvios).
OpenAI, a empresa por trás do ChatGPT, tem estado em alta ultimamente. O sucesso do ChatGPT tem sido surpreendente, é claro, mas a empresa também anunciou recentemente o Sora, um sistema capaz de criar videoclipes de 60 segundos que parecem muito realistas. Agora, a empresa anunciou um novo sistema chamado Voice Engine, que pode recriar vozes humanas (via O jornal New York Times).
Assim como Sora, a OpenAI não permite que o público use o Voice Engine – pelo menos não ainda. Por enquanto, a empresa está testando o sistema de forma privada com “um pequeno grupo de empresas”. Obviamente, a razão pela qual isto é feito é devido às enormes implicações éticas de um sistema que pode imitar a voz de uma pessoa real.
O jornal New York Times pude demonstrar o sistema e compartilhei alguns clipes, que você pode ouvir no link anterior. O primeiro clipe é uma gravação de 16 segundos de um homem real com forte sotaque português. Ele se apresenta e diz que está fazendo este clipe para “ajudar as pessoas não-verbais a se expressarem de forma mais plena”. O próximo clipe é a recriação de sua voz pelo Voice Engine dizendo algo completamente diferente. Ainda outro clipe é uma recriação da voz do homem, mas falando em português em vez de inglês.
Ambos os clipes do Voice Engine não têm o mesmo som do clipe original. No entanto, eles estão absolutamente próximos o suficiente para que alguém que conhecesse a voz daquele homem provavelmente enganasse, fazendo-o pensar que ele realmente disse essas coisas.
O que é assustador nisso é a possibilidade de usar uma ferramenta como essa para espalhar desinformação. Políticos, celebridades e jornalistas poderiam facilmente ter suas vozes cooptadas pelo Voice Engine e depois dizer o que quisessem. Com um pouco de edição e uma trilha de vídeo convincente, quem sabe o que poderia ser feito?
Existem também sistemas de autenticação de voz usados em todo o mundo para segurança. É muito possível que o Voice Engine permita que as pessoas enganem esses sistemas, colocando em risco informações confidenciais.
“Isso é uma coisa sensível”
O gerente de produto da OpenAI, Jeff Harris, disse: “Isso é uma coisa delicada e é importante acertar”. A OpenAI está experimentando sistemas de marca d’água para ajudar a diferenciar as gravações reais das sintéticas. A equipe também está aberta sobre os problemas éticos que este sistema levanta.
No entanto, também argumenta que o Voice Engine pode fazer muito bem. Por exemplo, pessoas que antes conseguiam falar, mas perderam a voz mais tarde na vida, poderiam começar a comunicar novamente usando um fac-símile da sua própria voz. O físico Stephen Hawking é um exemplo famoso de pessoa que poderia ter se beneficiado de um serviço de voz como este. O Voice Engine também poderia preservar as vozes de pessoas que não estão mais vivas e também trabalhar em muitos ambientes comerciais, como na criação de audiolivros.
A OpenAI afirma que ainda não tem planos para o lançamento público do Voice Engine. Assim como Sora, ele só quer demonstrar o que pode fazer.