Kris Carlon / Autoridade Android
DR
- O CEO da Microsoft AI gerou polêmica quando comparou a Internet a um “freeware” para treinamento em IA.
- Ele sugeriu que o “contrato social” da Internet permite o uso irrestrito de conteúdo público para treinamento em IA.
- A comunidade online reagiu fortemente, vendo sua postura como uma interpretação errônea do uso justo e um desrespeito aos direitos dos criadores de conteúdo.
Mustafa Suleyman, CEO da Microsoft AI, recentemente se viu no centro de um debate acalorado após uma declaração controversa feita no Aspen Ideas Festival. Ele sugeriu que a Internet funciona essencialmente como “freeware” para treinar modelos de IA, uma alegação que atraiu duras críticas de criadores de conteúdo e usuários em geral.
Por volta dos 13 minutos desta entrevista, o apresentador levantou preocupações sobre o treinamento de IA usando conteúdo online, abordando a presença de muitos autores na audiência e mencionando o uso de transcrições de vídeo do YouTube pela OpenAI para treinar seus modelos.
O entrevistador questionou quem deveria possuir a propriedade intelectual (PI) em tais casos e como os acordos comerciais em torno deles deveriam ser estruturados, sugerindo que as empresas de IA poderiam estar “roubando” a PI mundial.
Aqui está a resposta de Suleyman à pergunta:
No que diz respeito ao conteúdo que já está na web aberta, o contrato social desse conteúdo desde os anos 90 é o de uso justo. Qualquer um pode copiá-lo, recriar com ele, reproduzir com ele. Isso tem sido “freeware”, esse tem sido o entendimento. Há uma categoria separada em que um site, um editor ou uma organização de notícias disse explicitamente para não me rastrear ou raspar por qualquer outro motivo que não seja me indexar para que outras pessoas possam encontrar esse conteúdo. Essa é uma área cinzenta e acho que vai chegar aos tribunais.
As observações de Suleyman sugerem que os desenvolvedores de IA podem usar livremente a vasta quantidade de dados disponíveis online para treinar seus modelos. Essa visão parece ignorar as complexas questões legais e éticas que cercam a propriedade do conteúdo e os direitos de uso. O uso justo permite o uso limitado de material protegido por direitos autorais para fins como crítica, ensino ou pesquisa. No entanto, usar vastas quantidades de conteúdo para desenvolver modelos de IA vai além desses limites, especialmente quando há motivos comerciais claros envolvidos.
O comentário não foi muito bem recebido pela comunidade online, e muitos usuários do X (anteriormente Twitter) republicaram o vídeo com suas opiniões sobre suas opiniões. Figuras proeminentes da indústria de tecnologia, como Tom Warren, questionaram os padrões duplos da Microsoft, perguntando se a empresa se sentiria confortável com o fato de seu sistema operacional Windows ser tratado como freeware.
Outros, como o artista Denman Rooke, destacaram a diferença entre visualizar ou baixar arte online e usá-la para fins comerciais sem permissão, enfatizando que este último constitui roubo.
A Internet está repleta de conteúdos criados por jornalistas, artistas e muitos outros que dependem de ganhar dinheiro com o seu trabalho. Quando as empresas de IA usam esse conteúdo para treinar seus modelos sem permissão, elas estão tirando valor deles sem compensar os criadores originais. O entrevistador comparou isso a um autor fazendo referência a outros livros enquanto escrevia o seu próprio. Embora o autor não pague aos autores referenciados, eles ainda precisam comprar os livros ou pagar as taxas da biblioteca.
Para isso, Suleyman argumentou que o custo de produção de informação logo cairia para quase zero por causa da IA. Tradicionalmente, criar informação era caro, mas modelos de IA podem potencialmente reduzir o custo de produção de informação para quase nada.
Pelo que vale a pena, a OpenAI tem estado em uma farra recentemente, garantindo ativamente acordos de licenciamento de conteúdo com grandes empresas de mídia e plataformas online, incluindo Reddit, para usar seu conteúdo para treinar seus modelos GPT.
Este debate sublinha a necessidade urgente de orientações claras e padrões éticos no domínio da IA e também levanta questões mais amplas sobre o futuro da economia da informação e a necessidade de adaptação a um cenário tecnológico em rápida mudança.
O que você pensa sobre esse assunto? Compartilhe suas idéias nos comentários abaixo.