O jornal bloqueou o “rastreador da Web” da OpenAI, o que barra a empresa de usar o conteúdo do jornal para treinar modelos de IA.
O The New York Times (NYT), um dos principais veículos de comunicação dos EUA, bloqueou o “rastreador da Web” da OpenAI. Isso significa que a empresa dona do ChatGPT não pode usar o conteúdo do jornal para treinar seus modelos de inteligência artificial (IA).
Para quem tem pressa:
- O The New York Times (NYT), um dos principais veículos de comunicação dos EUA, bloqueou o “rastreador da Web” da OpenAI;
- Na página “robots.txt” do NYT, consta que o jornal não permite o GPTBot, o rastreador que a OpenAI anunciou no começo do mês;
- Isso significa que a empresa dona do ChatGPT não pode usar o conteúdo do jornal para treinar seus modelos de inteligência artificial (IA).
A mudança ocorre após o NYT atualizar seus termos de serviço, no começo de agosto, para proibir o uso de seu conteúdo para treinar modelos de IA. Na página “robots.txt” do NYT, consta que o jornal não permite o GPTBot, o rastreador que a OpenAI anunciou no começo do mês.
O NYT também está considerando entrar com uma ação legal contra a OpenAI por violações de direitos de propriedade intelectual.
OpenAI vs The New York Times
O jornal estadunidense atualizou seus termos de serviço em 3 de agosto. Nesta atualização, o veículo proibiu a extração do conteúdo produzido pela sua equipe para treinamento de aprendizado de máquina ou sistema de IA.
Além de textos, entram no conteúdo proibido pelo veículo: fotografias, imagens, ilustrações, designs, áudio, vídeos etc.
Sobre a ação legal contra a OpenAI, o caso é o seguinte:
- Nas últimas semanas, a empresa e o NYT estiveram envolvidos em tensas negociações para tentar chegar a um acordo de licenciamento;
- A OpenAI quer pagar o jornal para usar sua extensa biblioteca de conteúdo em ferramentas alimentadas por inteligência artificial;
- As discussões se tornaram tão controversas que o jornal considera mover uma ação legal;
- Um processo de um gigante como o NYT pode se tornar a maior disputa legal do momento em defesa dos direitos autorais em meio ao boom da IA generativa.
Se processasse, o Times se juntaria a outros como Sarah Silverman e dois outros autores que processaram a empresa, em julho, pelo uso do Books3 – um conjunto de dados usado para treinar o ChatGPT que pode ter milhares de trabalhos protegidos por direitos autorais.
Além deles, Matthew Butterick, programador e advogado, alega que as práticas de coleta de dados da empresa equivalem a pirataria de software.
Fonte: Olhar Digital