A Meta foi processada mais uma vez sob a acusação de violar direitos autorais para o treinamento de IA. A ação junta processos movidos por diversos autores, incluindo a comediante Sarah Silverman e o vencedor do Prêmio Pulitzer Michael Chabon, e alega que a empresa sabia dos perigos de usar os livros com direitos protegidos, mas teria prosseguido mesmo assim. As informações são da agência Reuters.
O processo foca no treinamento do modelo de linguagem LLama e traz como evidência uma conversa obtida no Discord envolvendo o pesquisador Tim Dettmers, que contribuiu com a pesquisa de IA da Meta. Ele revela que teve discussões com o departamento jurídico da Meta para descobrir se o uso dos livros seria “legalmente ok” em 2021.
Dettmers comenta o uso do The Pile, uma base de dados com mais de 800 GB usada para o treinamento de grandes modelos de linguagem. “No Facebook, existem muitas pessoas interessadas em trabalhar com o The Pile, eu incluso, mas na forma atual, não podemos usá-lo por motivos legais” diz uma das mensagens adicionadas ao processo.
O material ainda revela que os livros com direitos autorais ativos seriam o maior motivo de preocupação dos advogados. Colegas sugeriram que os dados deveriam “se enquadrar no fair use”, uma doutrina legal dos EUA que possibilita o uso de material protegido por direitos autorais sem permissão em alguns casos.
Durante o lançamento da primeira versão do Llama, em fevereiro deste ano, a Meta publicou todos os datasets usados no treinamento e incluiu a seção Books3 do The Pile. O documento do processo revela que a base de dados possui mais de 196 mil livros. Já o Llama 2, lançado posteriormente pela Big Tech, não teve os datasets revelados.
A Meta e Tim Dettmers ainda não responderam publicamente sobre o caso.
Mais um processo
Nada de novo sob o sol: este é mais um processo contra uma gigante da tecnologia na acusação de violar direitos autorais no treinamento de IA. Meta e OpenAI já foram processadas em outras ocasiões, com casos em andamento na justiça norte-americana.
A própria Sarah Silverman já processou ambas as empresas anteriormente, em julho deste ano. O resultado saiu em novembro, com desfecho negativo para a autora: um juiz dos EUA rejeitou parte das acusações, mas ainda permitiu que as pessoas por trás da ação ainda modificassem as queixas para análise futura.
Fonte: Canal Tech