Mark Zuckerberg, CEO da Meta, durante convenção da empresa em 2023
De acordo com a acusação, funcionários da gigante alertaram que o LibGen era “um conjunto de dados que sabemos ser pirata”, no entanto Mark Zuckerberg deixou explicito a intenção de usar os dados no treinamento da IA.
O processo também menciona um documento que circulou entre diretores da área de IA da Meta, no qual há a explicita ordem de usar o conteúdo ilícito. Além disso, a empresa teria tentado encobrir a infração ao remover dados de atribuição ao LibGen.
A estratégia de apagar os rastros do conteúdo seria um roteiro criado por um dos engenheiros da Meta, Nikolay Bashlykov, onde palavras como “copyright” dos arquivos acessados eram apagadas. Segundo a acusação, isso indica que a empresa não só usava os dados para treinamento de modelos de linguagem, mas também tinham a intenção de ocultar a violação.
O processo se tornou público porque o juiz Thomas Hixson rejeitou um pedido de sigilo feito pela gigante, no qual, segundo o magistrado, não visava proteger informações sensíveis, mas sim evitar publicidade negativa.
No último ano, empresas desenvolvedoras de IA viraram alvo de processos sobre o uso sem autorização de obras protegidas para o treinamento de grandes modelos. E na maioria das vezes, réus como a Meta baseiam suas defesas na mesma “doutrina do uso justo”.
Casos como esse já aconteceram antes, por exemplo quando o jornal americano The New York Times abriu um processo judicial contra a OpenAI, dona do ChatGPT, e a Microsoft por violação de direitos autorias em 2023.
UOL