28.5 C
Brasília
sexta-feira, fevereiro 7, 2025

Meta baixou mais de 81 TB de livros piratas via torrent para treinar IA

- Advertisement -spot_imgspot_img
- Advertisement -spot_imgspot_img

A Meta, empresa dona de serviços como Facebook, Instagram e WhatsApp, baixou uma alta quantidade de livros ilegalmente e usou essas obras para treinar a inteligência artificial (IA) da empresa. Documentos apresentados em um processo encarado pela empresa nos Estados Unidos, incluindo emails trocados pela equipe, confirmam a acusação.

O caso foi revelado durante uma ação judicial encarada pela Meta e movida por vários artistas e escritores. Eles alegam que a marca fez o download de cópias de obras por fontes ilícitas e, também sem qualquer compensação, alimentaram o modelo de linguagem da empresa — que pode gerar conteúdos e responder perguntas de usuários usando esse conteúdo. Há um segundo processo similar também em andamento nos Estados Unidos.

A Meta até já havia admitido que baixou bases de dados inteiras de fontes piratas, como o LibGen. Porém, as novas mensagens publicadas dão mais detalhes do que aconteceu: além dos 80,6 TB dessa primeira fonte, a companhia fez o download de mais 35,7 TB de livros da plataforma em uma tentativa posterior e de ao menos 81,7 TB de dados do Anna”s Archive, outro serviço que disponibiliza obras sem direitos autorais.

A Meta AI possivelmente se beneficiou de livros baixados ilegalmente. (Imagem: Reprodução/Meta AI)

A situação da Meta pode piorar devido ao método utilizado: a obtenção via torrent significa que a companhia ajudou a alimentar o download pirata de livros por outros usuários, já que ela serviu como fornecedora de seeds para a comunidade. Até o momento, a companhia não forneceu os detalhes solicitados pela acusação sobre os downloads realizados.

Funcionários e até Zuckerberg sabiam da ilegalidade

As mensagens trocadas pela equipe da Meta confirmam que todos estavam conscientes de que o download via torrent de livros de bases de dados como a do LibGen era uma atividade ilegal, que poderia comprometer contratos comerciais ou complicar a empresa no futuro.

Baixar torrent de um laptop corporativo não parece certo“, disse um dos pesquisadores da Meta, Nikolay Bashlykov, em uma das mensagens — com o texto acompanhado de um emoji de risada. Em outro recado, um funcionário sugere que “o modelo da OpenAI é provavelmente treinado” em bases parecidas, enquanto outro diz que usar uma VPN para mascarar a conexão durante o download seria uma alternativa viável.

Esse debate indica que a companhia tentou ao máximo esconder as atividades, usando servidores de fora da empresa para evitar que os dados fossem ligados à dona do Facebook. Ela teria até modificação as configurações do cliente de torrent para enviar o mínimo possível de seeds para outros usuários.

O nome do CEO e cofundador Mark Zuckerberg também é citado. Em uma mensagem, um colaborador informa que a “decisão de usar” o LibGen como fonte aconteceu “após a situação escalar para o MZ“, indicando que ele aprovou ou ao menos foi informado do processo — contrariando depoimentos anteriores que negavam o envolvimento do executivo.

O que diz a Meta

A Meta ainda não se pronunciou sobre a publicação das novas provas. Anteriormente, a companhia sugeriu que o treinamento da IA a partir de bases de dados e livros inteiras era uma questão de “fair use” ou de boa fé — o uso aceitável de uma obra intelectual para determinados fins sem a exigência de autorização ou pagamento ao proprietário.

Com as evidências em mãos, os advogados de acusação agora querem chamar novamente certas testemunhas, principalmente porque as respostas iniciais agora são consideradas contraditórias. Eles acreditam que a adição do argumento de que a empresa tentou esconder o download e pode ter colaborado na disponibilidade dos arquivos via torrent pode agravar o caso.

O antigo advogado da empresa no caso, Mark Lemley, pediu demissão após as mudanças da empresa para agradar o presidente Donald Trump.

[Fonte Original]

- Advertisement -spot_imgspot_img

Destaques

- Advertisement -spot_img

Últimas Notícias

- Advertisement -spot_img