Início Tecnologia O Google acaba de bloquear 749 milhões de URLs do arquivo de...

O Google acaba de bloquear 749 milhões de URLs do arquivo de Anna

17
0
O Google acaba de bloquear 749 milhões de URLs do arquivo de Anna

Anna’s Archive, um site popular para pirataria de livros e artigos, parece estar na mira do Google, de acordo com a publicação TorrentFreak de direitos autorais e direitos digitais. Diz-se que o gigante das buscas bloqueou cerca de 749 milhões de URLs de arquivos de Anna de aparecerem nos resultados de busca, descobriu o TorrentFreak, depois de vasculhar um recente relatório de transparência.

A remoção não foi necessariamente direcionada, já que o Google remove regularmente conteúdo a pedido dos detentores de direitos autorais. No momento em que este artigo foi escrito, o Google retirou links para 15.125.359.564 páginas desde 2011. Mas este é o mais recente de uma saga contínua impulsionada pela IA que está vendo os detentores de direitos autorais reprimirem as chamadas “bibliotecas sombra”, e já representa cerca de 5% das remoções gerais do Google.

Anna’s Archive é uma plataforma para e-books piratas

Pessoalmente, eu não tinha ouvido falar do Arquivo de Anna, o que faz sentido – é um player mais recente na área. A plataforma surgiu em 2022, logo após sua antecessora, Z-Library, ter seus domínios apreendidos pelo Departamento de Justiça dos EUA. Desde então, ele tem operado silenciosamente em seu cantinho da Internet, servindo como um mecanismo de busca de código aberto para obras literárias com links para fontes gratuitas disponíveis ao público, quando existem, e uploads piratas, quando não existem. Assim como a Z-Library, ela foi bloqueada por ISPs alemães e processada nos EUA, mas continua operacional.

Você pode pensar nisso como o Pirate Bay, mas para obras literárias – mas em uma escala maior (impressionante, dado o quão novo é). O TorrentFreak observa que apenas 4,2 milhões de URLs do Pirate Bay foram retirados do Google, o que é insignificante em comparação com os números do Anna’s Archive.

A raspagem de IA pode ser um fator

Essa discrepância pode ser devida a pedidos de remoção mais agressivos por parte de editores e autores, já que mais de 1.000 usuários individuais emitiram solicitações de remoção até o momento, de acordo com os dados do Google. Isso inclui indivíduos e nomes maiores, como Penguin Random House, e sua diligência pode estar relacionada à posição dos Arquivos de Anna em relação à IA, já que o site admitiu que forneceu acesso gratuito a 30 desenvolvedores de LLM para treinar em seu “arquivo ilegal de livros” e ainda hospeda abertamente páginas de acesso gratuito para outros acessarem.

O rumo que os detentores de direitos autorais e leitores irão a partir daqui ainda está no ar. É importante observar que, apesar de todas as aparências em contrário, o Google não é dono da Internet. Remover um site de seu mecanismo de busca não impede que os usuários o visitem diretamente, e todos os três domínios do Anna’s Archive – annas-archive.org, annas-archive.se e annas-archive.li – permanecem ativos.

O que você acha até agora?

Além disso, o Anna’s Archive não hospeda nenhum conteúdo pirata, mas simplesmente fornece aos usuários links onde eles podem encontrá-lo. Tudo isso o coloca em uma área legal cinzenta, que, quando apoiada pela natureza de código aberto do site e pelo forte compromisso com o ideal de que “preservar e hospedar esses arquivos é moralmente correto”, significa que é provável que continue de uma forma ou de outra por anos.

Ainda assim, à medida que se descobre que empresas como a Meta usaram conteúdo pirata para treinar seus modelos de IA, é provável que as ações do Google se tornem mais comuns, e outros sites, ou mesmo entidades legais, possam seguir o exemplo. Planeje adequadamente. (E se, como eu, você está se perguntando “Quem diabos é Anna?”, o FAQ do arquivo tem uma resposta: “Você é Anna”. É um aceno aos uploaders anônimos que fornecem grande parte de seu material.)

Fuente