Tecnologia

Veículos de imprensa bloqueiam o arquivo que preserva 30 anos de memória da internet

Medo de scrapers de IA levou 241 portais a fechar as portas para a Wayback Machine — a mesma ferramenta que usam nas próprias reportagens
Emblema Wayback Machine sob ameaça de IA, mostrando o bloqueio de jornais contra inteligência artificial

A plataforma que guarda mais de um bilhão de páginas da internet está sendo silenciada por quem mais a usa. Em nome da proteção contra a inteligência artificial, grandes jornais do mundo bloquearam o acesso da Wayback Machine aos seus arquivos.

A Nieman Foundation for Journalism, de Harvard, identificou pelo menos 241 portais de notícias em nove países que já fecharam as portas para o archive.org — entre eles The Guardian, New York Times, Le Monde e USA Today.

O Internet Archive, organização sem fins lucrativos sediada em São Francisco, mantém a Wayback Machine há 30 anos. A plataforma é uma ferramenta indispensável para jornalistas que precisam acessar páginas alteradas ou deletadas, para pesquisadores rastreando a evolução de documentos públicos e para juristas que dependem de provas digitais em processos.

O paradoxo dos que bloqueiam o que usam

A contradição fica evidente no caso do próprio USA Today. O jornal publicou recentemente uma reportagem revelando como a polícia de imigração americana, o ICE, havia ocultado informações sobre sua política de detenção — e usou a Wayback Machine para embasar a apuração. O mesmo veículo, porém, hoje bloqueia o acesso da plataforma aos seus conteúdos.

O motivo declarado é o medo de que empresas como OpenAI e Google usem os arquivos para treinar modelos de linguagem sem autorização e sem pagamento. Dados confirmam que robôs de IA rastreiam o archive.org em busca de exatamente o conteúdo que lhes é negado diretamente pelas editoras.

Mark Graham, diretor da Wayback Machine, revelou à revista Wired que algumas dessas empresas chegaram a fazer dezenas de milhares de requisições por segundo — sobrecarregando temporariamente os servidores da organização.

A Electronic Frontier Foundation (EFF) comparou a atitude dos veículos de imprensa à de um jornal que proibisse bibliotecas de guardar exemplares de sua edição impressa. Desde então, mais de 100 jornalistas assinaram uma petição em apoio ao Internet Archive.

Crise se acumula sobre o Internet Archive

Não é a primeira vez que o archive.org luta pela sobrevivência. Em setembro de 2024, um ataque hacker resultou no roubo de dados de 31 milhões de contas de usuário. No mesmo ano, as editoras Hachette, Penguin Random House, HarperCollins e Wiley venceram um processo de direitos autorais contra o programa gratuito de empréstimo de e-books lançado durante a pandemia, forçando a retirada de mais de 500 mil livros da plataforma — e deixando o archive.org exposto a pedidos de indenização na casa dos milhões.

Para Martin Fehrensen, jornalista especializado em mídia e fundador do socialmedia watchblog.de, a ameaça atual é estruturalmente mais grave do que as anteriores. “O archive.org é o único registro funcional da web aberta”, afirma ele. Diferentemente de uma decisão judicial ou de uma atualização técnica, os bloqueios são resultado de inúmeras decisões corporativas individuais que, somadas, minam a essência da plataforma.

Fehrensen defende uma solução em duas frentes: no curto prazo, diálogo com as editoras e uma separação técnica clara entre arquivamento e treinamento de IA. A médio prazo, criação de um marco jurídico específico para arquivos da web. E, a longo prazo, que o arquivamento da internet seja tratado como infraestrutura pública, não como projeto isolado de uma ONG.

Mark Graham disse à Wired estar em negociações com empresas de jornalismo para reaver o acesso. O desfecho permanece incerto. “Não há dúvida de que o bloqueio crescente de grande parte da internet pública prejudica a capacidade da sociedade de compreender o que está acontecendo em nosso mundo”, reconheceu o próprio diretor.

escrito com o apoio da inteligência artificial
este texto foi gerado por IA sob curadoria da equipe do Tropiquim.
todos os fatos foram verificados com rigor.
Leia mais

Receita dos Correios com pacotes internacionais desaba 73% em 2025

Motta e Alcolumbre apoiam PL que reduz impostos sobre combustíveis em conflitos

Cármen Lúcia propõe brigadas eleitorais para proteger candidatas em 2026

Minha Casa Minha Vida eleva teto de reforma para R$ 50 mil e amplia renda elegível