Início Tecnologia Imagens de arquivamento do dispositivo Wayback caem

Imagens de arquivamento do dispositivo Wayback caem

20
0
Imagens de arquivamento do dispositivo Wayback caem

O Wayback Device do Web Archive é uma fonte indispensável que faz especificamente o que afirma no nome da empresa sem fins lucrativos: arquiva a rede. O Web Archive é responsável por arquivar cerca de 500 milhões de páginas da web diariamente.

No entanto, tem havido uma adaptação preocupante ao sistema nos últimos meses. De acordo com um novo registro do Laboratório Nieman, o Dispositivo Wayback do Web Archive tem arquivado sites específicos muito menos recentemente. Ainda mais preocupante: muitos desses sites são relacionados a notícias.

De acordo com o registro do Laboratório Neiman, a Wayback Device arquivou 1,2 milhão de imagens das páginas iniciais de 100 sites de notícias importantes entre 1º de janeiro e 15 de maio de 2025. Inesperadamente, porém, em meados de maio, isso mudou.

A Wayback Device acabou de tirar 148.628 fotos das mesmas páginas iniciais de 100 sites de notícias entre 17 de maio e 1º de outubro de 2025. Isso representa uma redução monstruosa de 87 por cento no número de páginas arquivadas entre os primeiros quatro meses do ano e os cinco meses anteriores.

A página inicial da CNN, por exemplo, foi arquivada pelo Wayback Device 34.524 vezes entre 1º de janeiro e 15 de maio. Desde então, apenas 1.903 fotos da página inicial permanecem no Wayback Device.

Velocidade da luz mashável

VEJA ADICIONALMENTE:

O Web Archive acabou sendo a principal biblioteca do governo do estado unido

Mashable relatou em julho que, graças a uma nova classificação do legislador do estado dourado Alex Padilla, o Web Archive certamente se inscreverá em uma rede de mais de 1.000 coleções em todo o país encarregadas de arquivar registros do governo federal para visão pública.

Mark Graham, supervisor da Wayback Device, disse ao Nieman Laboratory que “um mau funcionamento em alguns projetos de arquivamento de dados em maio… fez com que menos arquivos fossem desenvolvidos para alguns sites”. De acordo com Graham, muitas das fotos perdidas simplesmente ainda não tiveram sua estrutura de índice desenvolvida e certamente seriam incluídas no arquivo do Wayback Device em breve.

Como o Laboratório Nieman mencionou, um atraso de cinco meses devido a preocupações com índices é incomum. De acordo com Graham, o Web Archive tem enfrentado atrasos devido a “diferentes fatores funcionais”, como a “alocação de fontes”. O Web Archive não explicou nem forneceu mais informações ao Laboratório Nieman sobre o problema.

Na verdade, os documentos foram arquivados há muito tempo para o documento histórico. No entanto, na era da Internet, muitos jornais, além dos titãs da mídia tradicional, na verdade, em sua maioria, foram desarquivados recentemente. Os sites da mídia de informação tomaram sua posição como documento histórico. E, desde 1996, o Arquivo da Web assumiu a função de manter esses arquivos de páginas da web.

No entanto, a organização sem fins lucrativos tem enfrentado problemas recentemente. Conforme registra o Laboratório Nieman, as despesas do Web Archive em 2023 foram de US$ 32,7 milhões. São necessárias muitas fontes não apenas para invadir a rede, mas também para salvar os dados. A organização sem fins lucrativos gerou apenas US$ 23 milhões em ganhos exatamente no mesmo ano.

Além disso, o Web Archive reduziu em outubro passado uma violação substancial de informações que deixou o site, juntamente com o Wayback Device, offline. Demorou semanas para o site ser totalmente recuperado.

.

Fuente