A internet está a “desaparecer”. Mas há quem lute por preservar a história digital

2 horas atrás 28

Os números são claros: 38% das páginas de internet publicadas até 2013 já desapareceram. O mesmo aconteceu com 25% das que foram publicadas na última década. A corrida para preservar este histórico digital está em curso, mas não é fácil.

É um comum dizer-se que a velocidade a que tudo se move na internet é avassaladora. Também é normal afirmar-se que uma vez na net, para sempre na net. Afinal, parece que não é bem assim. Muitas páginas que talvez muita gente acedeu vezes sem conta estão a desaparecer sem deixar grande pegada digital.

Por isso, as plataformas de arquivamento digital estão a enfrentar uma corrida contra o tempo para salvar a vasta quantidade de informação que desaparece da internet a cada ano. É que uma investigação recente revela que 25% das páginas web publicadas entre 2013 e 2023 já desapareceram.

Fonte: Análise do Pew Research Center de uma seleção aleatória de URLs recolhidos pelo repositório Web Common Crawl (n=999.989) e verificados utilizando códigos de resposta de página e DNS. As páginas Web foram definidas como inacessíveis se devolvessem um código de estado de 204, 400, 404, 410, 500, 501, 502, 503, 523 ou não devolveram um código de estado válido. “Quando o conteúdo online desaparece”

A Internet Archive, uma organização sem fins lucrativos, tem desempenhado um papel vital neste esforço, com o objetivo de preservar uma vasta gama de conteúdos digitais. Fundada em 1996, já arquivou mais de 866 mil milhões de páginas web, bem como livros, vídeos e outros materiais culturais.

Mas a verdade é que a história digital da humanidade está em risco devido à fragilidade da internet. Ao contrário de artefactos físicos como manuscritos antigos ou livros históricos, o conteúdo online é mais efémero.

Empresas fecham, websites são descontinuados, e informação importante desaparece num ciclo constante. Este problema é mais visível com o passar do tempo, sendo que 38% das páginas web que existiam em 2013 já não estão acessíveis.

Problema estende-se aos governos

Mesmo as instituições governamentais não estão imunes a este fenómeno. O estudo mostra que uma em cada cinco páginas web de governos contém ligações quebradas, o que compromete a integridade das informações que deveriam ser preservadas para futuras gerações.

Mais de metade dos artigos da Wikipédia também enfrentam este problema, o que significa que as fontes citadas podem deixar de estar disponíveis para consulta.

No entanto, o esforço de arquivamento enfrenta desafios significativos. As organizações que pugnam pela preservação desta história digital estão sujeitas a problemas financeiros, ataques cibernéticos, e batalhas legais, especialmente com empresas que não querem que as suas criações intelectuais sejam armazenadas gratuitamente.

A Internet Archive, por exemplo, utiliza o seu projeto Wayback Machine para capturar múltiplas versões de uma página ao longo do tempo, permitindo que o público aceda a versões anteriores de websites, muitas vezes gratuitos.

Além da Internet Archive, outras organizações, como a Biblioteca do Congresso dos EUA, têm os seus próprios projetos de arquivamento, preservando websites governamentais e notícias. Também há esforços específicos em certas regiões, como no Reino Unido, onde o UK Web Archive captura uma imagem da internet britânica anualmente.

Com o rápido avanço da tecnologia, a maior parte da nossa vida social, cultural e intelectual migrou para o espaço virtual.

É por isso que manter um registo digital do nosso tempo é fundamental para que futuras gerações compreendam a era em que vivemos, tal como hoje estudamos documentos históricos.

Ler artigo completo