Parte do arquivo da internet está desaparecendo para sempre; entenda

Hoje encontramos praticamente de tudo na internet. É possível procurar desde uma simples receita de bolo até informações valiosas sobre o passado da humanidade.

No entanto, como a produção humana de conteúdo está cada vez maior, é necessário mais e mais espaço para guardar todas estas informações. E é aí que temos esbarrado em um grande desafio. Parte destas informações estão sumindo para sempre.

Parte das páginas da web não existem mais

  • Segundo um estudo do Pew Research Center, um quarto de todas as páginas web que já existiram em algum momento entre 2013 e 2023 já não existem mais.
  • Quanto mais antigos são os arquivos, maiores os problemas.
  • A organização tentou acessar páginas existentes em 2013 e 38% delas não funcionam mais.
  • O mesmo também pode acontecer com páginas mais recentes.
  • Cerca de 8% dos conteúdos publicados em algum momento de 2023 desapareceram em outubro do mesmo ano.
  • Ainda segundo o trabalho, um em cada cinco websites governamentais contém pelo menos um link quebrado.
  • Além disso, mais da metade dos artigos da Wikipédia tem um link quebrado na sua seção de referências.
  • Isso significa que parte da história humana simplesmente desapareceu para sempre.
  • As informações são da BBC.
Muitas páginas da web não podem mais ser encontradas (Imagem: Shutter z/Shutterstock)

Leia mais

Acervo gigantesco busca guardar informações

É neste contexto que diversas organizações compostas na sua maioria por voluntários estão buscando uma forma de salvar esta enorme quantidade de dados. É o caso, por exemplo, do Internet Archive, uma organização sem fins lucrativos sediada em São Francisco, nos Estados Unidos.

Criada em 1996 como um projeto do pioneiro da internet Brewster Kahle, a organização criou o que pode ser o mais ambicioso projeto de arquivo digital já realizado. São 866 bilhões de páginas web, 44 milhões de livros, além de 10,6 milhões de vídeos com filmes e programas de televisão. Toda está coleção está guardada em diversos centros de dados espalhados pelo mundo.

Acervo tenta salvar dados da internet (Imagem: Stock-Asso/Shutterstock)

O trabalho do Internet Archive também ajuda a recuperar alguns links quebrados. O projeto Wayback Machine usa robôs para rastrear cópias de websites e guardar este conteúdo.

O grande problema, no entanto, é que esta e diversas outras organizações estão enfrentando ameaças financeiras, dificuldades técnicas, ciberataques e batalhas jurídicas geradas por empresas que não aceitam que cópias da sua propriedade intelectual estejam disponíveis gratuitamente na internet. E sem o trabalho destas pessoas muitas informações simplesmente vão continuar desaparecendo para sempre.

O post Parte do arquivo da internet está desaparecendo para sempre; entenda apareceu primeiro em Olhar Digital.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima