Si buscas un artículo online de 2013, existe la posibilidad de que haya desaparecido. Una nueva investigación del Centro de Investigación Pew de Estados Unidos concluye que el 38% de las páginas web que existían en 2013 ya no son accesibles debido a un fenómeno que denominan 'decadencia digital'.
Cuando los investigadores ampliaron el marco temporal, descubrieron que aproximadamente una cuarta parte de todas las páginas web creadas entre 2013 y 2023 ya no existen. De esa cifra, el 8% de esas páginas web se crearon en 2023.
"Internet es un 'contenedor' de la vida moderna pero incluso cuando los usuarios de todo el mundo confían en la web para acceder a libros, imágenes, artículos de noticias y otros recursos, este contenido a veces desaparece de la vista", dice el estudio.
La investigación definió los enlaces inaccesibles como páginas que ya no existen en un servidor principal (mostrando el siguiente mensaje: 'error 404'). Los investigadores recogieron una muestra aleatoria de páginas web mediante una búsqueda de archivos de Internet que toma una instantánea del aspecto de las webs en un momento dado.
El equipo tomó muestras de unas 90.000 páginas de entre los años 2013 y 2023 para comprobar si seguían existiendo. En Wikipedia, descubrieron que alrededor del 54% de las páginas analizadas tenían al menos un enlace roto en la sección de referencias.Alrededor del 23% de los sitios de noticias contenían un enlace roto, mientras que esa cifra en los sitios gubernamentales es del 21%.
Los investigadores examinaron más detenidamente los sitios de las administraciones públicas y descubrieron que las páginas web, de media contenía, 50 enlaces, a menudo a páginas 'HTTP' seguras para obtener más información.
Los ayuntamientos, los más afectados por este problema
De los cuatro niveles de Gobierno, los ayuntamientos eran los más propensos a tener enlaces rotos, con un 29% de sus sitios examinados con al menos un enlace roto. En cuanto al sector de la prensa, se encontró aproximadamente la misma cantidad de páginas con enlaces rotos en sitios con mucho y poco tráfico y, al igual que los sitios gubernamentales, la mayoría enlazaba con sitios web externos HTTP seguros.El deterioro también se está produciendo en las redes sociales, donde algo menos de una de cada cinco publicaciones en X (antes Twitter (NYSE:TWTR)) recogidas en una muestra aleatoria en tiempo real de 4,8 millones de publicaciones no estuvieron disponibles durante más de unos meses en el sitio, bien porque se eliminó la cuenta de un usuario o bien porque se eliminó la publicación individual.
Una publicación en X tenía más probabilidades de desaparecer si estaba escrita en turco o árabe o procedía de una cuenta con 'configuración predeterminada', como una foto de perfil o una biografía genéricas.