Cómo funciona la Web
Capítulo 2 Anatomía de la Web de páginas con muchos enlaces es muy pequeño. Estos valores son casi los mismos para los dos recorridos, pese a que entre ellos pasaron 6 meses. Estructura Para analizar la estructura de la Web se buscan las partes del grafo que están conectadas entre sí. El estudio ya mencionado, y el único realizado a nivel global, muestra que el núcleo o centro de la Web lo constituían más de 56 millones de páginas, existiendo un camino para ir de cualquier página a otra, con un largo máximo (diámetro) de al menos 28. En otras palabras, el camino más corto entre dos páginas en el peor caso implicaba visitar 28 de ellas. Esto contrasta con el modelo del mundo pequeño mencionado al co mienzo que predecía un diámetro máximo de 20 páginas para toda la Web. En la práctica se encontraron caminos hasta de largo 900, lo que indica que el diámetro de la Web es mucho mayor. De todos modos, este número no es tan grande considerando que son cientos de millones de páginas. La Figura 2.3 muestra la estructura de la Web de acuerdo al estudio mencionado. A la izquierda había 43 millones de páginas desde las cuales se podía llegar al centro, pero no viceversa. Del mismo modo, a la derecha ha bía otras 43 millones que podían ser accedidas desde el centro, pero que no enlazaban páginas del núcleo. Alrededor de estos dos grupos hay tentáculos que contienen 44 millones de páginas y que son caminos sin salida, con la excepción de algunos tubos, que conectan el grupo de la izquierda con el de la derecha. Finalmente, tenemos 17 millones de páginas que están agrupadas en islas que no están conectadas al centro de la Web. Muchos se preguntarán cómo Altavista conocía estas islas si no están conectadas al resto de la Web y no pueden ser recorridas siguiendo enlaces. Es muy simple: estos son sitios Web que fueron directamente enviados al buscador y por lo tanto están en su índice aunque el resto del mundo no las conozca. 35
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=