Cómo funciona la Web

Capítulo 5 Manejo de grandes volúmenes de información utilizando Clusters de computadores si bajamos el homepage de un sitio podemos descubrir nuevas páginas des ­ de los enlaces que esta página tiene. Una estrategia para recuperar las páginas Web de los distintos sitios en orden de importancia es calcular un número real que indica la importancia de cada página que se descubre. La próxima página a bajar es la que presen ­ ta un mayor valor numérico en ese instante. Por ejemplo, podemos usar la siguiente regla para numerar las páginas. Inicialmente les damos el valor 1 a todos homepages conocidos. Cada vez que se baja un homepage le reparti ­ mos de manera equitativa el valor 1 a todas las páginas a las que el home­ 70 Figura 5.4: Ranking iterativo en un computador del cluster.

RkJQdWJsaXNoZXIy Mzc3MTg=