Cómo funciona la Web
Capítulo 5 Manejo de grandes volúmenes de información utilizando Clusters de computadores si bajamos el homepage de un sitio podemos descubrir nuevas páginas des de los enlaces que esta página tiene. Una estrategia para recuperar las páginas Web de los distintos sitios en orden de importancia es calcular un número real que indica la importancia de cada página que se descubre. La próxima página a bajar es la que presen ta un mayor valor numérico en ese instante. Por ejemplo, podemos usar la siguiente regla para numerar las páginas. Inicialmente les damos el valor 1 a todos homepages conocidos. Cada vez que se baja un homepage le reparti mos de manera equitativa el valor 1 a todas las páginas a las que el home 70 Figura 5.4: Ranking iterativo en un computador del cluster.
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=