Cómo funciona la Web

Capítulo 5 Manejo de grandes volúmenes de información utilizando Clusters de computadores un libro y por lo tanto el broker puede distribuirlas de manera eficiente utili ­ zando la estrategia de la figura 5.2). En el siguiente paso, todos los computadores en paralelo leen desde su memoria las listas invertidas asocia ­ das con las palabras que forman la consulta del usuario. Luego se realiza la intersección de las listas invertidas para determinar los documentos que con ­ tienen todas las palabras de la consulta. Al término de este paso todos los computadores tienen un conjunto de respuestas para la consulta. Sin embargo, la cantidad de respuestas puede ser inmensamente grande puesto que las listas invertidas pueden llegar a contener miles de identificadores de documentos que contienen todas las pa ­ labras de la consulta. Es necesario hacer un ranking de los resultados para mostrar los mejores K resultados al usuario como solución a la consulta. Para realizar el ranking final de documentos es necesario colocar en uno de los computadores del cluster los resultados obtenidos por todos los otros. Esto con el fin de comparar esos resultados unos con otros y determi ­ nar los mejores K . Sin embargo, enviar mensajes conteniendo una gran cantidad de resultados entre dos computadores puede consumir mucho tiempo. Es deseable reducir la cantidad de comunicación entre computado ­ res. Ahora, si cada computador ha calculado los mejores resultados para la consulta considerando los documentos (listas invertidas) que tiene almace ­ nados en su disco, entonces no es necesario enviarlos todos al computador encargado de realizar el ranking final. Basta con enviar a este computador los K mejores de cada uno de los P 1 computadores restantes. Es decir, el ranking final se puede hacer encontrando los K mejores entre los K × P re ­ sultados aportados por los P computadores. 67

RkJQdWJsaXNoZXIy Mzc3MTg=