Cómo funciona la Web

Capítulo 10 Clasificación y Filtrado de Información en la “Web Viva” muchos documentos comunes), sinonimia (dos etiquetas o más que signifi can lo mismo), polisemia (una etiqueta con más de un significado) y otros problemas. Adicionalmente, no siempre disponemos de etiquetas. Un área extensa de investigación, denominada “extracción de información” [8], estu dia el problema de generar etiquetas desde colecciones de texto plano e identificar relaciones semánticas entre ellas. Conclusión La Web viva ha generado una nueva dinámica de acceso a la informa ción que está presentando desafíos científicos y tecnológicos importantes. En este contexto, la información “fluye” desde canales hacia agregadores que la deben filtrar y clasificar para finalmente presentarla a los usuarios. Hoy, la mayoría de la información en la Web tiene las propiedades de un flujo. Los sistemas computacionales que filtran deben tener la capacidad de adaptarse continuamente a éste y a los requerimientos cambiantes de los 139 Figura 10.4: (izquierda) Nube de tags generada por Orbitando. (derecha) Nube de tags generada por Technorati.