Cómo funciona la Web

Capítulo 10 Clasificación y Filtrado de Información en la “Web Viva” if ( (trigo and predio) or (trigo and comodity) or (quintal and exportar) or (trigo and tonelada) or (trigo and invierno and not suave)) then clase=relevante else clase=irrelevante El antecedente de la regla (la condición a la izquierda del símbolo “ then ”) usa operadores lógicos como and , or y not . Cada término de esta con ­ dición es verdadero si el término aparece en el artículo. En el ejemplo, si el artículo satisface el antecedente de la regla, es clasificado como relevante, en caso contrario es clasificado como irrelevante. Algunos experimentos iniciales mostraron que la tasa de error de un fil ­ tro generado por CONSTRUE podía ser menor a 10%. A pesar de estos resultados positivos, por distintos motivos, el método de CONSTRUE se tornó rápidamente impracticable en la mayoría de las aplicaciones donde se utili ­ zó. En primer lugar, el tiempo y costo que toma tener expertos definiendo reglas es alto. Más aún, si lo que se considera relevante cambia, los expertos deben intervenir de nuevo las reglas, y en algunos casos el trabajo debe ha ­ cerse desde cero. La información es en general dinámica y las reglas de un filtro deben evolucionar constantemente. Por ejemplo, el interés de una co ­ munidad a la cual se enfoca un agregador puede estar en constante cambio, o debemos reprogramar el filtro continuamente para incorporar nuevos tér ­ minos. Si bien sistemas como CONSTRUE permiten programar sistemas que fil ­ tran en forma automática, hoy es claro que el problema de fondo es mucho más complejo: requerimos de sistemas que aprendan a filtrar en base a una adaptación continua las necesidades de información de los usuarios. No so ­ lamente es importante automatizar el proceso de filtrado sino también el proceso de construcción y adaptación de un filtro. 133

RkJQdWJsaXNoZXIy Mzc3MTg=