Cómo funciona la Web
Capítulo 6 XML: Transformando la Web en una Base de Datos browser tal como FireFox o Explorer, esta lista será desplegada de la siguien te forma: Todo Libros ● Teoría de Juegos. Martin Osborne y Ariel Rubinstein. Precio: 16000. Para un usuario la información en esta lista es fácil de entender; es claro que hay una lista de libros, cada uno con sus autores y su precio. Sin embar go, para un computador esta información no es tan clara. Una de las razones es que el computador no tiene la información de contexto, o metainforma ción, que tiene el usuario. ¿Cómo puede un computador deducir que está frente a una lista de libros? Y aun si sabe esto, ¿cómo puede extraer informa ción desde el documento, por ejemplo los precios de los libros? Es importante notar aquí que el documento HTML no tiene ninguna indicación sobre donde buscar esta información, simplemente dice cómo debe ser des plegada la lista de libros. Así, el computador debe tratar de interpretar el texto para poder extraer la lista de precios. Por ejemplo, puede buscar la pa labra “Precio” y el número que lo sigue (o antecede). Aunque en este caso esto puede dar buenos resultados, la situación puede volverse más compli cada si la lista contiene varios precios para un mismo libro (precio sin descuento, con descuento por compra electrónica, con descuento a clientes frecuentes, etc), o aun más complicada si se requiere de hacer algunos cálcu los para saber el precio final (precio después del 15% de descuento por compra electrónica). La búsqueda de información en la Web puede mejorarse si los formatos usados para almacenar información pueden ser fácilmente interpretados por 77
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=