La web semántica
La web actual está basada en HTML, que especifica como dar formato a una página para su lectura por humanos. El HTML no puede explotarse mediante técnicas de recuperación de información para mejorar el resultado, que tiene que basarse en las palabras que forman el contenido de la página, de ahí que esté restringido a