Professional Documents
Culture Documents
Qu es la Web Semntica
Un conjunto de normas (recomendaciones) del W3C La visin: una Web cuyo contenido puedan interpretar los ordenadores (Inteligencia Artificial?) La motivacin: Una infraestructura para el comercio electrnico y los servicios web Un subproducto: Una infraestructura para la gestin del conocimiento?
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 2
Mayo 2007
W3C:
The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries (). It is based on the Resource Description Framework (RDF) La Web semntica es la idea de aadir metadatos semnticos a la World Wide Web
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 3
Wikipedia:
Mayo 2007
W3C:
La Web Semntica es una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podr encontrar respuestas a sus preguntas de forma ms rpida y sencilla gracias a una informacin mejor definida. Al dotar a la Web de ms significado y, por lo tanto, de ms semntica, se pueden obtener soluciones a problemas habituales en la bsqueda de informacin.
Mayo 2007
La visin de la Inteligencia Artificial (IA) > Ontologas La visin de la bases de datos (SGBD) o del procesamiento robusto > XML + Metadatos La visin de los servicios: la web semntica no es solo para encontrar informacin
Mayo 2007
El punto comn: una web que permita razonar a los ordenadores, realizar inferencias y tomar decisiones. El problema esencial:
Los ordenadores son mquinas sintcticas y la mera sintaxis no produce semntica. Dicho de otro modo:
Mayo 2007
La hiptesis del sistema de smbolos fsicos (A. Newell y Herbert A. Simon ) vs. La hiptesis de la habitacin china (John Searle)
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 6
Componentes principales de la WS
XML: marcado semntico RDF: sistema comn para expresar metadatos OWL: sistema comn para expresar ontologas Agentes de usuario: para unir todo lo anterior al servicio del internauta
Mayo 2007
Infraestructura necesaria
Con marcados semntico va XML (p.e. XHTML) Con metadatos Eventualmente: con ontologas asociadas Navegadores no tolerantes Capaces de interpretar metadatos Capaces de interpretar ontologas o de invocar las aplicaciones necesarias
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 8
Agentes de usuario:
Mayo 2007
XML
XML: lenguaje para definir lenguajes con etiquetas semnticas (y no de presentacin). Ejemplo:
<autor>Umberto Eco</autor> vs. <b>Umberto Eco</b>
XML Schema:
Especificacin para asignar tipos de datos, dominios, rangos de valores y restricciones a las etiquetas XML
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 9
Mayo 2007
RDF
W3C: The Resource Description Framework (RDF) integrates a variety of applications from library catalogs and world-wide directories to syndication and aggregation of news, software, and content to personal collections of music, photos, and events using XML as an interchange syntax. The RDF specifications provide a lightweight ontology system to support the exchange of knowledge on the Web
Mayo 2007
10
RDF - Metadatos
RDF: Un sistema de descripcin de entidades (recursos) con una base lgico/lingstica RDF relaciona recursos con propiedades y valores Proporciona un sistema comn de expresin de metadatos
Mayo 2007
11
Ejemplo RDF
En modo nativo (grfico):
El sitio http://w3c.org
Tiene el ttulo
Mayo 2007
12
Mayo 2007
13
RDF vs SGBD
Modelo RDF:
Un recurso (sujeto) tiene una propiedad (predicado) con un determinado valor (objeto) Ejemplo: El libro ID123 tiene un ttulo y el valor del ttulo es Romeo y Julieta Una entidad (registro) tiene un atributo (campo) con un determinado contenido (valor)
Equivale a:
O bien:
Mayo 2007
OWL
OWL builds on RDF and RDF Schema and adds more vocabulary for describing properties and classes: among others, relations between classes (e.g. disjointness), cardinality (e.g. "exactly one"), equality, richer typing of properties, characteristics of properties (e.g. symmetry), and enumerated classes.
Mayo 2007
15
OWL - Objetivos
Ability to be distributed across many systems Scalability to Web needs Compatibility with Web standards for accessibility and internationalization Openess and extensiblility
Mayo 2007
16
Cada unidad significativa de texto (palabra, frase, oracin, prrafo, pgina) est delimitada (marcada) mediante etiquetas XML (cada unidad es un elemento) Cada elemento tiene asociado un tipo de dato (va schemas) Cada documento, como un todo, contiene (o est asociado a) un conjunto de metadatos. Incluso puede tener metadatos a nivel de elemento (va RDFa) Resultado: la Web como una gran base de datos descentralizada, distribuida y no coordinada (registros formados por campos + diccionario de datos + descriptores)
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 17
Mayo 2007
Mayo 2007
18
XML
Metadatos
Dublin Core
Protg Smore
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 19
RDF
Mayo 2007
No est:
En los motores de bsqueda actuales (evitan expresamente los metadatos) En bases de datos (p.e. no est en Scirus, ni en ISI, etc.) En la mayor parte de la web real
Empieza a estar:
En los sitios web que usan estndares de manera estricta y aplican marcados semntico En algunos repositorios (e-prints, pre-prints, etc.) En un reducido (pero selecto) nmero de sitios web relacionados con la Administracin y/o con iniciativas de carcter cientfico o cultural
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 20
Mayo 2007
Actualmente:
Un nuevo formato universal de datos: XML Una fuerte impulso al uso de estndares Web y un redescubrimiento del marcado semntico (HTML y HTML 5) Un renovado debate sobre el uso, definicin y alcance de los metadatos Un nuevo formato universal para expresar metadatos: RDF con aplicacin a tesauros y lenguajes documentales Servidores de ontologas? Nuevos sistemas de bsqueda y acceso a la informacin? Una nueva generacin de repositorios, bibliotecas digitales y sistemas de informacin?
En el futuro:
Mayo 2007
21
Una web ms alejada del pblico: Hay que tener conocimientos ms tcnicos para desarrollar pginas web: Declaraciones DOCTYPE, CSS, elementos depreciados, separacin de contenido, y formato, etc. Resultado: es necesario conocer ms detalles en lugar de que queden ocultos, contradiciendo la evolucin natural de la informtica Nuevos estndares no estndares: HTML 5 > un HTML que no es del W3C Microformatos > metadatos que no son del W3C Mayores dificultades para desarrollar sitios Web: Se deben aadir metadatos a nivel de sitio, pgina y elemento Marcado semntico: mayor nmero de elementos, etiquetas y atributos Falta de actores con alicientes claros: A quin beneficia aplicar los estndares de la WS? Algunos problemas que afronta la WS estn solucionados por otras vas (p.e. el anlisis de enlaces)
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 22
Mayo 2007
Qu podemos hacer?
El objetivo de la Web Semntica es magnfico. Es la reedicin para el Siglo XXI del proyecto del Acceso Universal al Conocimiento. Propuestas:
Dar soporte al uso de estndares del W3C (XML, XHTML) > Nuevas pginas o nuevos sitios + Conversin retrospectiva de los ya existentes Utilizar el marcado semntico ya disponible en (X)HTML, tanto en forma de elementos (address) como de atributos (title) Usar aplicaciones y modelos de datos que utilicen XML Expresar metadatos mediante RDF (RDFa, RDF/DC, etc.) Concebir las ontologas como nueva frontera de la semntica documental, estudiar sus posibilidades y, eventualmente, promocionar su aplicacin
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 23
Mayo 2007
Referencias
D. Fensel et. al. Spinning the semantic web. Cambridge: MIT, 2005 G. Antonou; F.v. Harmelen. A semantic web primer. Cambridge: MIT, 2004 L. W. Lacy. OWL: Representing information using the Web Ontology Language. Ann Arbor: Trafford, 2004 D. R. Miller; K. S. Clarke. Putting XML to work in the library. Chicago: ALA, 2004 J. Tramullas (coord.) Tendencias en documentacin digital. Gijn: TREA, 2006
L. Codina - 4 Jornada d'Usabilitat en Sistemes d'Informaci Digital 24
Mayo 2007