Jakob Voß

Semantic Web und FRBR
Digitale Bibliothek WS 2008/2009 Digitale Bibliothek Fachhochschule Hannover Informationsmanagement (BA) 20. Oktober 2008

Die Inhalte dieser Präsentation stehen (sofern nicht weiter angegeben) von Jakob Voß freigegeben unter der Creative Commons Attribution-Share Alike 3.0 Unported Lizenz.

Grundidee
– – –

Computer sollen „verstehen“ Heterogene Daten weltweit vernetzen Logische Beschreibung mit Regeln und automatischen Schlussfolgerungen Weniger „Semantik“ als „Verknüpfung von Daten“

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Erste Voraussetzung: URIs als Identifikatoren

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Identifikatoren in Bibliotheken
– – – – – –

Verlags-IDs (ISSN, ISBN, DOI...) Datensatz-IDs im Katalog (z.B. PPN) Sigel, ISIL, MARC-Codes für Einrichtungen Notationen einer Klassifikation (z.B. RVK) Nummer von Normdateien (z.B. PND, GKD...) Signaturen von Büchern Frage: Was genau wird jeweils identifiziert?

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

URIs als Identifikatoren

Uniform Resource Identifier
– – –

unabhängig vom Zugriffsmechanismus jede mögliche Art von Resource weltweit eindeutig, hierarchisches System http://... urn:... ... URL URN

Allgemeine Syntax: schema:identifier
– – – –

info:isbn:... info-URI

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

URI, IRI, URN, URL...
– – –

URN und URL sind Teilmengen von URI IRI: Internationalisierte URI (Unicode) Im Semantic Web wird jedes Objekt durch (mindestens) eine URI identifiziert Einfache Variante: Permalinks Mehr als Technik: Commitment Identifikation != Definition der Bedeutung

– –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Zweite Voraussetzung: RDF als gemeinsames Daten(meta)modell

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Resource Description Framework
RDF = URI + Unicode + Tripel (+ Regeln) = „Semantik“

Subjekt

Prädikat Prädikat

Objekt

"Literal"@lang

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

RDF-Beispiel
Abkürzung von URIs durch Namensräume
@prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix agro: <http://www.fao.org/aos/agrovoc> .

agro:c385

rdf:type skos:prefLabel

skos:Concept

"Ananas"@de

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Feldbasiertes Format

Einfache Daten
– –

Titel : Zettelwirtschaft Autor : Krajewski, Markus 021A :

Pica+

a : Zettelwirtschaft d : Markus a : Krajeski

028A :
– –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Abbildung nach RDF

Statt Feldern werden URIs verwendet
– – –

021A$a =>
http://purl.org/dc/elements/1.1/title

028A$d =>
http://xmlns.com/foaf/0.1/fir stN ame

028A$a =>
http://xmlns.com/foaf/0.1/secondN ame

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Abbildung nach RDF

Alle Objekte erhalten eine eigene URI
– –

Das Buch:
http://d­nb.info/96327841X

Die Person:
http://d­nb.info/gnd/13150794X

Verknüpfung von Semantischen Entitäten
– – – –

http://purl.org/dc/elements/1.1/title http://purl.org/dc/elements/1.1/cr eat or http://xmlns.com/foaf/0.1/fir stN ame http://xmlns.com/foaf/0.1/secondN ame

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

RDF-basiertes Format
@prefix foaf <http://xmlns.com/foaf/0.1/>. @prefix dc <http://purl.org/dc/elements/1.1/>. <http://d­nb.info/96327841X> dc:title "Zettelwirtschaft" ; dc:creator <http://d­nb.info/gnd/13150794X> . <http://d­nb.info/gnd/13150794X> foaf:firstName "Markus" ; foaf:secondName "Krajeski" . dc:title Zettelwirtschaft Graph Markus Krajewski

N3

http://d-nb.info/96327841X dc:creator

foaf:firstName http://d-nb.info/gnd/13150794X foaf:secondName
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Kodierung als RDF/XML
<?xml version="1.0" encoding="UTF­8" ?> <rdf:RDF xmlns:rdf ="ht tp :// ww w.w3 .o rg/1 99 9/0 2/ 22­ rdf ­s ynt ax­ ns #"          xmlns:foa f=" ht tp: // xm lns .c om/ foaf /0 .1/ "          xmlns:dc=" ht tp: // pur l.o rg/ dc/ el eme nt s/ 1.1/ ">   <rdf:Description about="http :/ /d­ nb .in fo/9 63 27841X">     <dc :t itl e>Zettelwirtschaft</dc:title>     <dc :c reat or  rdf:Resource="http :/ /d­ nb. in fo/g nd /1 3150 79 4X" />   </rdf:Description>   <rdf:Description about="http :/ /d­ nb .in fo/g nd /1 3150 79 4X">     <foa f:f ir stNam e>Markus</foaf:firstName>     <foa f:s eco nd Nam e>Krajewski</foaf:secondName>   </rdf:Description> </rdf:RDF>

Erste Version: 2001, aktuelle Version: 2004 Ein Hinderungsgrund des Semantic Web
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Cool URIs for the Semantic Web
http://example.com/xy z ID Accept: application/rdf+xml 303 redirect HTML http://example.com/xy z. htm l

RDF http://example.com/xy z.rdf

Menschenlesbare und Maschinenlesbare Informationen unter einer URI

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Linked Data
– –

Benutze URIs, um Objekte zu identifizieren. Benutze HTTP URIs, so dass Objekte nachgeschlagen werden können. Wenn jemand eine URI nachschlägt, stelle zweckdienliche Informationen bereit. Biete Links zu anderen URIs, so dass weitere Objekte nachgeschlagen werden können.
Tim Berners Lee (2006): Linked Data Design Issues http://www.w3.org/DesignIssues/LinkedData.html

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Initiative, um offene Datensammlungen in RDF verlinkt im Web zugänglich zu machen Eine der größten Datensammlungen dabei:
– –

DBpedia (http://dbpedia.org) Daten erzeugt aus Wikipedia

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

LOD-Wachstum

Mai 2007

September 2008

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Once upon a time...

Das ARPANET 1969
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Bild: Comuter History Museum

Bibliotheksdaten ins Semantic Web bringen!

Vorhandene Identifikatoren in (HTTP) URIs umwandeln Vorhandene Datenformate auf RDF und Ontologien abbilden Daten als „Linked Open Data“ verfügbar machen

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

z.B. Normdateien

URIs für August Strindberg
– – – –

http://dbpedia.org/page/August_Strindberg http://libris.kb.se/resource/auth/94541 http://d-nb.info/gnd/118619314 ...

– –

Mehr Verknüpfungen bitte! Gleiche Objekte kombiniert mit owl:sameAs

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Weitere Bestandteile: Ontologien, Schlussfolgerung, Abfragen, Anwendungen...

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Komplexere Anfragen

Beispiele:
– –

Filme, deren Musik jemand gemacht hat, der im Jahr 1965 geboren wurde Bücher, deren Autor gleichzeitig Thema des Buches ist

– –

Formulierung in SPARQL („SQL für RDF“) Besser: Anfrage zusammenklicken

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Beispielanfrage
Filme, deren Musik jemand gemacht hat, der im Jahr 1965 geboren wurde?

?

music

?
born

1965
music

„Dancer in the Dark“

„Björk“
born

Problem: Die Prädikate „music“ (hat-darin-Musikgemacht) und „born“ (ist-geboren-im-Jahr) müssen bekannt und einheitlich verwendet werden!
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

1965

Vernüpfungen versch. Quellen
OPAC Buch über Björk
dc:subject

PND:119525054
owl:sameAs

Dancer in the Dark DBpedia

dc:creator

Björk
dbpedia:birthYear

1965
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Beispielanfrage und Daten
RDF-Daten von http://libris.kb.se/resource/auth/94541: <rdf:Description rdf:about="http://libris.kb.se/resource/bib/5761604">     <dc:subject rdf:resource="http://libris.kb.se/resource/auth/94541"/>     <dc:creator rdf:resource="http://libris.kb.se/resource/auth/94541"/> </rdf:Description>

dc:subject

kb:bib/5761604
dc:creator
– – –

kb:auth/94541

Sollte eine Autobiographie sein (ist aber nicht) Vermeidung von Redundanzen Anfragen zur Verbesserung der Qualität

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Ontologien
– – –

Spezifizieren, welche Prädikate möglich sind Spezifizieren Objekttypen (Klassen) Ermöglichen, Spezielles auf Einfaches abzubilden Geben zusätzliche Regeln an zur
– –

Schlussfolgerung (Inferenz) Integrität (Validierung)

„Datenformate“ für das Semantic Web

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Schlussfolgerungsregeln
– – –

Wenn ... dann auch ... A frbr:creator B => B rdf:type frbr:Work Vorsicht, explosiv!
– –

Gefahr von vorschnellen Verallgemeinerungen! Siehe

Bowker and Star (1999): Sorting Things out. Classification and its consequences Voss (2007): The Semantic Web and why Wikipedia should bother.

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Functional Requirements for Bibliographic Records (FRBR)

Abstraktes Datenmodell für bibliographische Informationen 1998 von der IFLA verabschiedet http://www.ifla.org/VII/s13/frbr/frbr.htm Drei Gruppen von Entitäten
1) Work, Expression, Manifestation, Item 2) Person, CorporateBody 3) Concept, Event, Object, Place

– – –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Semantic FRBR
– –

Vom abstrakten Datenmodell zur Ontologie Seit 1998 : IFLA verschläft Webstandards?
– – –

keine Bezugnahme auf W3C, RFC... keine Implementierung fehlender technischer Sachverstand?

– –

2004: erster Versuch von FRBR in RDF 2005: zweiter Versuch (IFLA-unabhängig)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Entitäten
Work

Romeo und Julia Erste gedruckte Fassung Erstauflage Exemplar in der British Library

Expression

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Entitäten
Work

Romeo und Julia der Film mit di Caprio DVD-Version Exemplar in Stadtbücherei

Expression

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Entitäten
Work

Romeo und Julia der Film mit di Caprio deutsche Fassung TV-Ausstrahlung Auf Video mitgeschnitten

Expression

– –

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Attribute
Work

Titel, Datum... Sprache, Umfang... Herausgeber, Ort... Anmerkungen, Provenienz...

Expression

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR-Entitäten in Bibliotheken
Work
xISBN thingISBN ...

Expression

Bisherige Kataloge

Verfügbarkeitsrecherche

Manifestation
Digitalisierung

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Relationen 1/4
Work
realization realizationOf

Expression
embodiment embodimentOf

Manifestation
exemplar exemplarOf

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Relationen 2/4
Endeavour Work

relatedEndeavour part

Expression

relatedEndeavour partOf

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Relationen 3/4
Work
abridgement revision translation alternate arrangement subject

Expression

abridgementOf revisionOf translationOf alternateOf arrangementOf

Manifestation

reconfiguration

Item

reconfigurationOf

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 1 Relationen 4/4
adaption complement imitation successor summarization supplement transformation

Work

Expression

adaptionOf complementOf imitationOf successorOf summarizationOf supplementOf transformationOf

Manifestation
reproduction reproductionOf

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 2 Entitäten und Attribute

ResponsibleEntity

Name, Titel... Name, Ort...

Person CorporateBody

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 2 Relationen
responsibleEntity responsibleEntityOf creator creatorOf

Work

ResponsibleEntity Expression
realizer realizerOf producer producerOf owner ownerOf

Person CorporateBody

Manifestation

Item

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 3 Entitäten und Relation
subject

Work

Subject Concept Event Place Object

ResponsibleEntity Endeavour

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

FRBR – Gruppe 3 Entitäten und Relation
subject

Work
dc:subject

Subject Concept Event Place Object

skos:Concept

besser (auch) auf SKOS zurückgreifen!
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

ResponsibleEntity Endeavour

Wo wird FRBR benötigt?

Ergebnisse von Bennett et al. (2003):
– – – –

Werk hat durchnittlich 1,5 Manifestationen 78% aller Werke haben nur eine Manifestation 99% aller Werke in WorldCat haben <= 7 Nur 30.000 (~1%) haben mehr als 20

– –

Aber: die populären Fälle haben mehr! Gute Interfaces für einfache und umfangreiche Fälle erforderlich!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Weiteres FRBR-Beispiel
Work
Brema [ca. 1750]. Matthäus Seutter (1678-1756) Tobias Conrad Lotter (1717-1777) Vorzeichnung

Expression
Kupferstich Digitalisat

Manifestation

Item

Weimar

Bremen

Thumbnail

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Weiteres FRBR-Beispiel
Work
Brema [ca. 1750]. Matthäus Seutter (1678-1756) Tobias Conrad Lotter (1717-1777) Kupferstich

Expression
Kolorierungen Digitalisat

Manifestation

Item

Weimar

Bremen

Thumbnail

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Probleme des Semantic Web
– – –

Daten und Anwendungen (Henne-Ei) Visualisierung und Anfrageformulierung Datenqualität
– – – –

Unvollständige Daten Unterschiedliche Interpretationen Widersprüche Nicht zu unterschätzen!

Semantik vs. Pragmatik (Theorie & Praxis)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Dankeschön & auf Wiedersehen!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement