/  36
 
Bachelorarbeit
Fusionieren wie ein Mensch –Konfliktaufl¨osung unter Benutzungglobalen Wissens
Michael Leben
 michael.leben@student.hpi.uni-potsdam.de
30. Juni 2008betreut durch Prof. Dr. Felix Naumann,Sascha Schott und Joachim Schmid,Lehrstuhl Informationssysteme,Hasso-Plattner-Institut f ¨ur Softwaresystemtechnikan der Universit¨at Potsdam
1
 
Erkl¨arung der Selbst¨andigkeit
Ich versichere hiermit, dass ich die vorliegende Bachelorarbeit mit dem Thema ,,Fu-sionieren wie ein Mensch” selbst¨andig verfasst und keine anderen als die angegebenenHilfsmittel benutzt habe. Die Stellen, die anderen Werken dem Wortlaut oder dem Sinnnach entnommen wurden, habe ich in jedem einzelnen Fall durch die Angabe der Quelle,auch der benutzten Sekund¨arliteratur, als Entlehnung kenntlich gemacht.Potsdam, den 30.06.2008
Zusammenfassung
In dieser Arbeit werden Index-basierte Verfahren zur Konfliktaufl¨osung un-tersucht. Mit einem Index¨uber der Eingabedatenbank lassen sich Metainfor-mationen¨uber die konfligierenden Attributwerte ermitteln. Die Einbindungexterner Wissensquellen erweitert die Informationsbasis, anhand der eine Fu-sionsentscheidung getroffen wird. Es werden effiziente Verfahren gezeigt, mitdenen ein solcher Index erstellt und ausgewertet werden kann. Anhand vonVergleichen mit manuell fusionierten Daten wird gezeigt, dass die Nutzungglobalen Wissens die Fusionsqualit¨at steigert.2
 
Inhaltsverzeichnis Inhaltsverzeichnis
Inhaltsverzeichnis
. . . . . . . . . . . . . . . . . . . . 83.2 Die Konfliktau¨osungsfunktion
. . . . . . . . . . . . . . . . . 93.2.1 Semantische Schwelle ¨ur
. . . . . . . . . . . . . . . . 103.2.2 Die Variante
. . . . . . . . . . . . . . . . . . . . 113.2.3 Die Erweiterung
. . . . . . . . . . . . . . . . . . . . 123.3 Die Konfliktau¨osungsfunktion
. . . . . . . . . . . . . . . . . 133.3.1 Same Data, Same Conflict, Same Resolution -
. . . . . . 15
. . . . . . . . . . . . . . . . . 174.1.1 Indexerstellung. . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.1.2 Erzeugung der
-Menge. . . . . . . . . . . . . . . . . . 204.1.3 Erzeugen und Abfragen des
. . . . . . . . . . . . . . . . . . . . 234.2.1
wikicat. . . . . . . . . . . . . . . . . . . . . . . . . 234.2.2
NonsenseFilter. . . . . . . . . . . . . . . . . . . . . 24
5.1 Laufzeit der Berechnung. . . . . . . . . . . . . . . . . . . . . . . . . . . 255.2 Qualit¨at der Ergebnisse. . . . . . . . . . . . . . . . . . . . . . . . . . . . 265.3 Eignung der Verfahren und Ausblick. . . . . . . . . . . . . . . . . . . . 29
3

Share & Embed

More from this user

Commenting has been disabled.