Varianten der sechsfach-Indexe für Semantic Web Datenbanken

- Bachelor-/Masterarbeit -


Beschreibung:
Die Zukunft des World Wide Web ist das so genannte Semantic Web. Das Semantic Web erweitert das World Wide Web von einem menschen-lesbaren Web zu einem maschinen-verständlichen Web und stellt damit Einsatzmöglichkeiten zum Suchen, Finden, Sortieren und der Klassifikation von Web-Informationen für den Menschen zur Verfügung.

Im LUPOSDATE-Projekt haben wir eine hocheffiziente Semantic Web Datenbank entwickelt. Die bereits vorhandene RDF3X-Indexierung verwendet 6 B+-Bäume zur Speicherung und schnellen Adressierung von RDF Tripeln bezüglich deren 6 möglichen Sortierungen. Weiterhin verwendet RDF3X ein Dictionary, um in diesen B+-Bäumen nur eindeutige ganzzahlige Ids zu verwenden anstatt platzintensiver Zeichenketten. Die Verwendung eines Dictionaries ist jedoch langsam, wenn Anfragen relationale Vergleiche, Sortieranforderungen oder auch reguläre Ausdrücke enthalten. Daher soll in dieser Arbeit Indexierungen bzgl. der 6 möglichen Sortierungen von RDF Tripeln ohne die Verwendung von Dictionaries untersucht werden. Neben der trivialen Variante, die einfach Zeichenketten in den B+-Bäumen speichert, soll auch eine Variante ein lokales Dictionary pro B+-Baumknoten verwenden. Eine schnelle Indexkonstruktion für die beiden neuen Varianten soll ebenfalls entwickelt werden. Die Auswirkungen auf die Performance sowie den Platzbedarf soll durch Messungen und deren Analyse dargelegt werden. 

Anforderungen/Kenntnisse:

Java, Semantic Web

Betreuung:

Privatdozent Dr. rer.nat. habil. Sven Groppe
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 500 5706