LSM-Baum: Eine indexbasierte Datenstruktur zur Beschleunigung von Aktualisierungen in Semantic Web Datenbanken

- Bachelorarbeit -


Beschreibung:

Für große Datensätze ist es günstig, Zeichenketten durch eine eindeutige numerische Repräsentation zu ersetzen. Dazu wird ein sogenanntes Dictionary verwendet, welches Zeichenketten auf einen numerischen Wert und umgekehrt abbildet. Im LUPOSDATE-Projekt haben wir eine hocheffiziente Semantic Web Datenbank entwickelt, die u.a. ein Dictionary auf Basis von B+-Bäumen verwendet. 

B+-Bäume sind jedoch langsam, wenn viele Einfügungen zu erwarten sind. Daher werden oft die sogenannten LSM-Bäume (bzw. deren Varianten) verwendet, die zunächst viele einzufügende Daten im Hauptspeicher aufsammeln, bevor sie blockweise die Daten in den festplattenbasierte übernehmen. Einen Vergleich zwischen relevanten Indexstrukturen findet sich auch hier und dort

In dieser Bachelorarbeit soll daher der beschriebene Indizierungsansatz LSM-Baum implementiert werden. Anschließend soll durch Meßreihen evaluiert werden, welche Indexierungsansätze sich insbesondere für den Einsatz in Dictionaries eignen, in denen mit häufigen neuen Einträgen zu rechnen ist. 

Anforderungen/Kenntnisse:
Java, Datenbank-Grundkenntnisse

Bearbeitung:
Maike Herting

Ergebnis:
Die Ausarbeitung kann im Institut für Informationssysteme angefordert werden.

Betreuung:
Privatdozent Dr. rer.nat. habil. Sven Groppe

Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 500 5706