Indexierungsansatz zur Erhöhung der Parallelität einer Semantic Web Datenbank in der Cloud

- Bachelorarbeit -


Beschreibung:
Die Zukunft des World Wide Web ist das so genannte Semantic Web. Das Semantic Web erweitert das World Wide Web von einem menschen-lesbaren Web zu einem maschinen-verständlichen Web und stellt damit Einsatzmöglichkeiten zum Suchen, Finden, Sortieren und der Klassifikation von Web-Informationen für den Menschen zur Verfügung.

Cloud Computing erlaubt das verteilte Ausführen von Anwendungen mit skalierbaren Ressourcen. Ein wesentliches Programmierparadigma im Cloud Computing ist der Map/Reduce Ansatz. Es gibt zahlreiche Untersuchungen, wie Anfrageverarbeitung mit Hilfe des Map/Reduce Frameworks vorgenommen werden kann ([1][2][3][4][5][6]).

Im LUPOSDATE-Projekt haben wir bereits eine hocheffiziente Open Source Semantic Web Datenbank in der Cloud namens P-LUPOSDATE entwickelt.

In dieser Bachelor-/Masterarbeit soll P-LUPOSDATE nach Absprache erweitert werden, d.h. nur ein Teil und nicht alle der folgenden Erweiterungen müssen in einer Arbeit erledigt werden. Möglichkeiten für Erweiterungen sind

 

  • die Unterstützung eines Dictionaries, um Strings auf kurze eindeutige IDs abzubilden, die hauptsächlich verarbeitet und versendet werden.
  • neue Indexierungsansätze zu entwickeln
  • Auswertung von RIF-Regeln und/oder Ontologie-Inferenz
  • die volle Unterstützung von SPARQL 1.1. komplett ausgewertet in der Cloud (zurzeit werden teilweise Operationen, die in der Cloud nicht unterstützt werden, nur von dem Master durchgeführt)

 

Durch Meßreihen soll die Performanz der entwickelnden Ansätze durchgemessen werden.

Anforderungen/Kenntnisse:

Java, Cloud, Semantic Web

Bearbeitung:
Nils Caliebe

Ergebnis:
Die Ausarbeitung kann im Institut für Informationssysteme angefordert werden.

Betreuung:

Privatdozent Dr. rer.nat. habil. Sven Groppe

Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 500 5706