Bachelorarbeit am Institut für Informationssysteme



Das Teilmengenproblem für eine Untermenge von XPath


Beschreibung:

XPath ist eine Selektionssprache für XML Daten und basiert auf Pfadausdrücken, die einen Navigationspfad durch den XML-Baum beschreiben und Knoten am Ende des Pfads selektieren. Die Fragestellung, ob die Ergebnismenge einer XPath-Anfrage p Teil der Ergebnismenge einer zweiten Anfrage p' ist, wurde in der Arbeit von Miklau und Suciu [1,2] theoretisch erörtert und ein auf Baumautomaten bzw. Matching Sets basierender Algorithmus vorgeschlagen. Die Teilmengen-Beziehung (Containment) wird dabei nicht anhand von konkreten XML Daten sondern ausschließlich anhand der beiden Anfragen p und p' entschieden. Wenn die Teilmengen-Beziehung in beide Richtungen gilt, so sind p und p' semantisch äquivalent.

Ziel der Arbeit:

  1. In dieser Arbeit soll das Verfahren zur Entscheidung der Teilmengen-Beziehung von XPath-Ausdrücken ausführlich erklärt und eine Referenzimplementierung in Java erstellt werden. Die Implementierung soll als Open-Source auf der Webseite des Instituts für Informationssysteme zum Download für Interessierte angeboten werden. Aus diesem Grund ist die Implementierung besonders sorgfältig und mit englischen Kommentaren durchzuführen.
  2. Über eine einfache Webschnittstelle soll ein Benutzer den Algorithmus zu Testzwecken aufrufen können.
  3. Mit geeigneten Tests ist die Korrektheit der Implementierung zu überprüfen, bevor sie zum Download angeboten wird.

[1] Gerome Miklau and Dan Suciu: Containment and equivalence for a fragment of XPath, Journal of the ACM , vol 51, num 1, 2004m pages 2-45, ACM Press
[2] Gerome Miklau and Dan Suciu: Containment and equivalence for an XPath fragment , Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems, Madison, Wisconsin, 2002, pages 65-76

Anforderungen:
Fähigkeit und Wille zum selbständigen Arbeiten
Interesse an theoretischen Fragestellungen
Grundkenntnisse in XML und HTML
Erfahrungen in Java oder einer anderen objektorientierten Programmiersprache
Bearbeiter:
Khaled Haj-Yahya
Betreuung:
Beda Christoph Hammerschmidt
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
Raum 2064
23538 Lübeck
Telefon: 0451/500 5707
bchammer@ifis.uni-luebeck.de
03.05.2005 webmaster