Non-Standard Datenbanken und Data Mining (CS3130-KP08)


Dozent: Prof. Dr. Ralf Möller

Übungen: Malte Luttermann

Inhalt:

  1. Einführung (pdf, pptx)
  2. Semistrukturierte Datenbanken (XML) und Volltextsuche (pdf, pptx)
  3. Information Retrieval (pdf, pptx)
  4. Mehrdimensionale Indexstrukturen (pdf, pptx)
  5. Cluster-Bildung (pdf, pptx)
  6. First-n-, Top-k-, und Skyline-Anfragen (pdf, pptx) (Update 28.11.22)
  7. Probabilistische Datenbanken, Anfragebeantwortung, Anfragetransformation, Safe-Plan-Anfrage, Top-k-Anfragen (Monte-Carlo-Simulation, Luby-Karp-Verfahren, Multisimulation), Open-World-Annahme (pdfpptx)
  8. Probabilistische Modellierung, Bayes-Netze, Anfragebeantwortungsalgorithmen, Lernverfahren für Modelle (pdf, pptx)
  9. Dynamische Bayes-Netze (pdf, pptx)
  10. Temporale Datenbanken und das relationale Modell (pdfpptx)
  11. Probabilistische Temporale Datenbanken (pdf, pptx)
  12. SQL: neue Entwicklungen (z.B. JSON-Strukturen und Arrays), Zeitreihen (z.B. TimescaleDB) (pdf, pptx)
  13. Stromdatenbanken, Prinzipien der Fenster-orientierten inkrementellen Verarbeitung (pdf, pptx)
  14. Approximationstechniken für Stromdatenverarbeitung, Stream-Mining (pdf, pptx)
  15. Probabilistische raum-zeitliche Datenbanken und Stromdatenverarbeitungsssysteme: Anfragen und Indexstrukturen, Raum-zeitliches Data Mining, probabilistische Skylines (pdf, pptx)
  16. Nicht in WS22/23: Von NoSQL- zu NewSQL-Datenbanken, Graphdaten in SQL, CAP, CALM, CRON (pdfpptx)
  17. Nicht in WS22/23: Graphdatenbanken, Anfragesprachen, Anfragebeantwortung, Graph Mining (pdf, pptx)
  18. Nicht in WS22/23: Approximative Anfragebeantwortung in Graphdatenbanken (pdf, pptx)
  19. Nicht in WS22/23: Gelernte Indexstrukturen (pdf, pptx)

Umfang: Vorlesung (2 x 2 SWS) und Übung (2 SWS), gesamt: 8 KP

Es gibt Vorlesungsvideos aus dem letzten Jahr, die größtenteils dieselben Inhalte behandeln und hier zur Verfügung gestellt werden. Trotzdem können die Präsentationen des letzten Jahres an einzelnen Stellen kleine Unterschiede zu den aktuellen Präsentationen aufweisen und der diesjährige Zeitplan von der hier dargestellten Tabelle abweichen. Das Passwort für die Videos lautet: gFaREUm8

KW

Vorlesung 
Montag 

Video

Vorlesung 
Donnerstag

Video

42

17.10.2022

mp4 (2.49)

20.10.2022

mp4 (3.26)

43

24.10.2022

mp4 (4.37)

27.10.2022

mp4 (5.27)

44

vorlesungsfrei

03.11.2022

mp4 (5.89)

45

07.11.2022

mp4 (6.41)

10.11.2022

mp4 (7.50)

46

14.11.2022

mp4 (7.93)

17.11.2022

mp4 (8.75)

47

21.11.2022

mp4 (8.138)

24.11.2022

mp4 (8.179)

48

28.11.2022

mp4 (9.34)

01.12.2022

mp4 (9.102)

49

05.12.2022

mp4 (9.159)

08.12.2022

mp4 (10.47)

50

12.12.2022

mp4 (10.82)

15.12.2022

mp4 (11.52, 12.12)

51

19.12.2022

mp4 (13.53)

22.12.2022

mp4 (14.75)

52

vorlesungsfrei

vorlesungsfrei

01

vorlesungsfrei

vorlesungsfrei

02

09.01.2023

mp4 (15.48)

12.01.2023

mp4 (15.118)

03

16.01.2023

mp4 (16.73)

19.01.2023

mp4 (17.60)

04

23.01.2023

mp4 (18.49)

26.01.2023

mp4 (19.47)

05

30.01.2023

mp4 (20.43)

02.02.2023

06

06.02.2023

09.02.2023

 

Die Zahl hinter dem mp4-Link gibt an, bis zu welcher Präsentation die Aufzeichnung geht (Lehrinhalt Thema x, Präsentationsnummer y: x.y). 

 

Zeit und Ort

  • Vorlesung: Montags 14:15 - 15:45 Uhr im Raum IFIS 2035, donnerstags 10:15 - 11:45 Uhr im Raum IFIS 2035
  • Übung: Freitags 08:30 - 10:00 Uhr im Seminarraum Mathematik 2 (Banach)

Beginn:

Vorlesung: Montag, den 17.10.2022
Übung: Freitag, den 28.10.2022

Voraussetzungen:

  • Algorithmen und Datenstrukturen
  • Analysis
  • Lineare Algebra und Diskrete Strukturen
  • Datenbanken
  • Programmierung
  • Stochastik oder Biostatistik
  • kontextfreie Grammatiken

Vorteilhaft:

  • Einführung in die Logik

Qualifikationsziele / Kompetenzen:

Wissen

Studierende können die Hauptmerkmale von Standard-Datenbanken benennen und erläutern, welche Non-Standard-Datenmodelle entstehen, wenn die Merkmale fallengelassen werden. Sie können beschreiben, welche Kernideen hinter den in der Veranstaltung behandelten Non-Standard-Datenmodellen stehen, indem sie erklären, wie die entsprechenden Anfragesprachen zu verstehen sind (Syntax und Semantik) und welche Implementierungstechniken hauptsächlich zu ihrer praktischen Umsetzung eingesetzt werden. Weiterhin können Studierende elementare Data-Mining-Techniken auch im Zusammenhang mit Nicht-Standard Datenbanken erläutern.

Fertigkeiten

Studierende können Anfragesprachen für Non-Standard-Datenmodelle, die im Kurs eingeführt wurden, anwenden, um bestimmte Strukturen aus Beispieldatenbeständen heraussuchen zu können, so dass sich Informationsbedürfnisse befriedigen lassen. Die Studierenden sind in der Lage, Datenmodelle in das relationale Datenmodell unter Verwendung von eingeführten Kodierungstechniken zu übersetzen, so dass sie demonstrieren können, wie neue Formalismen mit dem relationalen Modell in Beziehung stehen und in SQL implementiert werden können (insbesondere SQL-2011). Für den Fall, dass eine Übersetzung in SQL nicht möglich ist, können die Studierenden angepasste Algorithmen erläutern und anwenden. Studierende können weiterhin demonstrieren, wie Indexstrukturen eine schnelle Anfragebeantwortung ermöglichen, indem sie zeigen, wie Indexstrukturen aufgebaut, verwaltet und bei der Anfragebeantwortung ausgenutzt werden. Die Kursteilnehmer können Anfrageantworten Schritt für Schritt herleiten, indem sie optimierte Ausführungspläne bestimmen. Darüber hinaus können sie elementare Techniken für das Data-Mining umsetzen.

Sozialkompetenz und Selbständigkeit

Studierende arbeiten in Gruppen, um Aufgaben zu bearbeiten und zu lösen, und sie werden angeleitet, selbst erarbeitete Lösungen in einem Kurzvortrag zur Diskussion zu stellen (in der Übung). Weiterhin wird die Selbständigkeit der Studierenden durch Aufzeigen von konkret verfügbaren Datenbanksystemen gefördert, so dass die Studierenden selbstbestimmt Arbeiten in einem praktischen Kontext durchführen können.


Moodle:

Weitere Informationen sowie Materialien zur Vorlesung und Übung sind unter Moodle zu finden.

Für den Zugriff müssen Sie sich selbst in den Kurs einschreiben. Dies wird spätestens zum Kursbeginn am 17.10.2022 möglich sein.

Literatur:

  • A.U. Tansel, J. Clifford, S. Gadia, S. Jojodia, A. Segev, R. Snodgrass, Temporal Databases: Theory, Design, and Implementation, Benjamin Cummings Publishing Company, 1993
  • J. Chomicki, G. Saake (Eds.), Logics for Databases and Information Systems, Springer, 1998
  • S. Abiteboul, P. Buneman, D. Suciu, Data on the Web - From Relations to Semistructured Data and XML, Morgan Kaufmann, 1999
  • P. Rigaux, M. Scholl, A. Voisard, Spatial Databases With Applications to GIS, Morgan Kaufmann, 2001
  • C. J. Date, H. Darwen, N.A. Lorentzos, Time and Relational Theory: Temporal Databases in the Relational Model and SQL, Morgan Kaufmann, 2014 
  • S. Chakravarthy, Q. Jiang, Stream Data Processing A Quality of Service Perspective, Springer, 2009
  • P. Revesz, Introduction to Databases- From Biological to Spatio-Temporal, Springer 2010
  • D. Suciu, D. Olteanu, Chr. Re, Chr. Koch, Probabilistic Databases, Morgan & Claypool, 2011
  • S. Ceri, A. Bozzon, M. Brambilla, E. Della Valle, P. Fraternali, S. Quarteroni, Web Information Retrieval, Springer, 2013