Bachelor Seminar Informatik (CS3702 + CS3703)


Web and Data Science

Forschung in vielen Disziplinen wird durch automatisierte Verarbeitung von Daten in verschiedener Weise substantiell unterstützt, wobei der Wandel vom einer anfänglichen Zusatzfunktion hin zu einer essentiellen Ressource für die Wissenschaft längst vollzogen ist. Die Informatik ist in vielen Disziplinen hier sogar der treibende Faktor. Data-Mining-Verfahren werden eingesetzt, um Programme für Experimente zu generieren und um Muster und Trends zu finden, so dass neue Erkenntnisse in den verschiedenen Wissenschaften gewonnen werden und neue Anwendungsfelder erschlossen werden können. Der Wandel ist bedingt durch große Datenmengen (big data), die in vielen Fällen sogar frei verfügbar sind.

In dem Seminar behandeln wir das Phänomen unten dem Namen Web und Data Science aus verschiedener Perspektive. Wie können große und komplex strukturierte Datenmengen analysiert werden, oder wie können wir Wissen aus nicht-strukturierten Daten gewinnen?

Am Mittwoch, den 22.07.2015, um 14 Uhr s.t. findet eine Vorbesprechung im IFIS Seminarraum 2035 statt.

Am Donnerstag, den 22.10.2015, um 13 Uhr s.t. findet eine 2. Vorbesprechung im IFIS Seminarraum 2035 statt.

Für den Erwerb eines Seminarscheins wird von den Studierenden in angemessener Form ein (ggf. bewerteter) Vortrag gehalten. Präsentationsmaterialen werden abgegeben (und ggf. auch bewertet).

Weitere Informationen zu dieser Veranstaltung sind in Kürze auch unter Moodle zu finden.

Folgende Papiere können als Seminarthema von den Studierenden erarbeitet werden:

  • Matei Zaharia, Mosharaf Chowdhury, Michael J. Franklin, Scott Shenker, and Ion Stoica. 2010. Spark: Cluster Computing with Working Sets. In Proceedings of the 2nd USENIX conference on Hot topics in cloud computing (HotCloud'10). USENIX Association, Berkeley, CA, USA, 10-10.
  • Amr Ahmed, Nino Shervashidze, Shravan Narayanamurthy, Vanja Josifovski, and Alexander J. Smola. 2013. Distributed Large-scale Natural Graph Factorization. In Proceedings of the 22nd international conference on World Wide Web (WWW '13). International World Wide Web Conferences Steering Committee, Republic and Canton of Geneva, Switzerland, 37-48.
  • Grzegorz Malewicz, Matthew H. Austern, Aart J. C. Bik, James C. Dehnert, Ilan Horn, Naty Leiser , and Grzegorz Czajkowski. Pregel: a system for large-scale graph processing. In Proceedings of the 2010 international conference on Management of data, SIGMOD '10, pages 135-146. ACM, 2010.