Tool zur Verwaltung und zum Finden von Zitaten für wissenschaftliche Publikationen

- Masterarbeit -


Beschreibung:

Wissenschaftler werden häufig an sogenannten Impact Faktoren wie dem Hirsch Index [3] oder einer Variante [1] gemessen. Diese beruhen darauf wie häufig die Publikationen des Wissenschaftlers zitiert wurden. Aber auch für die Außendarstellung ist es wichtig zu zeigen, wie häufig und welche Publikationen die Publikationen des Wissenschaftlers zitiert haben.

In einer vorherigen Arbeit hier am Institut ist bereits ein Tool zum Verwalten von Publikationen eines Autors oder gar eines ganzen Instituts entstanden. Dieses Tool soll in dieser Arbeit erweitert werden, um Zitate von anderen Publikationen zu den verwalteten Publikation aufzunehmen und darzustellen. Darauf basierend können dann Impact Faktoren und deren Varianten ermittelt und evaluiert werden.

Zur Aufnahme und Finden der Zitate sollen verschiedene Vorgehensweisen konzeptioniert, umgesetzt und analysiert werden:

  • Manuelle Aufnahme von Zitaten
  • Abfragen von Informationen aus Literaturdatenbanken wie etwa CiteSeerX, die Publikationen u.a. für Zitate crawlen. Allerdings erlauben nicht alle Literaturdatenbanken den Zugriff auf ihre Informationen (siehe [4]).
  • Automatisierte Suche nach Zitaten. Hilfreich hierbei sind bestehende Extraktoren, die aus PDFs Informationen der Publikationen extrahieren können (siehe z.B. [2]). Es soll untersucht werden, in wieweit die Suche nach Zitaten zielgerichtet ablaufen kann. Hierbei sind Kontextinformationen mit zu berücksichtigen wie etwa das Jahr der Publikation, verwendete Stichwörter, bereits gefundene Zitate (Publikationen dieser Autoren, Stichwörter dieser Publikationen) etc.

Je nach Art der Arbeit (Bachelor- oder Masterarbeit) und Interesse des Studierenden kann auf einzelne Teilgebiete fokussiert werden.

[1] S. Alonso, F. Cabrerizo, E. Herrera-Viedma, and F. Herrera, "h-index: A review focused in its variants, computation and standardization for different scientific fields", Journal of Informetrics, vol. 3, no. 4, pp. 273 – 289, 2009.

[2] CiteSeerX, "CiteSeerExtractor - A RESTful API for extracting information from scholarly documents", citeseerextractor.ist.psu.edu/static/index.html, accessed: 2015-04-08.

[3] J. E. Hirsch, "An index to quantify an individual’s scientific research output", Proceedings of the National Academy of Sciences of the United States of America, vol. 102, no. 46, pp. 16 569–16 572, 2005. [Online]. Available: www.pnas.org/content/102/46/16569.abstract

[4] A. Kusserow, and S. Groppe, "Getting Indexed by Bibliographic Databases in the Area of Computer Science", Open Journal of Web Technologies (OJWT), vol. 1, no. 2, pp. 10 - 27, 2014. [Online]. Available: www.ronpub.com/publications/ojwt/OJWT_2014v1i2n02_Kusserow.html

Anforderungen/Kenntnisse:
Programmierung von Web-Servern und Browsern, insbesondere PHP, JavaScript, HTML und CSS

Bearbeitung:

Fabian Rosenthal

Ergebnis:
Die Ausarbeitung kann im Institut für Informationssysteme angefordert werden.

Betreuung:

Privatdozent Dr. rer.nat. habil. Sven Groppe
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 500 5706