Building an information-rich AST for Deep Learning-based Code Analysis

- Bachelorarbeit -



Beschreibung:

In dieser Bachelorarbeit wird eine neue Methode zum Erstellen informationsreicher Abstract Syntax Trees (ASTs) mit dem vorhandenem Tree-Sitter Framework vorgestellt. Informationsreiche ASTs sind besser für eine Codeanalyse auf der Basis von Deep Learning geeignet. Herkömmliche ASTs weisen einige Mängel auf, die sie für Deep Learning ungeeignet machen. Diese Arbeit verbessert die von Tree-Sitter generierten
ASTs, sodass sie den Code genauer darstellen und umfangreiche Codeinformationen bereitstellen können. 

[1] Jinghua Groppe, Sven Groppe, Ralf Möller, Variables are a Curse in Software Vulnerability Prediction. The 34th International Conference on Database and Expert Systems Applications (DEXA), Panang, Malaysia, 2023. https://doi.org/10.1007/978-3-031-39847-6_41

[2] Jinghua Groppe, Sven Groppe, Daniel Senf, Ralf Möller. There Are Infinite Ways to Formulate Code: How to Mitigate the Resulting Problems for Better Software Vulnerability Detection, Information 15(4), 2024. https://doi.org/10.3390/info15040216

Anforderungen/Kenntnisse:
Python

Bearbeitung:
Zirui Zhang

Ergebnis:
Die Ausarbeitung kann im Institut für Informationssysteme angefordert werden.

Betreuung:

Dr. Jinghua Groppe
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck

Prof. Dr. rer.nat. habil. Sven Groppe
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 3101 5706