Erprobung von Large Language Models zur strukturierten Auswertung maritimer NavTex-Meldungen
Art der Arbeit: Masterarbeit
Fachlicher Hintergrund:
NavTex wird seit Jahren in der Seefahrt für die Übermittlung wichtiger und sicherheitskritischer Nachrichten in Textform verwendet. Die Nachrichten werden für ein Seegebiet über Mittelwelle ausgestrahlt. Die Nachrichten sind dabei nur semi-strukturiert. Ohne genauere Überprüfung ist nicht klar, ob eine Nachricht ein Seefahrzeug betrifft, ob dringend gehandelt werden muss oder ob eine Routenänderung notwendig wird.
Aufgabenbeschreibung:
Im Rahmen der Arbeit sollen Nachrichten automatisiert ausgewertet werden. Mögliche Einsatzzwecke wären z.B. die frühzeitige Planung von Routen- und Fahrplanänderungen sowie eine Entscheidungsunterstützung für eine Anomalie-Erkennung im Schiffsbetrieb.
Als erster Schritt sollen NavTex-Nachrichten kategorisiert und formalisiert werden.
Dabei sind folgende Fragen wichtig:
- Wie gut lassen sich NavTex-Nachrichten verstehen / formalisieren?
- Wie hoch ist Fehlerrate bei der Erkennung des Nachrichteninhalts?
- Wie gut funktioniert die Bewertung der Wichtigkeit einer Nachricht? (Info, Warning, Danger, Critical usw.)
- Wie gut können Übertragungsfehler kompensiert werden?
- Wie hoch ist der Rechenaufwand dafür?
Die Nachrichten könnten durch ein Large Language Model verarbeitet werden, idealerweise mit vertrebarem Aufwand lokal auf dem Schiff.
Mögliche Arbeitsschritte:
- Exploration der Daten (NavTex Nachrichten in verschiedenen Sprachen aus unterschiedlichen Regionen)
- Auswahl eines Testdatensatzes
- Bewertung der Datenqualität
- Sichtung möglicher Verfahren (Regelbasiert, Cloud LLM, Lokales LLM)
- Erarbeitung von Bewertungskriterien für vergleichende Experimente
- Konzeption eines Experiments zur Qualitäts- und Aufwandsermittlung
- Implementierung eines Prototyps mit verschiedenen Ansätzen
- Evaluation und Auswertung
Die genaue Festlegung des Themas erfolgt in Abstimmung mit den Betreuern unter Berücksichtigung eventuell schon an andere Studenten vergebener Themengebiete. Eine gemeinsame Bearbeitung verschiedener Teilthemen durch mehrere Studenten ist unter Umständen möglich.
Literatur und Ressourcen:
- Zhao, Haiyan, et al. "Explainability for large language models: A survey." ACM Transactions on Intelligent Systems and Technology 15.2 (2024): 1-38.
- Zhao, Wayne Xin, et al. "A survey of large language models." arXiv preprint arXiv:2303.18223 1.2 (2023).
- Sun, Pengbo, Yi Zuo, and Yudi Wang. "Classification model for NAVTEX navigational warning messages based on adaptive weighted TF-IDF." Proceedings of the 10th Multidisciplinary International Social Networks Conference. 2023.
- Sameera Sulakshana, Baragama Kuruppuge. "New Technologies to Enhance GMDSS and Reduce Workload on Deck Officers." (2024).
Betreuer: Dr. Thomas Mundt (thomas.mundt@uni-rostock.de)
Voraussetzungen: Keine besonderen, Programmierkenntnisse in einer höheren Programmiersprache sind von Vorteil.
