Erprobung von Large Language Models zur strukturierten Auswertung maritimer NavTex-Meldungen

Art der Arbeit: Masterarbeit

Fachlicher Hintergrund:

NavTex wird seit Jahren in der Seefahrt für die Übermittlung wichtiger und sicherheitskritischer Nachrichten in Textform verwendet. Die Nachrichten werden für ein Seegebiet über Mittelwelle ausgestrahlt. Die Nachrichten sind dabei nur semi-strukturiert. Ohne genauere Überprüfung ist nicht klar, ob eine Nachricht ein Seefahrzeug betrifft, ob dringend gehandelt werden muss oder ob eine Routenänderung notwendig wird.

Aufgabenbeschreibung:

Im Rahmen der Arbeit sollen Nachrichten automatisiert ausgewertet werden. Mögliche Einsatzzwecke wären z.B. die frühzeitige Planung von Routen- und Fahrplanänderungen sowie eine Entscheidungsunterstützung für eine Anomalie-Erkennung im Schiffsbetrieb.

Als erster Schritt sollen NavTex-Nachrichten kategorisiert und formalisiert werden.

Dabei sind folgende Fragen wichtig:

Wie gut lassen sich NavTex-Nachrichten verstehen / formalisieren?
Wie hoch ist Fehlerrate bei der Erkennung des Nachrichteninhalts?
Wie gut funktioniert die Bewertung der Wichtigkeit einer Nachricht? (Info, Warning, Danger, Critical usw.)
Wie gut können Übertragungsfehler kompensiert werden?
Wie hoch ist der Rechenaufwand dafür?

Die Nachrichten könnten durch ein Large Language Model verarbeitet werden, idealerweise mit vertrebarem Aufwand lokal auf dem Schiff.

Mögliche Arbeitsschritte:

Exploration der Daten (NavTex Nachrichten in verschiedenen Sprachen aus unterschiedlichen Regionen)
Auswahl eines Testdatensatzes
Bewertung der Datenqualität
Sichtung möglicher Verfahren (Regelbasiert, Cloud LLM, Lokales LLM)
Erarbeitung von Bewertungskriterien für vergleichende Experimente
Konzeption eines Experiments zur Qualitäts- und Aufwandsermittlung
Implementierung eines Prototyps mit verschiedenen Ansätzen
Evaluation und Auswertung

Die genaue Festlegung des Themas erfolgt in Abstimmung mit den Betreuern unter Berücksichtigung eventuell schon an andere Studenten vergebener Themengebiete. Eine gemeinsame Bearbeitung verschiedener Teilthemen durch mehrere Studenten ist unter Umständen möglich.

Literatur und Ressourcen:

Zhao, Haiyan, et al. "Explainability for large language models: A survey." ACM Transactions on Intelligent Systems and Technology 15.2 (2024): 1-38.
Zhao, Wayne Xin, et al. "A survey of large language models." arXiv preprint arXiv:2303.18223 1.2 (2023).
Sun, Pengbo, Yi Zuo, and Yudi Wang. "Classification model for NAVTEX navigational warning messages based on adaptive weighted TF-IDF." Proceedings of the 10th Multidisciplinary International Social Networks Conference. 2023.
Sameera Sulakshana, Baragama Kuruppuge. "New Technologies to Enhance GMDSS and Reduce Workload on Deck Officers." (2024).

Betreuer: Dr. Thomas Mundt (thomas.mundt@uni-rostock.de)

Voraussetzungen: Keine besonderen, Programmierkenntnisse in einer höheren Programmiersprache sind von Vorteil.

Für Studierende

Mitarbeiter

Erprobung von Large Language Models zur strukturierten Auswertung maritimer NavTex-Meldungen

Kontakt

Service