Teamprojekt: Aufbau eines Rail Data Hubs mithilfe von Webcrawlern

Aufgabenstellung

Wie entwickelt sich der Wettbewerb im europäischen Schienenpersonenfernverkehr? Ziel ist die Analyse dieser Entwicklungen anhand von Preis- und Kapazitätsdaten, die bislang wenig verfügbar sind. Dafür soll ein (z.B. Python-basiertes) Tool entwickelt werden, das Daten aus unterschiedlichen Quellen (DB, Flixtrain, Trenitalia etc.) in einem räumlich/zeitlich begrenzten Rahmen regelmäßig automatisiert herunterlädt, harmonisiert und analysiert. Das Produkt umfasst eine Eingabemaske, eine Ausgabedatenbank sowie ein Modul zur Wettbewerbsanalyse. KI sollte verwendet werden, wobei dann die Erfahrungen damit zu beschreiben sind. Ein Handbuch mit Erklärungen des Codes sowie ein Lastenheft für Erweiterungen sind zu verfassen. Auch ein schriftlicher Teil zur Analyse des Wettbewerbs ist vorgesehen.

 

Vorgehen

Sie legen fest, welche Daten gebraucht werden, finden heraus, in welcher Struktur diese vorhanden sind und entscheiden, wie diese am Ende einheitlich gespeichert werden, um einen Wettbewerbsvergleich zu ermöglichen. Dann prüfen Sie rechtliche und technische Machbarkeiten. Anschließend entwickeln Sie den versatilen oder jeweils spezifischen Webcrawler. Sie prüfen die generierten Daten auf Auffälligkeiten (z.B. extreme Preissprünge, Lücken, geänderte Website-Struktur) und lassen das System möglichst automatisch reagieren (z.B. Crawler anpassen, Warnung ausgeben). Außerdem erstellen Sie ein Cockpit mit Grafiken, Trends und Alarmmeldungen. Schließlich beschreiben und diskutieren Sie die Wettbewerbssituation aus verkehrsökonomischer Perspektive anhand von qualitativen und quantitativen Analysen.

 

Vorkenntnisse

VWL 1, Mikroökonomie. Grundkenntnisse in der Programmierung

 

Fachzuordnung

Wahlpflicht oder VWL oder beides

 

Anmeldung

Zentral über das Wiwi-Portal

Bei Fragen zur Anmeldung wenden Sie sich bitte an Kirsten Greiner (kirsten.greiner@kit.edu).