Teamprojekt: Aufbau eines Rail Data Hubs mithilfe von Webcrawlern
- Typ: Teamprojekt
- Zielgruppe: Bachelor
- Dozent:
- ECTS: 9

Aufgabenstellung
Wie entwickelt sich der Wettbewerb im europäischen Schienenpersonenfernverkehr? Ziel ist die Analyse dieser Entwicklungen anhand von Preis- und Kapazitätsdaten, die bislang wenig verfügbar sind. Dafür soll ein (z.B. Python-basiertes) Tool entwickelt werden, das Daten aus unterschiedlichen Quellen (DB, Flixtrain, Trenitalia etc.) in einem räumlich/zeitlich begrenzten Rahmen regelmäßig automatisiert herunterlädt, harmonisiert und analysiert. Das Produkt umfasst eine Eingabemaske, eine Ausgabedatenbank sowie ein Modul zur Wettbewerbsanalyse. KI sollte verwendet werden, wobei dann die Erfahrungen damit zu beschreiben sind. Ein Handbuch mit Erklärungen des Codes sowie ein Lastenheft für Erweiterungen sind zu verfassen. Auch ein schriftlicher Teil zur Analyse des Wettbewerbs ist vorgesehen.
Vorgehen
Sie legen fest, welche Daten gebraucht werden, finden heraus, in welcher Struktur diese vorhanden sind und entscheiden, wie diese am Ende einheitlich gespeichert werden, um einen Wettbewerbsvergleich zu ermöglichen. Dann prüfen Sie rechtliche und technische Machbarkeiten. Anschließend entwickeln Sie den versatilen oder jeweils spezifischen Webcrawler. Sie prüfen die generierten Daten auf Auffälligkeiten (z.B. extreme Preissprünge, Lücken, geänderte Website-Struktur) und lassen das System möglichst automatisch reagieren (z.B. Crawler anpassen, Warnung ausgeben). Außerdem erstellen Sie ein Cockpit mit Grafiken, Trends und Alarmmeldungen. Schließlich beschreiben und diskutieren Sie die Wettbewerbssituation aus verkehrsökonomischer Perspektive anhand von qualitativen und quantitativen Analysen.
Vorkenntnisse
VWL 1, Mikroökonomie. Grundkenntnisse in der Programmierung
Fachzuordnung
Wahlpflicht oder VWL oder beides
Anmeldung
Zentral über das Wiwi-Portal
Bei Fragen zur Anmeldung wenden Sie sich bitte an Kirsten Greiner (kirsten.greiner@kit.edu).