
Pan-European Railway Data Factory schafft Grundlage für KI-basierten Bahnbetrieb
Der europäische Bahnsektor befindet sich aktuell in einem der größten Technologiesprünge in seiner Geschichte: Viele Eisenbahninfrastrukturunternehmen sowie Eisenbahnverkehrsunternehmen in Europa streben hohe Grade der Automatisierung und Digitalisierung des Bahnbetriebes an. Ziel dabei ist es, die Kapazität und Zuverlässigkeit des Bahnbetriebes deutlich zu erhöhen. In Deutschland wurde hierfür die Sektorinitiative Digitale Schiene Deutschland (DSD) ins Leben gerufen.
Automatisierung und Digitalisierung gehen einher mit einer zunehmenden Erhebung und Nutzung von Daten. Insbesondere im Kontext des vollautomatisierten Fahrens (sog. Automated Train Operation in Grade of Automation 4, ATO GoA4) werden Sensoren und Kameras benötigt, um automatisiert mit künstlicher Intelligenz (KI) auf Gefahren im Bahnumfeld reagieren zu können. Um z. B. KI-Software für die Umgebungswahrnehmung zu entwickeln, benötigt es sehr große Datenmengen mit sehr hoher Datenqualität. Es ist hierbei zunehmend ersichtlich, dass einzelne Eisenbahnunternehmen oder Hersteller zukünftig nicht genügend Sensordaten bereitstellen können, um die KI für den vollautomatisierten Bahnbetrieb ausreichend zu trainieren.
Dies steht hinter der Überlegung einer sogenannten „pan-European Railway Data Factory“ – eine Art Ökosystem mit einer gemeinsamen Infrastruktur, welches es Bahnunternehmen und Herstellern ermöglicht, Sensordaten europaweit zu sammeln, zu verarbeiten, zu simulieren und für die gegenseitige Nutzung zur Verfügung zu stellen. Ziel ist es, eine einheitliche Softwaretoolkette aufzubauen, welche es ermöglicht KI-Modelle zu trainieren und zu zertifizieren, um sie im vollautomatisierten Bahnbetrieb zum Einsatz zu bringen.
Das CEF2 RailDataFactory project ist eine gemeinsam von DB, SNCF und NS durchgeführte und von der European Health and Digital Executive Agency (HADEA) co-finanzierte Studie. Ähnliche Programme existieren in anderen europäischen Ländern, ebenso wie große EU-weite Initiativen wie Europe’s Rail. Die Studie strebt an, die Umsetzbarkeit einer pan-European Railway Data Factory aus technischer, wirtschaftlicher, rechtlicher, regulatorischer und operativer Sicht zu bewerten. Ziel ist es aufzuzeigen, welche wesentlichen Aspekte berücksichtigt werden müssen, damit die pan-European Railway Data Factory erfolgreich ist.
Die Studie hat insbesondere zum Ziel
- wesentliche operative Szenarien und Use Cases zu identifizieren, die eine Data Factory abdecken sollte;
- die Anforderungen dieser Szenarien und Use Cases auf die Data Factory-Infrastruktur abzubilden (insbesondere in Hinblick auf das erforderliche Pan-European Railway Data Factory Backbone Network, IT-Sicherheit sowie Daten- und IT-Plattformen, etc.);
- rechtliche und regulatorische Aspekte zu ermitteln, die bei der Data Factory berücksichtigt werden müssen, ebenso wie die Erarbeitung eines ökonomischen -Modells mit Fokus auf Incentivierung;
- konkrete Empfehlungen auszusprechen, wie eine pan-European Railway Data Factory aufgesetzt werden könnte (ggf. mit der Betrachtung von Vor- und Nachteilen verschiedener Optionen, wenn keine einzelne Empfehlung ausgesprochen werden kann).
Die Studie startete im Januar 2023 und soll im September 2023 abgeschlossen sein. Durch ein so genanntes Rail Advisory Board und eine enge Synchronisation mit Data-Factory-bezogenen Aktivitäten im EU-Rail FA2 R2DATO project wird gewährleistet, dass die Studie die Bedarfe des Bahnsektors berücksichtigt und im Einklang mit ähnlichen Aktivitäten durchgeführt wird.
In einem ersten Studienergebnis "D1 – Data Factory Concept, Use Cases and Requirements" beschreiben die Projektpartner das grundsätzliche Konzept der anvisierten pan-European Railway Data Factory. Außerdem werden darin die identifizierten operativen Szenarien und Use Cases gelistet. Daraus werden Anforderungen abgeleitet, z. B. das erforderliche pan-European Backbone Network sowie rechtliche, regulatorische oder auf IT-Sicherheit bezogene Aspekte, die adressiert werden müssen. Mittlerweile stehen drei weitere Studienergebnisse zur Verfügung (siehe Link).
Die Studienergebnisse stehen hier zum Download bereit: