Die RAG fördert bis Ende 2018 in Deutschland Steinkohle im Untertagebau und trägt weiterhin die Verantwortung für die daraus resultierenden Folgen in Nordrhein-Westfalen und im Saarland. Seit fast 200 Jahren werden unter Tage Tausende von Schächten und anderen Hohlräumen erschlossen, viele davon zu einer Zeit, als Computer und 3D-Modelle noch unbekannt waren.
Durch die kontinuierliche Überwachung von Bodenanomalien ist die RAG in der Lage, potenziell betroffene Bereiche frühzeitig zu identifizieren. (Ein sehr erfolgreicher Algorithmus resultierte sogar aus einer früheren Data Hub Challenge "Räumliche Mustererkennung"). Doch trotz aller Präventionsbemühungen kommt es in der Region immer wieder zu Sachschäden durch den (ehemaligen) Bergbau. Die RAG ist für viele dieser Schäden haftbar und entschädigt die betroffenen Eigentümer. Daher ist ein gutes Verständnis der zu erwartenden Entschädigungskosten für die RAG geschäftskritisch. Zusätzlich zu jahrzehntelanger individueller Expertise verwenden die Experten bereits etablierte Vorhersagemodelle, die auf der Größe und Bevölkerungsdichte des stillgelegten Gebiets basieren.
Das Ziel dieses Anwendungsfalls ist es, historische Daten von Sachschäden zu nutzen, um zukünftige Entschädigungskosten besser vorherzusagen. Es wird angenommen, dass die Anzahl und der Wert der geltend gemachten Schäden in allen Stillstandsgebieten einer ähnlichen "Kurve" über die Zeit folgen. Daher sollten historische Schadendaten aus Gebieten, die bereits über einen längeren Zeitraum stillgelegt waren, es uns ermöglichen, Schadendaten von erst kürzlich stillgelegten Bergbaugebieten vorherzusagen. Wir erwarten eine präzisere Vorhersage als die aktuellen Modelle und eine frühere Erkennung von möglichen Überschreitungen der Rückstellungen.
Eine zusätzliche Möglichkeit zur Verbesserung der Vorhersagequalität wäre die Berücksichtigung der Lokalität der Claims. Wenn zum Beispiel ähnliche Ansprüche von 3 von 5 Häusern in einer Straße eingehen, ist die Wahrscheinlichkeit von Ansprüchen der anderen 2 Hausbesitzer relativ hoch.
Es liegen Daten von mehreren tausend Schadensfällen pro Jahr aus bis zu 43 Stilllegungsgebieten vor. Insbesondere die Schadendaten seit 2000 können als vollständig und qualitativ hochwertig angesehen werden (Datum, Wert, Art des Schadens, Art des Gebäudes, Ort).
Ihr habt euch bereits zur Challenge angemeldet und wollt Bei der Q&A-Session dabei sein? Hier geht es zur Anmeldung!
Das Projekt kann in drei Meilensteine unterteilt werden:
Wir haben es uns zur Aufgabe gemacht, Dateninnovationen in der B2B- und Industriewelt zu fördern. Werde Mitglied in unserem DataHub Ruhr Netzwerk und erhalte aktuelle Informationen über spannende Challenges und Matchmaking Events aus dem Ruhrgebiet.