NEU: Bitte auf den Obermenüpunkt klicken!

Datenauswertung und –analyse

Die Datenauswertung wird in drei Kategorien eingeteilt: der auf deterministischen Ansätzen beruhenden Modellierung von Prozessen, der Anwendung von statistischen Verfahren zur Ermittlung von Trends bzw. Mustern aus großen Datenmengen sowie schließlich der (rein datengetriebenen) künstlichen Intelligenz.

Modellierung

Die Modellierung der realen Welt ist Gegenstand der elektronischen Datenverarbeitung seit ihren Anfängen in den 40er Jahren des 20. Jahrhunderts. Die Möglichkeiten der Miniaturisierung von Sensoren, der schnellen Datenübertragung, der Speicherung und Administration umfangreicher Datenmengen sowie der ultraschnellen Weiterverarbeitung gestatten es, die sich wandelnde Realität in sehr komplexen Modellen in Echtzeit abzubilden. Wo Kausalzusammenhänge nicht beschreibbar sind, lassen sie sich in vielen Fällen mit befriedigendem Ergebnis durch Wahrscheinlichkeitsaussagen ersetzen.

Beispiele:

  • Ein Pumpenlaufrad lässt sich aufgrund der spezifischen Einsatzsituation hinsichtlich Materialauswahl und Geometrie individuell auslegen, um Kavitationserscheinungen konstruktiv auszuschließen.
  • Anlagen lassen sich bereits in der Planungsphase als dreidimensionales Modell abbilden, um z. B. Fragen der Bedienergonomie und Arbeitssicherheit frühzeitig berücksichtigen zu können.
Korrelationsanalyse und Data Mining

Die schnelle maschinelle Auswertung umfangreicher Datenmengen aus unterschiedlichsten Quellen gestattet es, Muster zu erkennen, die durch menschliche Sinne nicht zu erfassen sind. Zueinander passende Auffälligkeiten werden als Korrelationen bezeichnet. Wesentlich ist, dass die Korrelation nicht mit der ursächlichen Kausalität verwechselt werden darf: Besteht ein kausaler Ursache-Wirkungs-Zusammenhang, dann äußert der sich auch in entsprechenden Korrelationen. Das ist umgekehrt nicht zwangsläufig so.

Beispiel:

  • Es kann, je nach betrachtetem Krankenhaus, eine starke (negative) Korrelation zwischen der Geburtenhäufigkeit einerseits und andererseits der Wochentage Samstag und Sonntag bestehen. Das ist nicht auf die natürlichen Rahmenbedingungen zurückzuführen, sondern dass aufgrund der finanziellen Zwänge im Gesundheitssystem Wochenendgeburten durch gezielte Maßnahmen möglichst vermieden werden.

Für die Korrelationsanalyse stehen inzwischen Datenverarbeitungsprogramme zur Verfügung, die mit mehr oder weniger spezialisiertem Vorwissen genutzt werden können (z.B. SIREN, Python/R/Matlab).

Künstliche Intelligenz (regelbasierte Algorithmen, maschinelle Lernsysteme und Deep Learning)

Der Begriff „Künstliche Intelligenz (KI)“ wurde Mitte des letzten Jahrhunderts erstmals für die Idee verwendet, mit Hilfe von Computersystemen Vorgänge des menschlichen Denkens und Entscheidungsprozesse zu automatisieren und zu mechanisieren. In den 70er Jahren des letzten Jahrhunderts wurden dann erstmals computerbasierte Expertensysteme entwickelt. In den 1990er Jahren begannen die ersten Versuche Algorithmen mit maschinellen Lernsystemen darauf zu trainieren, Muster in großen Datenmenge zu finden und zu nutzen. Diese Methode wurde weiterentwickelt und ausgebaut, so dass es heute eine Reihe verschiedener methodischer Ansätze gibt, um Algorithmen zu trainieren (z.B. überwachtes oder nicht überwachtes Lernen, Deep Learning), die unter dem Oberbegriff maschinelles Lernen zusammengefasst werden.

KI-Anwendungen und KI-basierte Systeme werden i.d.R. verwendet, um unbekannte Muster zu extrahieren, Prognosen und Klassifikationen durchzuführen. Bei allen bisher entwickelten KI-Anwendungen und KI-basierten Systemen handelt es sich um sogenannte „schwache KI“, die rein datengetrieben (statistisch) erstellt werden und jeweils nur für einen bestimmten abgegrenzten Einsatzzweck oder der Lösung eines konkreten Anwendungsproblems entwickelt wurden. Ein wichtiges Merkmal ist dabei, dass es sich um Black-Box-Modelle handelt, d.h. die eigentlichen Entscheidungsmechanismen der KI sind unbekannt.

Beispiele:

  • Prognose des Trinkwasserbedarfs in einer definierten Druckzone für den Weihnachtsabend des kommenden Jahres.
  • Prognose des Ausfalls einer Pumpe aufgrund überlanger oder übergroßer Beanspruchung, auf der Grundlage zahlreicher unterschiedlicher Sensordaten, eines digitalen Modells der Pumpe und gesicherter Erkenntnisse über Materialversagen z. B. aufgrund von Schwingungsbeanspruchung.

Weiterführende Informationen

Die vollständigen Texte zu den vorgestellten Techniken der Datenauswertung und –analyse finden Sie im Dokument „Schlüsseltechniken der Digitalisierung für die Wasserwirtschaft“, dass im Mitgliederbereich als PDF Download zur Verfügung steht.