Bitte auf den Obermenüpunkt klicken!

Datenanalyse und -auswertung

Was ist Datenanalyse bzw. -Auswertung?

Das Ziel der Datenanalyse bzw. Datenauswertung besteht darin, wichtige Informationen aus den Rohdaten der Prozesse zu gewinnen. Hierfür werden verschiedene Methoden und statistische Verfahren angewendet. Die gewonnenen Erkenntnisse werden in der Regel durch Metriken und Visualisierungen veranschaulicht.

Datenbereinigung

Vor der eigentlichen Auswertung ist es wichtig, die Daten zu verstehen und sicherzustellen, dass sie korrekt und vollständig sind. Fehlerhafte oder fehlende Daten können die Ergebnisse und die daraus gezogenen Schlussfolgerungen verfälschen. Methoden zur Ausreißer- oder Anomaliedetektion können verwendet werden, um mögliche Fehler in den Daten zu identifizieren. Werden fehlerhafte oder fehlende Daten erkannt, können sie entweder markiert oder bereinigt werden, um einen bereinigten Datensatz für die anschließende Analyse zu erhalten.

Einige Werkzeuge der Datenanalyse

Für die Datenauswertung stehen je nach Komplexität verschiedene Werkzeuge zur Verfügung. Diese reichen von Excel für die Auswertung kleiner Datensätze mit deskriptiver Statistik bis hin zu Skriptsprachen wie R und Python für die Analyse größerer Datenmengen. Es gibt auch größere Datenbankanwendungen, die zur Auswertung von Big Data eingesetzt werden können. Die Übergänge zwischen den einzelnen Werkzeugen sind fließend. Im Folgenden finden Sie eine Auswahl verschiedener Werkzeuge:

  • Deskriptive Statistik: Die deskriptive Statistik verwendet Kennzahlen wie Mittelwert, Median, Modus und Standardabweichung, um die Daten zu beschreiben und die Streuung der Daten zu ermitteln.
  • Inferenzstatistik: Hier werden statistische Methoden angewendet, um Schlussfolgerungen über eine größere Population auf Basis einer Stichprobe zu ziehen.
  • Explorative Datenanalyse(EDA): Die EDA umfasst die Anwendung statistischer Methoden, um Muster, Trends und Zusammenhänge in den Daten zu identifizieren. Visualisierungstechniken wie Diagramme, Histogramme und Streudiagramme helfen dabei, die Daten besser zu verstehen.
  • Künstliche Intelligenz (KI): KI ist ein Teilgebiet der Informatik, das sich damit beschäftigt, Maschinen intelligent zu machen. Dabei geht es darum, dass Maschinen angemessen und vorausschauend und lernfähig in ihrer Umgebung agieren können. Dazu gehören die Wahrnehmung von Sinneseindrücken, die Verarbeitung von Informationen, das Speichern von Wissen, das Verstehen und Erzeugen von Sprache sowie das Lösen von Problemen und das Erreichen von Zielen. KI befasst sich mit Methoden, die es Computern ermöglichen, solche Aufgaben zu bewältigen, für die normalerweise menschliche Intelligenz erforderlich ist.
  • Maschinelles Lernen (ML): ML ist ein Teilbereich der Künstlichen Intelligenz, der sich darauf konzentriert, Algorithmen zu entwickeln, mit denen Computer aus Daten lernen können, ohne explizit programmiert zu werden. Das Lernen erfolgt durch Erfahrung und die Anpassung an veränderliche Daten. Das Ergebnis sind Modelle, die in der Lage sind, Klassifikationen durchzuführen, Vorhersagen zu treffen oder in einer künstlichen Umgebung interaktiv zu agieren und Entscheidungen zu treffen. ML-Algorithmen können für Vorhersagen, Klassifizierungen, Clusteranalysen und mehr verwendet werden.