Lösungen: IoT (Internet of Things)

Die Zahl der im Internet of Things vernetzten Elemente wird weiter exponentiell steigen. Das Internet of Things verknüpft Fertigungssysteme, medizinische Geräte und eine Vielzahl von Sensoren, die zur Aufnahme und Weitergabe von Daten entwickelt wurden. Im Ergebnis werden so Unmengen an Daten produziert und gespeichert, in denen sich wertvolle Informationen verbergen. Diese Informationen freizulegen ist jedoch nicht trivial: Zunächst müssen die Daten so aufbereitet und strukturiert werden, dass sie einer Analyse überhaupt zugänglich sind. Dann sind geeignete Algorithmen anzuwenden und Modelle aufzubauen, die wertvolle Aussagen und Prognosen ermöglichen. Schließlich ist zu entscheiden, auf welcher Plattform Modelle auf neue Daten angewendet werden. Sollen die Daten zu dem Modell übertragen werden oder kann das Modell zu den Daten transportiert und dort ablaufen?

Die Software-Plattform Statistica für Advanced Analytics bietet alle Funktionen, um den speziellen Anforderungen an die Analyse dieser verteilten Datenmengen aus dem Internet of Things gerecht zu werden. Neben den in Statistica implementierten Funktionen für Datenzugriffe und Datentransformationen ist eine wichtige Eigenschaft für die Analyse solcher Daten die Unterstützung der so genannten Native Distributed Analytics Architektur (NDAA). Im Wesentlichen bedeutet dies, dass man nicht die auszuwertenden Daten in die Analysesoftware wie Statistica importieren muss sondern anders herum die Analyse auf die Plattform befördert, auf der die zu analysierenden Daten liegen. So würde man ein Prognosemodell wie zum Beispiel ein Neuronales Netz oder ein anderes Verfahren des maschinellen Lernens in Statistica erstellen und es im Anschluss aus Statistica heraus automatisch in eine Sprache wie zum Beispiel Java, C, C++, PMML oder SQL exportieren. Dabei ist es möglich, nicht nur das Prognosemodell zu übertragen, sondern auch komplexe Schritte der Datenvorbereitung und Regeln für die Anwendung von Modellen.

Der Vorteil ist, dass man keine riesigen Datenbestände über Leitungsnetze übertragen muss. Daten können vielmehr dort vorbereitet und analysiert werden, wo sie entweder gespeichert sind wie in relationalen Datenbanken oder Hadoop-Clustern, oder direkt dort wo sie anfallen wie bei Sensoren oder Gateways. Die Ergebnisse der Analysen können dann wieder in die Analyseplattform Statistica zur genaueren Inspektion und Bereitstellung für die Konsumenten exportiert werden.

Alle erforderlichen Prozessschritte von der Datenvorbereitung und Modellerstellung bis zur Generierung des passenden Skripts lassen sich in der Projektoberfläche von Statistica grafisch aufbauen und spezifizieren. Das fertige Projekt kann dann in der Systemumgebung von Statistica abgelegt werden und automatisch einmalig oder wiederholt ablaufen. Das Projekt lässt sich zu einem späteren Zeitpunkt beliebig modifizieren.

Referenzen

Kontakt