Big Data Analytik - Methodische Ausbildung in der Statistischen Datenwissenschaft

Datum: 
28. - 30. Oktober 2019

Trainer: 
Prof. Dr. Diego Kuonen, CStat PStat CSci von Statoo Consulting

Detaillierte Beschreibung des Trainings: 
Es steht außer Frage, dass Massendaten (d.h. der einfache, aber scheinbar revolutionäre Glaube, dass Daten wertvoll sind) und "maschinelles Lernen" (d.h. einfach ausgedrückt, ein Feld fortgeschrittener Statistiken, das für eine Welt großer Daten konzipiert ist) die Wirtschaft und Industrie, Wissenschaft, Technik und Regierung erfasst haben. Die Nachfrage nach Fähigkeiten in der Datenwissenschaft - ein Rebranding des Data Mining - ist in Sektoren, in denen Wert, Wettbewerbsfähigkeit und Effizienz durch Daten bestimmt werden, beispiellos. Dies wird heute durch die digitale Transformation und die damit verbundene Datenrevolution noch verstärkt.

Data-Mining-Technologie und -Methodik wurden und werden eingesetzt, um verschiedene Prozesse in Wirtschaft und Industrie, Wissenschaft, Technik und Verwaltung zu verstehen und zu optimieren. Es wird allgemein angenommen, dass Data Mining einen tiefgreifenden Einfluss auf unsere Gesellschaft haben wird und dass Data Mining einen echten Mehrwert bringen kann. Aber wie kann Data Mining dazu beitragen, Operational Excellence zu erreichen? Lohnt sich Data Mining oder ist es ein "statistisches Déjà vu"?

Kursinhalte: 
Dieses dreitägige Training vermittelt Ihnen einen Überblick über die Möglichkeiten und Grenzen des Data Mining und vermittelt Ihnen eine gründliche methodische, praktische und vor allem softwareherstellerunabhängige Abdeckung modernster Data Mining-Techniken (z.B. aus Statistik, Machine Learning und Künstlicher Intelligenz). Es hebt seine Anwendbarkeit auf akkumulierte Daten hervor und ermöglicht es Ihnen, die vorgestellte Methodik und die zugrunde liegende Philosophie auf Benchmarks oder Ihre eigenen Daten anzuwenden.

Überblick über die Data-Mining-Methodik:

  • Einführung
  • Entmystifizierung des "Big Data"-Hypes
  • Entmystifizierung des Hype "Internet der Dinge".
  • Anwendbarkeit von Data Mining
  • Was ist Data Mining?
    • Ist Data Mining "statistical déjà vu"?
    • Was unterscheidet Data Mining von Statistiken?
  • Entmystifizierung des "Data Science"-Hypes
  • Entmystifizierung des Hype "Machine Learning".
  • Ein Prozessmodell für Data Mining
  • Daten und Datenvorverarbeitung
    • Datenquellen
    • Warum Datenvorverarbeitung?
    • Hauptaufgaben in der Datenvorverarbeitung (z.B. Datenintegration, Datenbereinigung, Datentransformation, Datenreduktion, Datenreduktion, Diskretisierung)
  • Data-Mining-Techniken und -Aufgaben
  • Beschreibung und Visualisierung
  • Charakterisierung multivariater Daten
  • Unähnlichkeits- und Entfernungsmessungen
  • Unüberwachte Methoden ("Class Discovery")
    • Hauptkomponentenanalyse
    • Mehrdimensionale Skalierung
    • Korrespondenzanalyse
    • Clusteranalyse (z.B. hierarchische Algorithmen, Partitionsalgorithmen, Einsatz von Clustering in der Praxis)
    • Kohonens selbstorganisierende Karten
    • Affinitätsgruppierung oder Assoziationsregeln
    • Ein Blick nach vorne
  • Überwachte Methoden ("Klassenvorhersage")
    • Einführung (z.B. induktive Bias- und Modellkomplexität, Scorfunktionen, interne Validierung, externe Validierung)
    • Klassifizierungsmodellierung (z.B. Diskriminanzanalyse, Stützvektormaschinen, Nächste Nachbarklassifizierung, naiver Bayes-Klassifikator)
    • Regressionsmodellierung (z.B. mehrere lineare Modelle, generalisierte lineare Modelle, nichtparametrische Regressionsmodelle, generalisierte additive Modelle, multivariate adaptive Regressionssplines)
    • Neuronale Netze
    • Baumbasierte Methoden (z.B. CART, C4.5 und C5.0, CHAID)
    • Ensemble-Lernen (z.B. Bagging, Subagging, Random Forest, Arcing, Boosting, Stochastic Gradient Tree Boosting)
    • Der Fluch der Dimensionalität (z.B. Feature-Extraktion, Feature-Subset-Auswahl: Filter, Wrapper, Embedded-Methoden)
    • Bewertung und Vergleich von Klassifikatoren
    • Vergleich von Regressionsmodellen
    • Ein Blick nach vorne
    • Vergleich der gewählten überwachten Lernmethoden
    • Aktuelle Lektionen - was wurde gelernt?
  • Kriterien für potenzielle Data-Mining-Erfolge
  • Fazit
  • Referenzen und Ressourcen

Präsentation:
Die Vorlesung wird in Deutsch gehalten. Während des Kurses können Fragen in Englisch, Französisch oder Deutsch gestellt werden. Die Trainingsunterlagen werden alle in englischer Sprache verfasst. Alle Teilnehmer erhalten eine gedruckte Version der Dokumentation ausschließlich für den persönlichen Gebrauch. In diesem dreitägigen Kurs wird die Unterrichtszeit in Vorlesungen aufgeteilt, in denen die methodischen Aspekte und praktischen Anwendungen des statistischen Data Mining herstellerunabhängig behandelt werden sowie zwischen praktischen Übungen, in denen Sie die Möglichkeit haben, die im Kurs erlernten Methoden auszuprobieren.

Ort: 
StatSoft (Europe) GmbH, Hamburg - Änderungen vorbehalten

Voraussetzungen:
Die Teilnehmer sollten grundlegende Statistik-Kenntnise haben, einschließlich multipler linearer Regression.
Ein Laptop mit vorinstallierter TIBCO Statistica-Kurslizenz (Download), die 30 Tage läuft, wird gestellt. Wir werden Ihnen die Details vor Kursbeginn mitteilen.

Kursgebühr und Rabatte:
Kursgebühr    EUR 2.500

Akademischer Rabatt    30% Rabatt auf die Kursgebühr. Es gelten keine weiteren Rabatte.

Gruppenrabatt                 Gruppenrabatte sind möglich, wenn sich zwei oder mehr Personen derselben Organisation gemeinsam und zur gleichen Zeit anmelden. Für weitere Informationen stehen wir Ihnen gerne zur Verfügung. Es gelten keine weiteren Rabatte.

Frühbucherrabatt            10% Rabatt auf die Kursgebühr, wenn Sie sich 6 Wochen vor Kursbeginn anmelden. Es gelten keine weiteren Rabatte.

Die Preise verstehen sich inklusive gedruckter Dokumentation für den persönlichen Gebrauch, Kaffeepausen und Mittagessen und exklusive der gesetzlichen MwSt. Alle Teilnehmer erhalten eine Teilnahmebestätigung.
 

  • Dauer: 3 Tage            Zeit: 9:00 - 17:00 Uhr            Preis: EUR 2.500 (zzgl. MwSt.) je Teilnehmer
     

Anmelden

zur Kursübersicht