Einführung Data Science mit R (DSR)

Kursziel:

R ist eine freie Programmiersprache, die im Bereich Statistik, Grafikerstellung und Data Mining angewandt und geschätzt wird.

Das Ziel dieses Einführungskurses ist die Vermittlung der Grundlagen zur Nutzung der Programmiersprache R für die Datenanalyse. Hierbei wird Wert auf neuartige Pakete (besonders die Paketsammlung tidyverse) gelegt, die die Arbeit mit R schneller und komfortabler gestalten. Die Kursteilnehmer erhalten eine Übersicht und systematische Einführung in die Nutzung der wichtigsten Softwarepakete für R im Data Science Bereich und bekommen die Gelegenheit, anhand von Übungen das Gelernte zu vertiefen.

Zielgruppe:

Dieser Kurs richtet sich an alle Anwender, die R im Rahmen der Datenanalyse anwenden möchten und keine oder wenig Erfahrung mit R mitbringen, oder an solche, deren Erfahrung mit R weiter zurückliegt und die die neuen Pakete und Features der letzten sieben  Jahre kennenlernen möchten..

Kursinhalte:

Der Kurs beginnt mit der Installation von R und RStudio (einem IDE für R) und einer Einführung in deren Nutzung. Anschließend werden systematisch die Syntax von R erklärt und die Nutzung verschiedener Pakete aus dem "Tidyverse" vermittelt. Zusätzlich werden einfache statistische Verfahren und deren Anwendung in R erläutert. Abschließend wird ein Ausblick über die Nutzung von R für die Erstellung von Dashboards (shiny) oder von Reports (markdown) gegeben.

Im Detail werden die folgenden Themen bearbeitet:

  • Installation von R und RStudio als IDE
  • Einführung in die Features und Nutzung von RStudio
  • Grundlagen der Syntax von R (Base)
  • Problemlösung durch Hilfefunktionen und Suche im Internet
  • Einführung in den Data Science Work Flow mit dem Paket tidyverse:
    • Datenmanagement und Datenbereinigung mit readr, tibble, tidyr
    • Datenmanipulation mit dplyr
    • Grafische Datenexploration mit ggplot2 (u.A., Histogramm, Linienplot, Scatterplot, Box-Plot)
    • Anpassung von Plots und Mehrfachplots mit ggplot2
  • Einfache Analytische Verfahren (lineare Regression, Student's T-Test, ANOVA)
  • Ausblick: Dashboarding (shiny) und Reporting (markdown)

Der Kurs ist interaktiv gestaltet, um den Teilnehmern die Möglichkeit zu geben, die vermittelten Methoden direkt auszuprobieren. Jeder Abschnitt wird zudem durch eine Reihe von Übungen abgeschlossen, um das Gelernte zu vertiefen.

Der Kursfortschritt ist komplett dokumentiert, so dass keine Mitschriften erforderlich sind und die Kursteilnehmer sich auf die aktive Nutzung von R konzentrieren könne.

Voraussetzungen:

Für die Teilnahme an dem Kurs sind keine Vorkenntnisse in R erforderlich. Erfahrungen im Umgang mit R oder anderen Programmiersprachen sowie statistische Grundkenntnisse sind allerdings vorteilhaft.

Ergänzende Kurse:

Weitere Kurse im Bereich R befinden sich bei uns gerade im Aufbau: fortgeschrittene Visualisierung, Dashboarding, Reporting, Einführung in die Statistik, fortgeschrittene Statistik und Machine Learning.

Sprechen Sie uns gerne an, falls ein Bereich Sie besonders interessiert.

Des Weiteren bietet wir eine Reihe an Methodenkursen an, die verschiedene Themen softwareunabhängig behandeln z.B. Methodenkurse "Effizientes Datenmanagement" (EDM), "Big Data Analytics" (BDA), „Entscheidungsbäume“ (TRM) sowie "Methoden für statistisches Data Mining" (MDM) und "Data Mining in der Praxis" (PDM).

Dauer: 2 Tage                 Zeit: 9:30 - 17:00 Uhr            Preis: EUR 1.040,- (zzgl. MwSt.) je Teilnehmer

 

Anmelden

zur Kursübersicht