Vertiefungskurs "Data Science und Machine Learning"
In diesem Kurs werden moderne, statistische Verfahren zur Aufbereitung und Verarbeitung von Datensätzen, sowie Methoden des maschinellen Lernens zur Analyse komplexer Klassifikations- und Regressionsprobleme vorgestellt. Die zugrundeliegenden Prinzipien der Verfahren werden – für Anfänger – verständlich eingeführt und illustriert. Neben verschiedenen in R verfügbaren Werkzeugen zur visuellen Aufbereitung der Daten werden vor allem nützliche Werkzeuge zur Modellierung maschineller Lernverfahren – anhand praktischer Beispiele – präsentiert. Dabei behandeln wir u.a. auch Themen wir die verbesserte Anpassung der Modelle an die Daten, eine korrekte Bewertung der Modellqualität, sowie die richtige Interpretation der gefundenen Modelle. Im Rahmen der optimalen der optimalen Anpassung der Modelle gehen wir zudem auf die Optimierung statistischer Lernverfahren ein. Auf Grund der immer größer werdenden Datenmengen, sowie der Vielzahl an zu untersuchenden statistischen Lernverfahren und Modellkonfigurationen spielt die Parametrisierung einer immer größere Rolle in der statistischen Analyse. Hierzu werden den Kursteilnehmern und -innen verschiedene R-Funktionen präsentiert, die einen deutlich effizienteren Umgang mit komplexen Problemen ermöglichen. Ähnlich zum Basiskurs werden auch in diesem Kurs alle vorgestellten Themen, sowie statistischen Verfahren und Programmiertechniken ausführlich erläutert, an Beispielen motiviert und mit Hilfe von Übungsaufgaben von den Teilnehmern eingeübt. Zudem wird im Anwendungsteil des Kurses auch auf die Interpretation der Ergebnisse eingegangen.
Kursinhalte
- Einführung in Data Science und Machine Learning
- Statistische Grundlagen: Kennzahlen, Hypothesentests und statistische Modelle
- Modellwahl und Variablenselektion
- Gütemaße für Regression bzw. Klassifikation
- Praxistipps für die Entwicklung von Vorhersagemodellen
- Datenvisualisierung und Erstellung automatisierter Berichte
- Einfache Grafiken wie Histogramme, Boxplots, Balken- und Streudiagramme etc.
- Fortgeschrittene Visualisierungstechniken
- Erzeugung eigener Dashboards / GUIs
- Dynamische Berichterstellung mit Hilfe von R-Markdown bzw. Umwandlung von R-Code und R-Output in besser lesbare Dateiformate wie PDF, Word oder HTML
- Vorstellung verschiedener Machine Learning-Algorithmen (k-nearest-neighbors, Support Vector Machines, Entscheidungsbäume, Random Forests, Neuronale Netze und Deep Learning, Boosting)
- Modellevaluation und Resampling
- Modell- und Variablenselektion
- Hyperparameter-Tuning
- Optimierung
- ein- und mehrkriterielle Optimierung
- evolutionäre Optimierung
- Parallelisierung
Wichtige Informationen
Termin:
Auf Anfrage
Ort:
WWU Weiterbildung gGmbH, Königsstr. 47, 48143 Münster
Teilnahmeentgelt:
1.700,- €
Dozenten:
Prof. Dr. Heike Trautmann, Dipl.-Inf. Jakob Bossek, Dr. Pascal Kerschke

Beratung
Mirela Genius
Mo - Do: 08.30-13.30 Uhr
Tel.: +49 251 83-27103
mirela.genius(at)uni-muenster.de