Westfälische Wilhelms-Universität

&npsb;

Datenanalyse

Ziel dieses Moduls ist es, die Teilnehmer/-innen in grundlegende Fragestellungen, Techniken und Anwendungen des Data Mining einzuführen, ihnen anhand von Fallstudien die konkrete Bedeutung dieser Techniken aufzuzeigen und darzulegen, wie sich aus Mining-Resultaten Rückschlüsse auf den Kunden sowie auf das unternehmerische Management von Kundenbeziehungen ergeben können. Das Modul wird durch praktische Übungen mit der Statistik-Software R ergänzt.

Unternehmen sehen sich einer rasant wachsenden Datenflut gegenüber, die dadurch entsteht, dass Daten jeglicher Art elektronisch erfasst werden, dass Prozesse und Geschäftsvorgänge elektronisch abgewickelt werden und dass zahlreiche Applikationen Daten selbstständig erzeugen. Man ist dann mit dem Problem konfrontiert, aus diesen Daten Wissen abzuleiten. Data Mining ist ein Sammelbegriff für Techniken, die dieser Herausforderung begegnen wollen, und ist zentraler Teil eines Prozesses, den man auch als Knowledge Discovery in Databases (KDD) bezeichnet. Data Mining setzt typischerweise auf einem Datenlager (Data Warehouse) auf, das seinerseits aus einer homogenen oder einer heterogenen Sammlung von operationalen Datenbanken oder anderen Datenbeständen erzeugt wird.

Der schon fast „klassische“ Anwendungsbereich ist der elektronische Handel, bei dem über Techniken des Data Mining versucht wird, den jetzt elektronischen Kunden zu erkennen („User Profiling“) und einzuordnen, etwa um den Umgang mit ihm zu individualisieren und zu personalisieren oder um die Beziehung des Unternehmens zum Kunden nach seinen Wünschen und Bedürfnissen gestalten zu können („Customer Relationship Management“). Zahlreiche weitere Anwendungsbereiche finden sich in anderen IT-Feldern und in der künstlichen Intelligenz.

In diesem Modul wird der Bereich des Data Mining ganzheitlich  argestellt. Zu analysierende Daten müssen vor dem eigentlichen Mining etwa einer geeigneten Vorbereitung („Säuberung“, Data Cleansing) unterzogen werden, z.B. um Inkonsistenzen zwischen unterschiedlichen Datenbeständen auszugleichen, Datenformate aneinander anzupassen, Detaillierungsunterschiede auszugleichen oder Daten in ein einheitliches Modell zu transformieren. Sodann lernen die Teilnehmer/-innen Techniken der multivariaten Datenanalyse, insbesondere der Dimensionsreduktion, die Erstellung von Klassifikationen und Regressionen sowie die Bildung und Analyse von Clustern (Gruppen) kennen. Von zunehmender Bedeutung sind Data Mining-Techniken heute im Zusammenhang mit dem World Wide Web, da gängige Web-Server umfangreiche Protokolldaten erfassen. 

Anhand konkreter Fragestellungen und Fallstudien werden die erarbeiteten Techniken erprobt, und es wird aufgezeigt, welche konkreten Implikationen sich für die einzelne Unternehmung ergeben können. Besonders hilfreich sind dabei Visualisierungstechniken, die heute in zunehmendem Maße auch von Data Mining-Werkzeugen eingesetzt werden.

Newsletter bestellen
Newsletter bestellen

Einen Newsletter zu unseren Lehrgängen können Sie hier bestellen:

Newsletter bestellen