Module und Inhalte
Modul 1 – Data Science / Data Engineering Anwendungsfälle und Vorgehensmodelle
Im ersten Modul werden wir uns auf die verschiedenen Anwendungsbereiche konzentrieren, in denen Daten eine relevante Rolle spielen. Dabei besprechen, welche Anforderungen an die Wertgenerierung aus Daten gestellt werden. Wir betrachten alle Rollen, die in einem datenbasierten Projekt relevant sind und wie interdisziplinäre Teams effizient zusammenarbeiten können.
Anschliessend befassen wir uns mit der Art und Weise, wie datenbasierte Projekte strukturiert sind. Dazu untersuchen wir alle Phasen und deren erfolgreiche Durchführung. Wir besprechen typische Herausforderungen und lernen verschiedene Ansätze kennen, die einen erfolgreichen Abschluss eines Data Science Projektes garantieren.
Modul 2 – Kommunikation, Stakeholder Management und Compliance
Im Modul 2 befassen wir uns damit, wie man mit Stakeholdern und Managern auf verschiedenen Ebenen zusammenarbeitet. Wir erlernen Methoden zur Kommunikation von datenspezifischen Themen mit verschiedenen Managementebenen, um sie von einer Finanzierung oder einem Projekt zu überzeugen.
Darüber hinaus befassen wir uns mit den rechtlichen Aspekten, die für das Management von Data-Science-Projekten relevant sind. Wir lernen wie man mit Daten arbeitet, ohne dass rechtliche und datenschutzrechtliche Probleme entstehen. Schliesslich schauen wir uns an, wie man herausfindet, wo in der Geschäftsprozesslandschaft eines Unternehmens die Datenwissenschaft den größten Wert schaffen kann (Grundsätze des Data Governance).
Modul 3 – Data Engineering
In diesem Modul beginnen wir unsere Reise mit dem Studium von Python.
Wir setzen uns mit den grundlegenden Konzepten und Techniken des Data Engineering auseinander, d. h. mit der Frage, wie man Daten aus verschiedenen Systemen gewinnt. Wir lernen Daten aus verschiedenen Quellen zu extrahieren (tabellarische Daten, unstrukturierte Daten wie Bilder, Ton- oder Protokolldateien usw.), zu analysieren und zu verstehen. Ausserdem widmen wir uns den grundlegenden Konzepten von Datenbanken und SQL (Sprache zur Abfrage strukturierter, in einer Datenbank gespeicherter Daten).
Modul 4 – Data Science Models and Cloud Tools
Im Modul 4 stehen das Laden und das Visualisieren von Daten (Python-Bibliotheken pandas und matplotlib) im Fokus. Dabei beschäftigen wir uns mit den am häufigsten verwendeten Bibliotheken für maschinelles Lernen (u.a. scikit-learn).
Die Teilnehmenden erlernen die am häufigsten verwendeten Algorithmen des maschinellen Lernens für Vorhersagen. Im Feld von Supervised (wie lineare Regression) und Unsupervised Learning (wie Clustering oder Anomaly Detection) bearbeiten Sie praktische Übungen.
In diesem Modul werden die Grundlagen von Cloud-Technologien wie Kubernetes und Virtualisierung unterrichtet. Insbesondere werden Sie mit MS Azure, Google Cloud und Amazon Web Services vertraut. Abschliessend erfahren Sie, wie man solche Lösungen in einer bestehenden Softwarelandschaft einsetzen kann. Zur Abrundung des Moduls wenden wir uns konkreten Anwendungsfällen aus der Unternehmenspraxis zu.
Transferarbeit
Die Transferarbeit besteht aus einem Projekt, das von den Teilnehmenden an einem realen Datensatz durchgeführt wird. Gearbeitet wird in der Regel in 2er Teams.
Der Prozess zur Transferarbeit besteht aus den folgenden Schritten:
- Die Teilnehmenden schlagen ein Projekt/Problem aus ihrem Unternehmen oder aus eigenem Interesse vor.
- Der Vorschlag wird mit den Dozierenden besprochen und von ihnen genehmigt oder Änderungen werden vorgeschlagen.
- Die Teilnehmenden erhalten während der Weiterbildung Zeit, unter Anleitung der Dozierenden an ihrem Projekt zu arbeiten.
- Die Projekte werden am letzten Tag des CAS-Programms präsentiert.
Ziel ist es, dass die Teilnehmerinnen und Teilnehmer Erfahrungen mit einem realen Problem sammeln, das einen Mehrwert für ihren Lebenslauf oder für ihr Unternehmen darstellt.