Digitale Data Science Ausbildung
Projektakronym | DataSciEdu |
Fakultät | Fakultät 1 (Mathematik und Informatik) Fachrichtung: Datenanalyse |
Zielgruppe | Studierende der Natur- und Ingenieurwissenschaften sowie der Mathematik |
Funktion | Ergänzung zu Vorlesungen, Grundbaustein eines zukünftigen Micro-Degrees |
Beschreibung | studierendenzentrierter Onlinekurs, Python & R Software, Machine Learning und Data Science |
Sprache | deutsch und englisch |
Kontakt | Jun.-Prof. Dr. Björn Sprungk |
Die Grundmotivation für dieses Projekt ist es, Studierenden Kompetenzen in der modernen statistischen Datenauswertung mit Open-Source-Software durch digitale Lernmaterialien zu vermitteln. Das Projekt erstellt dabei Kurse und Materialien begleitend zu den Vorlesungen „Versuchsplanung und multivariate Statistik“ (SoSe) sowie „Mathematics of machine learning“ (WiSe) und erreicht die Vermittlung der entsprechenden Kompetenzen über drei Werkzeuge:
1. Es werden niederschwellige eigenständige Onlinekurse zum selbstständigen Erlernen gängiger und grundlegender Datenanalyseverfahren in R und Python erstellt. Diese nutzen kurze interaktive Lehrvideos zum Vermitteln der Softwarekenntnisse, in denen bereitgestellte kommentierte Skripte (für R) bzw. Jupyter notebooks (für Python) Schritt für Schritt erklärt werden. Zusätzlich werden kleine Übungsaufgaben zum Festigen des Stoffes erstellt.
Die Onlinekurse werden im Rahmen des Projektes im bestehenden Lehrbetrieb eingebaut, evaluiert, verbessert und verstetigt.
2. Ferner werden zum Nachvollziehen der in den genannten Lehrveranstaltungen eingeführten Methoden ergänzende Materialen wir R-Skripte und Jupyter Notebooks generiert mit denen die Studierenden eigenständig die Beispielanalyse aus den Vorlesungen nachvollziehen und reproduzieren können. Die Grundlagen zum Nutzen dieser vorlesungsbezogenen Skripte liefern die Onlinekurse.
3. Darüber hinaus werden Belege zur selbständigen Datenanalyse erstellt, die die Studierenden im Verlauf der Lehrveranstaltungen in (wechselnden) Gruppen zu bearbeiten haben. Dabei werden unter Nutzung der oben erwähnten Software reale Datensätze aus ihrem Studienbereich (z. B. aus Chemie, Physik, etc.) mit den erlernten statistischen Verfahren analysiert und ausgewertet werden. Die Ergebnisse der Belegarbeiten werden als kommentierte R-Skripte bzw. Jupyter Notebooks mit Erklärungen zum Lösungsweg über OPAL hochgeladen und bewertet. Die Belegnoten sollen dabei zu einem gewissen Prozentsatz in die finale Modulnote eingehen. Auch hier ist am Ende des Semester (und nach Notenvergabe) ein Feedback-Prozess zur Evaluierung der Materialien und Belegaufgaben angedacht.
Die Studierenden erlernen durch diese drei Werkzeuge nicht nur dem Umgang mit moderner, frei verfügbarer Statistik-Software, die sie im Berufsleben (oder im akademischen Werdegang) mit sehr hoher Wahrscheinlichkeit wieder nutzen werden, sondern gewinnen zudem Kompetenzen in der Zusammenarbeit im Team auf digitaler Ebene.
Projektablauf
bis 03.2022 – OPAL-Kurs und Belege zur multivariaten Datenanalyse in R erstellt (in Deutsch)
04.2022 - 09.2022 – erster Testlauf und Evaluierung des R-OPAL-Kurses
10.2022 – 03.2022 – Vorbereitung eines OPAL-Kurses zu Machine Learning in Python
04.2023 - 09.2023 – zweiter Testlauf und Evaluierung des R-OPAL-Kurses und der Belege, Verstetigung des Kurses
10.2023 – OPAL-Kurs zu Machine Learning in Python erstellt (in Englisch)
10.2023 - 03.2022 –Testlauf und Evaluierung des Python-OPAL-Kurses
03.2022 – 06.2022 – Überarbeitung und Verstetigung des Python-OPAL-Kurses
bisherige Projektergebnisse
Eigenständige Online-Kurse zum selbstständigen Erlernen und Üben wichtiger Datenanalysemethoden in den gängigen Programmiersprachen R und Python.
Die im Projekt erstellten Kurse und Materialien sind ferner als Grundbaustein zukünftiger Microdegrees im Bereich multivariater Datenanalyse bzw. maschinelles Lernen und künstliche Intelligenz gedacht, die z. B. im Rahmen beruflicher Weiterbildungen angeboten werden könnten. Insbesondere der Online-Pythonkurs soll auch über die GraFA interessierten Promovierenden zur Verfügung gestellt werden.