In diesem Kurs lernen Sie die grundlegenden statistischen und algorithmischen Konzepte des maschinellen Lernens mit einem Schwerpunkt auf deren praktischen Anwendungen im Bereich der Bioinformatik. Sie werden an praktischen Problemen arbeiten und die in den Vorlesungen vorgestellten Methoden implementieren und anwenden. Der Fokus liegt dabei auf der Analyse von biologischen Datensätze, insbesondere Omics-Daten. Dafür sollten Sie Erfahrung in Programmiersprachen wie R, Python, Java oder C/C++ haben.
Behandelt werden u.a. die Vorverarbeitung von biologischen Daten, Modellimplementierungen und Analysemethoden. Sie lernen Modelle für Regression, Clustering und Klassifikation, Merkmalsauswahl und fortgeschrittene Datenvorverarbeitung, wie z. B. Imputation, kennen. Dabei werden auch Deep Learning-Ansätze behandelt.
Im Rahmen des Kurses werden wöchentliche Projekte bearbeitet und die Ergebnisse präsentieren. Diese Übungen dienen dazu, die praktischen Anwendungen des behandelten Materials zu vertiefen.
Am Ende des Kurses werden Sie in der Lage sein, Daten zu verarbeiten, geeignete Modelle zur Beantwortung spezifischer Fragen auszuwählen, Ergebnisse zu bewerten und Ihre Erkenntnisse in schriftlichen Berichten verständlich zu kommunizieren.
Zusätzliche Informationen
Voraussetzungen:
Vorlesung Statistik im Master Bioinformatik (oder äquivalente Veranstaltungen)