Im Softwareprojekt werden wir verschiedene Machine-Learning (ML)-Methoden implementieren, trainieren und evaluieren. Der Fokus im Projekt liegt auf graph-neuronalen Netzwerken (GNN), die Graphen als Input-Feature für das Lernen verwenden. Die GNNs werden wir mit verschiedenen Baseline Methoden, zum Beispiel mit neuronalen Netzen und Regressionsmodellen, vergleichen. Die verschiedenen ML Methoden werden auf einen spezifischen Datensatz, z.B. zur Vorhersage von Medikamentenkombinationen gegen Krebserkrankungen, angewendet und ausgewertet. Der Datensatz wird von uns vorbereitet und mit den implementierten Methoden analysiert.

Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, TensorFlow oder PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt und kann auch auf Englisch durchgeführt werden.