Willkommen im Softwareprojekt "Maschinelles Lernen in den Lebenswissenschaften"!

Wir treffen uns immer dienstags 16-18 Uhr im T9, SR 049. Der Termin kann auf Wunsch auch flexibel festgelegt werden.

We are meeting Tuesdays, 16-18 at T9, SR 049. The meeting can also be scheduled flexibly upon request.

--- English version below ---

Während des Projektes werden wir verschiedene Machine-Learning (ML)-Methoden trainieren und die Ergebnisse evaluieren. Hierfür werden verschiedene, zum Teil große Datensätze aus dem Bereich der Lebenswissenschaften für das maschinelle Lernen vorbereitet und hinsichtlich einer vorher definierten Fragestellung analysiert. Die Fragestellung kann von uns ausgegeben und dicht an unseren Forschungsinteressen liegen oder gemeinsam mit uns erarbeitet werden. Eine konkrete Anwendung kann die personalisierte Medizin sein, wie etwa eine Vorhersage der Wirkung von Krebsmedikamenten anhand von umfassenden Daten von Krebszellen, oder auch zeitliche Vorhersagen, zum Beispiel von Infektionszahlen in Epidemien. Die Programmiersprache ist Python, und wir planen die Verwendung von modernen Python-Modulen für ML wie scikit-learn, TensorFlow oder PyTorch. Gute Python-Kenntnisse sind Voraussetzung. Das Ziel ist die Erstellung eines Python-Pakets, das für den konkreten Anwendungsfall wiederverwendbaren Code zur Präprozessierung, Training auf ML-Modelle und Evaluation der Ergebnisse mit Dokumentation (z.B. mit sphinx) liefert. Das Softwareprojekt findet semesterbegleitend statt.

Update 22.04.: Wir haben noch Plätze frei!

Die Anmeldung im CM ist nun von Studi-Seite möglich!

Wir bieten vorrausichtlich eins von zwei möglichen Projekten an:
(1)    Active learning for drug reponse prediction in cancer: Das Projekt zielt darauf ab, durch aktives Lernen die Vorhersage von der Effizienz von Medikamenten bei Krebs mit Deep Learning Modellen zu verbessern.
(2)    Deep learning for drug combination response prediction: Hier werdet ihr eine deep learning base-line implementieren für Medikamentenkombinationenvorhersagen und mit einer publizierten Methode vergleichen. Ihr werdet dann die Methoden mit randomisiertem Input testen.

 

--- English version ---

Throughout this project, we will train various machine learning (ML) methods and evaluate their outcomes. To achieve this, we will prepare and analyze different datasets from the life sciences field, some of which may be large, for machine learning purposes aligned with predefined questions. These questions can either be provided by us, closely tied to our research interests, or developed collaboratively. A specific application could be in personalized medicine, such as predicting the efficacy of cancer drugs using comprehensive data from cancer cells, or making temporal forecasts, for instance, predicting infection rates during epidemics. We will use Python as the programming language, and we plan to employ modern Python modules for ML, such as scikit-learn, TensorFlow, or PyTorch. Proficiency in Python is a prerequisite. The objective is to create a Python package that delivers reusable code tailored for the specific use case, encompassing preprocessing, training ML models, evaluating results, and documentation (e.g., using sphinx). This software project will run concurrently with the semester.

Update 22.04.: We still have spots available! 

The registration in the CM is now possible from the student side!

We plan to offer one of two possible projects: 
(1)    Active learning for drug response prediction in cancer: The project aims to improve the prediction of drug efficacy in cancer using deep learning models through active learning. 
(2)    Deep learning for drug combination response prediction: Here, you will implement a deep learning baseline for predicting drug combinations and compare it with a published method. You will then test the methods with randomized input.