Algorithmische Bioinformatik
Diese Grundvorlesung nimmt einen zentralen Platz im Bachelor-Studiengang ein und wird daher während des Semesters mit einem erheblichen Arbeitsaufwand für die Teilnehmenden verbunden sein. Veranschlagt sind wenigstens 20 Stunden pro Woche. Jede Woche gibt es zu der vierstündigen Vorlesung zweistündige Übungen.
Im Anschluss an das Semester findet ein obligatorisches, zweiwöchiges Praktikum statt. Die Vorlesung baut auf Algorithmen und Datenstrukturen für Bioinformatik aus dem 3. Semester. Die Beherrschung des Stoffes wird vorausgesetzt, bitte vor dem Anfang der Vorlesung wiederholen!
Inhalt:
- Fortgeschrittene Algorithmen für paarweises und multiples Alignment
- Praktische Datenbanksuchalgorithmen und Filterverfahren
- Statistische Signifikanz von Sequenzähnlichkeit und Ergebnissen von Datenbanksuchen
- Statistische Signalanalyse mittels (hidden) Markov Models, Anwendungen in Mustersuche und Genvorhersage
- Algorithmen zur Rekonstruktion phylogenetischer Bäume
- Algorithmen zur Kartierung und Sequenzierung von Genomen
- Algorithmen zur RNA-Strukturvorhersage und RNA-Vergleich
- Modelle und Algorithmen zur Proteinstruktur-Analyse
- Auswertung von Daten aus aktuellen Technologien der funktionellen Genomik
Datum | Inhalt | Bemerkung |
14.10.2019 | Dyn. Programmierung, DNA Scoring, Gap-Penalty Komplexität von Algorithmen | Wiederholung_AlDaBi |
16.10.2019 | Phylogenie I: Phylogen. Bäume, Fitch Algorithmus, Maximum-Parsimonie | Slides |
21.10.2019 | Phylogenie II: Metrik, Clustering, Neighbor joining | |
23.10.2019 | Phylogenie III: Markovketten, Jukes-Cantor Modell | |
28.10.2019 | keine Vorlesung | |
30.10.2019 | Multiples Alignment | B. Kehr (Slides: MSA Teil 1) |
04.11.2019 | Motivsuche | B. Kehr (Slides: MSA Teil 2, Motivsuche) |
06.11.2019 | DB Searching | B. Kehr (Slides: DB-Suche) |
11.11.2019 | Alignment Statistik | Notes |
13.11.2019 | HMM | Slides |
18.11.2019 | HMM | |
20.11.2019 | 1. Zwischenklausur | |
25.11.2019 | Sequenzierung | B. Kehr (Slides: Sequencing, Intro: BWT) |
27.11.2019 | Sequenzierung | D. Heller Slides |
2.12.2019 | Coverage, Lander-Waterman | Slides |
4.12.2019 | Genstruktur | Slides Krogh |
9.12.2019 | RNA Faltung |
11.12.2019 | RNA | |
16.12.2019 | RNA/ Proteine | Slides |
18.12.2019 | Proteine | Slides |
6.1.2020 | 2. Zwischenklausur | |
8.1.2020 | Proteine | Slides |
13.1.2020 | Proteomics | B. Kehr (Slides) |
15.1.2020 | Proteomics (Peptide ID / DB Search) | B. Kehr (Slides) |
20.1.2020 | Genexpression: RNA-Seq Daten, Negative-Binomial, PCA | V. Heinrich (Slides) |
22.1.2020 | Genexpression: RNA-Seq Daten, Negative-Binomial, PCA | V. Heinrich (Slides) |
27.1.2020 | Genexpression: RNA-Seq Daten, Negative-Binomial, PCA | V. Heinrich (Slides) |
29.1.2020 | Funktionsanalyse, Gene Ontology, GO enrichment. | V. Heinrich (Slides) |
3.2.2020 | ChIP-seq, MACS, Hi-C, DNA-Methylierung | M. Vingron (Slides) |
5.2.2020 | Hi-C Chromatinconformation | R. Schöpflin (Slides) |
10.2.2020 | Review | B. Kehr, A. van Bömmel, A. Korzec |
12.2.2020 | Hauptklausur |
Tutorien
Um die aktive und regelmäßige Teilnahme zu bestehen müssen Sie:
- in den Übungen mindestens zweimal eine Aufgabe vorrechnen oder erklären
- alle Aufgabenblätter müssen abgegeben werden und insgesamt müssen 60% der Punkte erreicht werden
- aus jedem Blatt werden 2-3 Aufgaben zufällig ausgesucht, die tatsächlich korrigiert werden
- an den Tutorien regelmäßig teilnehmen (max. 3 verpasste Termine, bei längeren Krankheiten bitte den Krankenschein nachreichen).
Übungsgruppen
- Teilnehmer müssen sich in Gruppen von zwei Personen zusammenfinden, die ein Übungsblatt gemeinsam bearbeiten und abgeben.
- Bei Abgabe der Übungsblätter bitte deutlich die Nummer der Übungsgruppe und die Namen der Gruppenmitglieder kennzeichnen.
- Jeder Teilnehmer der Gruppe sollte jede Aufgabe verstanden haben und vortragen können.
Vergabe der Plätze in den Übungsterminen
- Die Zuordnung der Teilnehmer zu einer der vier möglichen Übungstermine erfolgt über KVV.
- Falls es in der gewünschten Gruppe keinen freien Platz mehr gibt, versuchen Sie eine Person zu finden, die mit Ihnen den Platz tauscht. Ein solcher Übungsgruppentausch bitte per Email an Alena van Bömmel melden. Alle Studenten, die keinen freien Platz in einer den Übungsgruppen finden, tragen sich in die “Pseudotutoriengruppe"
Abgabe und Besprechung der Übungen
- Montags vor der Vorlesung werden die aktuellen bearbeiteten Übungsblätter eingesammelt bzw bei KVV/Whiteboard hochgeladen.
- Die Ausgabe der Korrekturen erfolgt in den Übungen. Dort werden auch die Fragen bezüglich den Aufgaben geklärt.
Kontakt
Prof. Dr. Martin Vingron vingron[at]molgen.mpg.de
Dr. Birte Kehr birte.kehr[at]bihealth.de
Dr. Alena van Bömmel alena.vanboemmel[at]molgen.mpg.de
Alexander Korzec void[at]zedat.fu-berlin.de
Klausuren
- 1. Zwischenklausur: 20.11.2019
- 2. Zwischenklausur: 06.01.2020
- Hauptklausur: 12.02.2020
Benotung: Da der Lernstoff für die Klausur relativ umfangreich ist, wird empfohlen schon während des Semesters für die Hauptklausur zu lernen. Wir bieten deshalb die Möglichkeit zusätzlich zu der Hauptklausur noch 2 Zwischenklausuren zu schreiben, dann geht die Hauptklausur zu 76% in die Note ein, die zwei Zwischenklausuren zu je 12%. Für diejenigen Studenten, die nur die Hauptklausur schreiben wollen, wird diese zu 100% in die Note eingehen. Alle StudentInnen müssen sich bis 18.11.2019 24:00 festlegen, für welche Variante sie sich entschieden haben.
Praktikum
- Teilnahmepflicht an den Vorbesprechungsterminen (20.2. oder 21.2.), bei den Präsentationen am 3.3. und 4.3. und weiterhin mindestens an 4 Tagen zu den Besprechungszeiten.
- Termin: 20.2. bis 4.3.2019 am MPI für molekulare Genetik
- Abschlusspräsentationen: Im Anschluss am 3.3. und 4.3. (Teilnahmepflicht)
Die Vorbesprechung für das Praktikum findet am Donnerstag 20.2. 14:00-17:00 und am Freitag 21.2. 10:00-13:00 statt. Bitte tragen Sie sich in einen der Termine unter "Section Info" ein. Der Treffpunkt ist im Foyer des Max-Planck-Instituts für molekulare Genetik (Ihnestr. 63), dort werden Sie abgeholt. Deshalb bitte pünktlich erscheinen! Es ist wichtig, dass die gesamte Gruppe am selben Tag zu der Vorbesprechung erscheint, da es nur ein Account pro Gruppe gibt. Gruppen, die am 20.2. zur Einführung kommen, werden am 3.3. (14:00-18:00 Uhr) vortragen. Gruppen, die am 21.2. zur Einführung kommen, werden am 4.3. vortragen. Falls Sie einen Tausch wünschen, finden Sie eine andere Gruppe und tauschen Sie.
Bitte tragen Sie sich spätestens bis zum Freitag 14.2. 18:00 in die Gruppen von 4 Personen ein (auch unter Section Info), sonst kann Ihnen kein Praktikumsplatz garantiert werden! Die Daten für alle Gruppen müssen vorher vorbereitet werden. Gruppen mit wenigen Teilnehmern (<4) weden mit anderen kleinen Gruppen zusammengefügt.
Die Praktikumsaufgaben können in beliebigen Zeiten bearbeitet werden. Jedoch dürfen die Originaldateien nicht kopiert werden und die ersten Analyseschritte müssen auf den PCs am MPI gemacht werden. Deshalb soll jede Gruppe in dem Zeitraum vom 21.2.-2.3. mindestens 3x am MPI erscheinen.
Während des Praktikums gibt es jeden Arbeitstag 2 Stunden Sprechstunde von 2 Mitarbeitern des MPIs, diese Sprechzeiten sollen für die Fragen genutzt werden.
Literatur
- Durbin, Eddy, Krogh, Graeme: Biological sequence analysis - Probabilistic models of proteins and nucleic acids. Cambridge University Press
Die Standardreferenz, umfasst die Sequenzbioinformatik, ist aber knapp gehalten. Es existiert ein empfehlenswertes Übungsbuch. - Haubold, Wiehe: Introduction to Computational Biology - An evolutionary approach. Birkhäuser.
Eine Einführung mit Fokus auf Phylogenie. Mehr Erklärungen als bei Durbin et al. - Deonier, Tavare, Waterman: Computational Genome Analysis. Online bei Springer
Ein umfassendes Lehrbuch für die Sequenzbioinformatik mit Beispielen und einer Einführung in R. Wendet sich eher an Informatiker und Physiker. - Zvelebil, Baum: Understanding Bioinformatics. Garland Science
Ein ausführliches Lehrbuch, bebildert und mit vielen Beispielen. Umfasst den gesamten Vorlesungsstoff, teilweise aber nicht in der nötigen Tiefe. - Chao, Kun-Mao, Zhang, Louxin: Sequence Comparison, Theory and Methods. Online bei Springer.
- Saitou: Introduction to Evolutionary Genomics. Online bei Springer
- Mount: Bioinformatics. Sequence and Genome Analysis. Cold Spring Harbor Press.
Ein Lehrbuch, das sich vornehmlich an Biologen wendet. Umfasst die Sequenzbiologie und die Strukturbiologie. - Merkl, Waack: Bioinformatik Interaktiv. Wiley-VCH.
Ein Lehrbuch mit detaillierten Erklärungen. Die 2., erweiterte Auflage ist zu empfehlen. - Jones, Pevzner: Introduction to Bioinformatics Algorithms. MIT Press. Pdf-version online
- Skript von Knut Reinert