Die Vorlesung ist Teil II aus dem Zyklus Cybersecurity I-IV (Datenschutz, Erklärbarkeit, Robustheit/Angriffe, Zertifizierung) und beinhaltet:
- DeepL Einführung
- Einführung, Motivation, Definitionen
Taxonomie und Annahmen, kurzer Überblick über Ideen aus unterschiedlichen Kategorien, Darstellung von Erklärungsergebnissen, Saliency Maps, Merkmalsbedeutung, erste Anwendungen - Blackbox (Modell-agnostische) Erklärungen
Additive Feature Attribution (Methode und Eigenschaften), LIME und andere Varianten, SHAP, Shapley-Werte, von der lokalen Erklärung zum globalen Verständnis, Implementierungsdetails zum Nachbarschaftsbau (on-manifold Erklärungen), Risiken von zufälligen Störungen - White-Box (modellspezifische) Erläuterungen
LRP, DTD, DeepLIFT, Grad-CAM, Counterfactual - Informationstheoretische Erklärungsmethoden
Informationszerlegung, Kausalität, Theorie des repräsentativen Lernens - Anwendung und Implementierung
Debugging, Modelextraktion, Herausforderungen, Kompromisse (z.B. Erklärbarkeit vs. Datenschutz)