Die Vorlesung ist Teil II aus dem Zyklus Cybersecurity I-IV (Datenschutz, Erklärbarkeit, Robustheit/Angriffe, Zertifizierung) und beinhaltet:

  1. DeepL Einführung
  2. Einführung, Motivation, Definitionen
    Taxonomie und Annahmen, kurzer Überblick über Ideen aus unterschiedlichen Kategorien, Darstellung von Erklärungsergebnissen, Saliency Maps, Merkmalsbedeutung, erste Anwendungen
  3. Blackbox (Modell-agnostische) Erklärungen
    Additive Feature Attribution (Methode und Eigenschaften), LIME und andere Varianten, SHAP, Shapley-Werte, von der lokalen Erklärung zum globalen Verständnis, Implementierungsdetails zum Nachbarschaftsbau (on-manifold Erklärungen), Risiken von zufälligen Störungen
  4. White-Box (modellspezifische) Erläuterungen
    LRP, DTD, DeepLIFT, Grad-CAM, Counterfactual 
  5. Informationstheoretische Erklärungsmethoden
    Informationszerlegung, Kausalität, Theorie des repräsentativen Lernens
  6. Anwendung und Implementierung
    Debugging, Modelextraktion, Herausforderungen, Kompromisse (z.B. Erklärbarkeit vs. Datenschutz)