Computer Vision for Human-Computer Interaction Lab (cv:hci)

Deep Learning für Computer Vision

  • Type: Vorlesung (V)
  • Chair: KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Anthropomatik und Robotik - IAR Stiefelhagen
    KIT-Fakultäten - KIT-Fakultät für Informatik
  • Semester: SS 2021
  • Time: 12.04.2021
    12:00 - 13:30 wöchentlich


    19.04.2021
    12:00 - 13:30 wöchentlich

    26.04.2021
    12:00 - 13:30 wöchentlich

    03.05.2021
    12:00 - 13:30 wöchentlich

    10.05.2021
    12:00 - 13:30 wöchentlich

    17.05.2021
    12:00 - 13:30 wöchentlich

    31.05.2021
    12:00 - 13:30 wöchentlich

    07.06.2021
    12:00 - 13:30 wöchentlich

    14.06.2021
    12:00 - 13:30 wöchentlich

    21.06.2021
    12:00 - 13:30 wöchentlich

    28.06.2021
    12:00 - 13:30 wöchentlich

    05.07.2021
    12:00 - 13:30 wöchentlich

    12.07.2021
    12:00 - 13:30 wöchentlich

    19.07.2021
    12:00 - 13:30 wöchentlich


  • Lecturer: Prof. Dr.-Ing. Rainer Stiefelhagen
    Dr.-Ing. Muhammad Saquib Sarfraz
  • SWS: 2
  • Lv-No.: 24628
  • Information: Online
Inhalt

In den letzten Jahren wurden im Bereich des Bildverstehens (Computer Vision) beeindruckende Fortschritte erzielt. Diese wurden zu einem großen Teil durch die Wiederentdeckung und Weiterentwicklung sogenannter Deep-Learning-Verfahren (insbesondere die Nutzung von Convolutional Neuronalen Netzen) ermöglicht. Deep Learning Verfahren stellen derzeit den Stand der Technik für viele Anwendungsbereiche des Bildverstehens dar.

Die Vorlesung behandelt die Grundlagen, fortgeschrittene Netzarchitekturen und Lernverfahren für Anwendungen im Bereich Computer Vision. Es werden unter anderem folgende Themen behandelt:

- Einführung in Deep Learning

- Convolutional Neuronale Netze (CNN): Grundlagen und Hintergrund

- Grundlegende Architekturen und Lernverfahren für CNNs

- Objekterkennung mit CNNs

- Bildsegmentierung mit CNNs

- Rekurrente Neuronale Netze

- Erzeugen von Bildbeschreibungen (Image Captioning)

- Beantworten von Fragen zu Bildinhalten (Visual Question Answering)

- Generative Adversiale Neuronale Netze (GANs) und Anwendungen

- Deep Learning Frameworks und Tools

Erfolgskontrolle:

Die Erfolgskontrolle erfolgt in Form einer schriftlichen Prüfung (im Umfang von i.d.R. 60 Minuten) nach § 4 Abs. 2 Nr. 1 SPO.

Abhängig von der Teilnehmerzahl wird sechs Wochen vor der Prüfungsleistung angekündigt (§ 6 Abs. 3 SPO), ob die Erfolgskontrolle

  • in Form einer mündlichen Prüfung nach § 4 Abs. 2 Nr. 2 SPO oder
  • in Form einer schriftlichen Prüfung  nach § 4 Abs. 2 Nr. 1 SPO

stattfindet.

Kenntnisse zu Grundlagen der Mustererkennung, wie sie im Stammmodul Kognitive Systeme vermittelt werden, werden vorausgesetzt.

VortragsspracheDeutsch

Vorlesungsfolien

This lecture will be held online.

 

12.04.2021            Introduction / Overview [pdf]

19.04.2021            Neural Networks - Basics [pdf]

26.04.2021            Deep CNN Networks Background [pdf]

03.05.2021            Deep Networks: Object Recognition [pdf]

10.05.2021            Object Detection [pdf]

17.05.2021            Image Segmentation [pdf]

24.05.2021            No Lecture: Public Holiday (Pfingstmontag)

31.05.2021            Recurrent Neural Networks (RNN) + Embeddings [pdf]

07.06.2021            RNNs for Image Caption / Tagging [pdf]

14.06.2021           Visual Question-Answering (VQA) [pdf]

21.06.2021            CNN Learning in Viedeos [pdf]

28.06.2021            Generative Adversarial Networks (GAN) [pdf]

05.07.2021            Advanced Topics [pdf]

12.07.2021            Summary [pdf]