Home | Legals | Sitemap | KIT

Computer Vision für Mensch-Maschine-Schnittstellen

Computer Vision für Mensch-Maschine-Schnittstellen
Type: Vorlesung (V) Links:
Semester: WS 14/15
Time: 20.10.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten


24.10.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

27.10.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

31.10.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

03.11.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

07.11.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

10.11.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

14.11.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

17.11.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

21.11.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

24.11.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

28.11.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

01.12.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

05.12.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

08.12.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

12.12.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

15.12.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

19.12.2014
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

22.12.2014
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

09.01.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

12.01.2015
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

16.01.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

19.01.2015
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

23.01.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

26.01.2015
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

30.01.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

02.02.2015
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

06.02.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

09.02.2015
14:00 - 15:30 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten

13.02.2015
09:45 - 11:15 wöchentlich
50.34 Raum -120 50.34 INFORMATIK, Kollegiengebäude am Fasanengarten


Lecturer: Dr.-Ing. Muhammad Saquib Sarfraz
Prof.Dr.Ing. Rainer Stiefelhagen
SWS: 4
Lv-No.: 24180

Motivation

Derzeitige Mensch-Maschine Schnittstellen sind immer noch weitgehend "blind", was die Wahrnehmung Ihrer Benutzer betrifft. Sie sind daher weder in der Lage, die natürlichen menschlichen Kommunikationskanäle wie Mimik, Blickrichtung, Gestik, Körpersprache etc. für die Mensch-Maschine Interaktion zu nutzen, noch um ausreichendes Wissen über Ihre Nutzer, deren Zustand und Absichten zu gewinnen. Aktuelle Forschungsarbeiten beschäftigen sich damit dies zu verbessern und bessere Mensch-Maschine Schnittstellen zu entwickeln, welche ihre Benutzer und deren Handlungen wahrnehmen, und die gewonnene Kontextinformation dazu nutzen um angemessen mit den Nutzern zu interagieren.

Beschreibung

In dieser Vorlesung werden aktuelle Arbeiten aus dem Bereich der Bildverarbeitung vorgestellt, die sich mit der visuellen Perzeption von Personen für die Mensch-Maschine Interaktion befassen. In den einzelnen Themengebieten werden verschiedene Methoden und Algorithmen, deren Vor- und Nachteile, sowie der State of the Art diskutiert:
  • Lokalisierung und Erkennung von Gesichtern
  • Erkennung der Mimik (facial expressions)
  • Schätzen von Kopfdrehung und Blickrichtung
  • Lokalisation und Tracking von Personen
  • Tracking und Modellierung von Körpermodellen ('articulated body tracking')
  • Gestenerkennung
  • Audio-visuelle Spracherkennung
  • Multi-Kamera Umgebungen
  • Tools und Bibliotheken
Literaturhinweise Weiterführende Literatur

Wissenschaftliche Veröffentlichungen zum Thema, werden auf der VL-Website bereitgestellt.

Lehrinhalt
  • Der Student soll einen Überblick über Themen des Maschinensehens (Computer Vision) für die Mensch-Maschine Interaktion bekommen.
  • Der Student soll grundlegende Konzepte aus dem Bereich Maschinensehen im Kontext der Mensch-Maschine Interaktion verstehen und anwenden lernen

Vorlesungsplan und Materialien

Ergänzende Literatur

  • Face Detection
  • Phung et al., Skin Segmentation Using Color Pixel Classification: Analysis and Comparison, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 27, No. 1, January 2005. [pdf]
  • H. A. Rowley, S. Baluja, and T. Kanade, Neural Network-Based Face Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, January 1998. [pdf]
  • Paul Viola and Michael Jones, Rapid Object Detection Using a boosted cascade of simple features, IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), 2001 [pdf]
  • Paul Viola and Michael Jones. Robust real-time object detection, Cambridge Research Laboratory, Technical Report, February 2001, CRL 2001/01 [pdf]
  • Face Recognition

  • Yaniv Taigman Ming Yang Marc’Aurelio Ranzato, DeepFace: Closing the Gap to Human-Level Performance in Face Verification, Facebook AI Research, Menlo Park, CA, USA [pdf]

  • Parkhi et al.: Deep Face Recognition, Visual Geometry Group, Department of Engineering Science, University of Oxford, 2015 [pdf]

  • Florian Schroff, Dmitry Kalenichenko, James Philbin, FaceNet: A Unified Embedding for Face Recognition and Clustering, June 2015 [pdf]

  • Person Detection
  • Person Detection I

  • N. Dalal, B. Triggs, Histogram Of Oriented Gradients for Human Detection, CVPR 2005 [pdf].
  • N. Dalal, B. Triggs, C. Schmid, Human Detection Using Oriented Histograms of Flow and Appearance, ECCV 2006 [pdf].
  • D. Gavrila, Multi-feature Hierarchical Template Matching Using Distance Transforms, ICPR 1998 [pdf].
  • D. Gavrila, Real-Time Object Detection for Smart Vehicles, ICCV 1999 [pdf].
  • D. Gavrila (2000), Pedestrian Detection from a Moving Vehicle, ECCV 2000 [pdf].
  • Person Detection II

  • A. Mohan, C. Papageorgiu, T. Poggio, Example-Based Object Detection in Images by Componentes, PAMI 2001 [pdf].
  • K. Mikolajczyk, C. Schmid, A Performance Evaluation of Local Descriptors, PAMI 2005 [pdf].
  • E. Seemann, B. Leibe, K. Mikolajczyk, B. Schiele, An Evaluation of Local Shape-Based Features for Pedestrian Detection, BMVC 2005 [pdf].
  • B. Leibe, A. Leonardis, B. Schiele, Combined Object Categorization and Segmentation with an Implicit Shape Model, ECCV 2004 [pdf].
  • B. Leibe, A. Leonardis, B. Schiele, Robust Object Detection with Interleaved Categorization and Segmentation, IJCV [pdf].
  • Person Detection III

  • R. Benenson, M. Mathias, R. Timofte, L. van Gool, Pedestrian Detection at 100 Frames per Second, CVPR 2012 [pdf]
  • P. Dollar, Z. Tu, P. Perona, S. Belonige, Integral Channel Features, BMVC 2009 [pdf]
  • L. Bourdev, J. Brandt, Robust Object Detection via Soft Cascades, CVPR 2005 [pdf]
  • P. Dollar, S. Belongie, P. Perona, The Fastest Pedestrian Detector in the West, BMVC 2010 [pdf]
  • A. Angelova, A. Krizhevsky, V. Vanhoucke, A. Ogale, D. Ferguson, Real-Time Pedestrian Detection With Deep Network Cascades, BMVC 2015 [pdf]
  • N. Srivastava et al., Dropout: A Simple Way to Prevent Neural Networks from Overfitting, Journal of Machine Learning Research, 2014 [pdf]
  • R. Benenson, R.Timofte, L. van Gool, Stixels Estimation Without Depth Map Computation, ICCV Workshop 2011 [pdf]
  • R. Benenson, M. Omran, J. Hosang, B. Schiele, Ten Years of Pedestrian Detection, What Have We Learned?, ECCV 2014 [pdf]
  • J. Hosang, M.Omran, R. Benenson, B. Schiele, Taking a Deeper Look at Pedestrians, CVPR 2015 [pdf]

Archiv