Home | Legals | Sitemap | KIT

Computer Vision für Mensch-Maschine-Schnittstellen

Computer Vision für Mensch-Maschine-Schnittstellen
Type: Vorlesung (V)
Chair: Fakultät für Informatik
Time: 2013-10-21
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten


2013-10-25
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-10-28
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-04
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-08
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-11
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-15
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-18
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-22
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-25
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-11-29
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-02
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-06
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-09
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-13
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-16
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-20
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2013-12-23
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-10
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-13
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-17
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-20
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-24
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-27
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-01-31
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-02-03
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-02-07
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-02-10
14:00:00 - 15:30:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten

2014-02-14
09:45:00 - 11:15:00 wöchentlich
50.34 Raum -120 INFORMATIK, Kollegiengebäude am Fasanengarten


Lecturer: Prof.Dr.Ing. Rainer Stiefelhagen
Dr.-Ing. Muhammad Saquib Sarfraz
SWS: 4
Lv-No.: 24180
Vortragsspracheunbekannt
Beschreibung In dieser Vorlesung werden aktuelle Arbeiten aus dem Bereich der Bildverarbeitung vorgestellt, die sich mit der visuellen Perzeption von Personen für die Mensch-Maschine Interaktion befassen. In den einzelnen Themengebieten werden verschiedene Methoden und Algorithmen, deren Vor- und Nachteile, sowie der State of the Art diskutiert:
  • Lokalisierung und Erkennung von Gesichtern
  • Erkennung der Mimik (facial expressions)
  • Schätzen von Kopfdrehung und Blickrichtung
  • Lokalisation und Tracking von Personen
  • Tracking und Modellierung von Körpermodellen ('articulated body tracking')
  • Gestenerkennung
  • Audio-visuelle Spracherkennung
  • Multi-Kamera Umgebungen
  • Tools und Bibliotheken
Literaturhinweise Weiterführende Literatur

Wissenschaftliche Veröffentlichungen zum Thema, werden auf der VL-Website bereitgestellt.

Lehrinhalt
  • Der Student soll einen Überblick über Themen des Maschinensehens (Computer Vision) für die Mensch-Maschine Interaktion bekommen.
  • Der Student soll grundlegende Konzepte aus dem Bereich Maschinensehen im Kontext der Mensch-Maschine Interaktion verstehen und anwenden lernen

Beschreibung

Derzeitige Mensch-Maschine Schnittstellen sind immer noch weitgehend "blind", was die Wahrnehmung Ihrer Benutzer betrifft. Sie sind daher weder in der Lage, die natürlichen menschlichen Kommunikationskanäle wie Mimik, Blickrichtung, Gestik, Körpersprache etc. für die Mensch-Maschine Interaktion zu nutzen, noch um ausreichendes Wissen über Ihre Nutzer, deren Zustand und Absichten zu gewinnen. Aktuelle Forschungsarbeiten beschäftigen sich damit dies zu verbessern und bessere Mensch-Maschine Schnittstellen zu entwickeln, welche ihre Benutzer und deren Handlungen wahrnehmen, und die gewonnene Kontextinformation dazu nutzen um angemessen mit den Nutzern zu interagieren.

In dieser Vorlesung werden aktuelle Arbeiten aus dem Bereich der Bildverarbeitung vorgestellt, die sich mit der visuellen Perzeption von Personen für die Mensch-Maschine Interaktion befassen. In den einzelnen Themengebieten werden verschiedene Methoden und Algorithmen, deren Vor- und Nachteile, sowie der Stand der Technik diskutiert.

Themen:

  • Lokalisierung und Erkennung von Gesichtern
  • Erkennung der Mimik (facial expressions)
  • Schätzen von Kopfdrehung und Blickrichtung
  • Lokalisation und Tracking von Personen
  • Tracking und Modellierung von Körpermodellen ("articulated body tracking")
  • Gestenerkennung
  • Audio-visuelle Spracherkennung
  • Multi-Kamera Umgebungen
  • Tools und Bibliotheken

Vorlesungsplan und Materialien

  • 21.10.2013 Introduction, Applications [pdf]
  • 25.10.2013 Basics: Computer Vision & Image Understanding [pdf]
  • 28.10.2013 Basics: Image Preprocessing [pdf]
  • 04.11.2013 Basics: Pattern recognition [pdf]
  • 08.11.2013 Machine Learning [pdf]
  • 11.11.2013 Project 1: Intro + Programming tips [pdf]
  • 15.11.2013 Mid-Level Representations (Dense Features and their encoding) [pdf]
  • 18.11.2013 Face Detection I: Color, Edges (Birchfield) [pdf]
  • 22.11.2013 Face Detection II: ANNs, Viola & Jones [pdf]
  • 25.11.2013 Face Recognition I [pdf]
  • 02.12.2013 Face Recognition II [pdf]
  • 06.12.2013 Facial Expression Recognition [pdf]
  • 09.12.2013 People Detection I - Holistic models [pdf]
  • 13.12.2013 People Detection II - Part-based models [pdf]
  • 16.12.2013 People Detection III (Part-Based Models) [pdf]
  • 20.12.2013 Project 1: Student Presentations, Project 2: Intro
  • 10.01.2014 Head Pose Estimation: Model-based, NN, Texture Mapping, Focus of Attention [pdf]
  • 13.01.2014 Tracking I : Kalman, Particle Filter & Applications (AV-Tracking, Body pose) [pdf]
  • 20.01.2014 Tracking II: Articulated Body Tracking [pdf]
  • 24.01.2014 Activity Analysis / Action recognition I [pdf]
  • 27.01.2014 Activity Analysis / Action recognition II [pdf]
  • 31.01.2014 Gesture Recognition: Taxonomy, Neill, Starner (ASL), Nickel, ... [pdf]
  • 03.02.2014 MS Kinect, Kinect-based body part detection & Programming
  • 07.02.2014 Project 2: Student Presentations & Lessons Learned
  • 10.02.2014 Laborbesuch

Ergänzende Literatur

  • Face Detection
  • Phung et al., Skin Segmentation Using Color Pixel Classification: Analysis and Comparison, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 27, No. 1, January 2005. [pdf]
  • H. A. Rowley, S. Baluja, and T. Kanade, Neural Network-Based Face Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, January 1998. [pdf]
  • Paul Viola and Michael Jones, Rapid Object Detection Using a boosted cascade of simple features, IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), 2001 [pdf]
  • Paul Viola and Michael Jones. Robust real-time object detection, Cambridge Research Laboratory, Technical Report, February 2001, CRL 2001/01 [pdf]
  • Face Recognition

  • Yaniv Taigman Ming Yang Marc’Aurelio Ranzato, DeepFace: Closing the Gap to Human-Level Performance in Face Verification, Facebook AI Research, Menlo Park, CA, USA [pdf]

  • Parkhi et al.: Deep Face Recognition, Visual Geometry Group, Department of Engineering Science, University of Oxford, 2015 [pdf]

  • Florian Schroff, Dmitry Kalenichenko, James Philbin, FaceNet: A Unified Embedding for Face Recognition and Clustering, June 2015 [pdf]

  • Person Detection
  • Person Detection I

  • N. Dalal, B. Triggs, Histogram Of Oriented Gradients for Human Detection, CVPR 2005 [pdf].
  • N. Dalal, B. Triggs, C. Schmid, Human Detection Using Oriented Histograms of Flow and Appearance, ECCV 2006 [pdf].
  • D. Gavrila, Multi-feature Hierarchical Template Matching Using Distance Transforms, ICPR 1998 [pdf].
  • D. Gavrila, Real-Time Object Detection for Smart Vehicles, ICCV 1999 [pdf].
  • D. Gavrila (2000), Pedestrian Detection from a Moving Vehicle, ECCV 2000 [pdf].
  • Person Detection II

  • A. Mohan, C. Papageorgiu, T. Poggio, Example-Based Object Detection in Images by Componentes, PAMI 2001 [pdf].
  • K. Mikolajczyk, C. Schmid, A Performance Evaluation of Local Descriptors, PAMI 2005 [pdf].
  • E. Seemann, B. Leibe, K. Mikolajczyk, B. Schiele, An Evaluation of Local Shape-Based Features for Pedestrian Detection, BMVC 2005 [pdf].
  • B. Leibe, A. Leonardis, B. Schiele, Combined Object Categorization and Segmentation with an Implicit Shape Model, ECCV 2004 [pdf].
  • B. Leibe, A. Leonardis, B. Schiele, Robust Object Detection with Interleaved Categorization and Segmentation, IJCV [pdf].
  • Person Detection III

  • R. Benenson, M. Mathias, R. Timofte, L. van Gool, Pedestrian Detection at 100 Frames per Second, CVPR 2012 [pdf]
  • P. Dollar, Z. Tu, P. Perona, S. Belonige, Integral Channel Features, BMVC 2009 [pdf]
  • L. Bourdev, J. Brandt, Robust Object Detection via Soft Cascades, CVPR 2005 [pdf]
  • P. Dollar, S. Belongie, P. Perona, The Fastest Pedestrian Detector in the West, BMVC 2010 [pdf]
  • A. Angelova, A. Krizhevsky, V. Vanhoucke, A. Ogale, D. Ferguson, Real-Time Pedestrian Detection With Deep Network Cascades, BMVC 2015 [pdf]
  • N. Srivastava et al., Dropout: A Simple Way to Prevent Neural Networks from Overfitting, Journal of Machine Learning Research, 2014 [pdf]
  • R. Benenson, R.Timofte, L. van Gool, Stixels Estimation Without Depth Map Computation, ICCV Workshop 2011 [pdf]
  • R. Benenson, M. Omran, J. Hosang, B. Schiele, Ten Years of Pedestrian Detection, What Have We Learned?, ECCV 2014 [pdf]
  • J. Hosang, M.Omran, R. Benenson, B. Schiele, Taking a Deeper Look at Pedestrians, CVPR 2015 [pdf]

Archiv