Reconocimiento de Objetos

Usted está aquí

Créditos
4
Tipos
Optativa
Requisitos
Esta asignatura no tiene requisitos
Departamento
UB;CS
En este curso, analizaremos el paradigma del reconocimiento automático de objetos desde los puntos de vista de Visión artificial y Aprendizaje automático. Revisaremos los desafíos pasados ​​y recientes en el reconocimiento de objetos, tales como el reconocimiento de objetos multimodal, de múltiples partes, de múltiples escalas, de múltiples vistas, de múltiples clases, de múltiples etiquetas y de gran escala, incluidas las arquitecturas recientes de aprendizaje profundo. También revisaremos las tendencias actuales para un tipo particular y complejo de objetos: "personas en datos visuales". Trataremos el problema de la recuperación de la pose humana y el análisis de comportamiento automático, describiendo las aplicaciones potenciales y las futuras líneas de investigación en el campo.

Profesores

Responsable

  • Simone Balocco ( )

Otros

  • Sergio Escalera ( )

Horas semanales

Teoría
1.5
Problemas
0
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
0

Competencias

Competencias Técnicas Genéricas

Genéricas

  • CG2 - Capacidad para dirigir, planificar y supervisar equipos multidisciplinares.

Competencias Técnicas de cada especialidad

Académicas

  • CEA6 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas de Visión Computacional, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
  • CEA14 - Capacidad de comprender las técnicas avanzadas de Visión, Percepción y Robótica, y saber diseñar, implementar y aplicar estas técnicas en el desarrollo de aplicaciones, servicios o sistemas inteligentes.

Profesionales

  • CEP6 - Capacidad de asimilar e integrar los cambios del entorno economico, social y tecnologico a los objetivos y procedimientos del trabajo informatico en sistemas inteligentes.
  • CEP8 - Capacidad de respetar el entorno ambiental y diseñar y desarrollar sistemas inteligentes sostenibles.

Competencias Transversales

Actitud frente al trabajo

  • CT5 - Estar motivado para el desarrollo profesional, para afrontar nuevos retos y para la mejora continua. Tener capacidad de trabajo en situaciones de falta de informacion.

Básicas

  • CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios

Contenidos

  1. Introduction to object and human recognition
  2. Multi-modal object recognition
  3. Multi-part object recognition
  4. Multi-scale object recognition
  5. Multi-view object recognition
  6. Multi-class object recognition
  7. Multi-label object recognition
  8. Multi-ple data: deep-learning for large scale object recognition
  9. Object Recognition in context: scene understanding and grammars
  10. Human Pose Recovery
  11. Human Behavior Analysis

Actividades

Actividad Acto evaluativo


Paper presentation



Semana: 10
Tipo: examen de teoría
Teoría
1h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5h

Paper presentation 2



Semana: 14
Tipo: examen de teoría
Teoría
1h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5h

Exam



Semana: 15 (Fuera de horario lectivo)
Tipo: examen final
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
30h

Laboratory 1



Semana: 2
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h

Laboratory 2



Semana: 5
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h

Laboratory 3



Semana: 8
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h

Laboratory 4



Semana: 12
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h

Theoretical class



Teoría
22.5h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Practical sessions



Teoría
0h
Problemas
0h
Laboratorio
15h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Metodología docente

T – Each week it will be a 1.5h theoretical topic exposition class.
P – Each week it will be a 1h practical session.
The rest of the course are devoted to autonomous lectures, programming, and studying.

Método de evaluación

The course will follow a continuous evaluation consisting in four practical reports (PR) and two in-class presentations (PS). At the end of the course a test exam will be performed (TS). The final score (FS) will be computed as follows:
FS = 0.5 * PR + 0.3 * PS + 0.2 * TS
A minimum score of 3 over 10 points is required for each part PR, PS, and TS in order to compute the final score FS.

Bibliografía

Básica:

  • Computer Vision: A Modern Approach - David A. Forsyth, Jean Ponce, 2002.
  • Computer Vision: Algorithms and Applications - Richard Szeliski, 2010.
    http://szeliski.org/Book/

Complementaria:

  • Human Behavior Analysis from Depth Maps - Sergio Escalera, AMDO , 2012.
  • Object detection with discriminatively trained part-based models - P. Felzenszwalb, R. Girshick, D. McAllester, D. Ramanan, PAMI , 2010, vol. 32, num. 9.
  • Multi-scale stacked sequential learning - C. Gatta, E. Puertas, and O. Pujol, Pattern Recognition , 2011, vol. 44, issue 10-11, pp. 2414-2426.
  • Multiple View Geometry Vision - R. Hartley and A. Zisserman, , .
  • On the Decoding Process in Ternary Error-Correcting Output Codes - Sergio Escalera, Oriol Pujol, and Petia Radeva, IEEE PAMI , 2010, vol. 32, issue 1, pp. 120-134. ISBN: 0162-8828
    http://cataleg.upc.edu/record=b1000619~S1*cat
  • Subclass Problem-dependent Design of Error-Correcting Output Codes - Sergio Escalera, David Tax, Oriol Pujol, Petia Radeva, and Robert Duin, IEEE Transactions in Pattern Analysis and Machine Intelligence , 2008, vol. 30, issue 6, pp. 1041-1054.
  • An extensive experimental comparison of methods for multi-label learning - Gjorgji Madjarov, Dragi Kocev, Author Vitae, Dejan Gjorgjevikj, Sašo Džeroski, Pattern Recognition , 2012.
  • Sub-linear Indexing for Large Scale Object Recognitiom - Stepan Obdrzalek and Jiri Matas, BMVC , 2005.
  • 80 million tiny images: a large dataset for non-parametric object and scene recognition - A. Torralba, R. Fergus, W. T. Freeman, PAMI , 2008.
  • The role of context in object recognition - Oliva, A. Torralba, Trends in Cognitive Sciences , 2007.
  • Objects in Context - Rabinovich, A. Vedaldi, C. Galleguillos, E. Wiewiora and S. Belongie, ICCV , 2007.
  • A Stochastic Grammar of Images - S.C. Zhu and D. Mumford, Foundations and Trends in Computer Graphics and Vision , 2006.
  • Articulated pose estimation with flexible mixtures-of-parts - Y. Yang, D. Ramanan, Computer Vision and Pattern Recognition (CVPR) , 2011, pp. 1385–1392.
  • Real-time American Sign Language Recognition using desk and wearable computer based video - T. Starner, J. Weaver, and A. Pentland, IEEE TPAMI , 1998, vol. 20, issue 1, pp. 1371-1375.
  • A tutorial on Hidden Markov Models and selected applications - L. Rabiner, IEEE Speech recognition , 1989, vol.2, pp.257-286.
  • A probabilistic framework for matching temporal trajectories: Condensation-based recognition of gestures and expressions - M. Black and A. Jepson, LNCS , 1998, vol. 1406, pp. 909-924.
  • Recognition and reproduction of gestures using a probabilistic framework combining PCA, ICA and HMM - S. Calinon, A. Billard, ICML , 2005.
  • Deep Learning - Yoshua Bengio, Ian Goodfellow, Aaron Courville, MIT Press , 2016.
  • Deep learning - LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton, Nature , 521 no. 7553 (2015): 436-444.