En este curso, analizaremos el paradigma del reconocimiento automático de objetos desde los puntos de vista de Visión artificial y Aprendizaje automático. Revisaremos los desafíos pasados y recientes en el reconocimiento de objetos, tales como el reconocimiento de objetos multimodal, de múltiples partes, de múltiples escalas, de múltiples vistas, de múltiples clases, de múltiples etiquetas y de gran escala, incluidas las arquitecturas recientes de aprendizaje profundo. También revisaremos las tendencias actuales para un tipo particular y complejo de objetos: "personas en datos visuales". Trataremos el problema de la recuperación de la pose humana y el análisis de comportamiento automático, describiendo las aplicaciones potenciales y las futuras líneas de investigación en el campo.
Profesorado
Responsable
Sergio Escalera Guerrero (
)
Otros
Meysam Madadi (
)
Horas semanales
Teoría
1.5
Problemas
0
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
0
Competencias
Competencias Técnicas Genéricas
Genéricas
CG2 - Capacidad para dirigir, planificar y supervisar equipos multidisciplinares.
Competencias Técnicas de cada especialidad
Académicas
CEA3 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas principales de Aprendizaje Automático, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA4 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas principales de Inteligencia Computacional, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA6 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas de Visión Computacional, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA8 - Capacidad de realizar investigación en nuevas técnicas, metodologías, arquitecturas, servicios o sistemas en el área de la Inteligencia Artificial.
CEA13 - Capacidad de comprender las técnicas avanzadas de Modelización, Razonamiento y Resolución de problemas, y saber diseñar, implementar y aplicar estas técnicas en el desarrollo de aplicaciones, servicios o sistemas inteligentes.
CEA14 - Capacidad de comprender las técnicas avanzadas de Visión, Percepción y Robótica, y saber diseñar, implementar y aplicar estas técnicas en el desarrollo de aplicaciones, servicios o sistemas inteligentes.
Profesionales
CEP3 - Capacidad de aplicación de las técnicas de Inteligencia Artificial en entornos tecnológicos e industriales para la mejora de la calidad y la productividad.
CEP6 - Capacidad de asimilar e integrar los cambios del entorno economico, social y tecnologico a los objetivos y procedimientos del trabajo informatico en sistemas inteligentes.
CEP8 - Capacidad de respetar el entorno ambiental y diseñar y desarrollar sistemas inteligentes sostenibles.
Competencias Transversales
Actitud frente al trabajo
CT5 - Estar motivado para el desarrollo profesional, para afrontar nuevos retos y para la mejora continua. Tener capacidad de trabajo en situaciones de falta de informacion.
Básicas
CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
Objetivos
Introduction to object and human recognition
Multi-modal object recognition
Multi-part object recognition
Multi-scale object recognition
Multi-view object recognition
Multi-class object recognition
Multi-label object recognition
Multi-ple data: deep-learning for large scale object recognition
Object Recognition in context: scene understanding and grammars
Human Pose Recovery
Human Behavior Analysis
Competencias relacionadas:
CT5,
CEA13,
CEA14,
CEA3,
CEA4,
CEA6,
CB7,
CEA8,
CEP3,
CEP6,
CEP8,
CG2,
T Each week it will be a 1.5h theoretical topic exposition class.
P Each week it will be a 1h practical session.
The rest of the course are devoted to autonomous lectures, programming, and studying.
Método de evaluación
The course will follow a continuous evaluation consisting in four practical reports (PR) and two in-class presentations (PS). At the end of the course a test exam will be performed (TS). The final score (FS) will be computed as follows:
FS = 0.5 * PR + 0.3 * PS + 0.2 * TS
A minimum score of 3 over 10 points is required for each part PR, PS, and TS in order to compute the final score FS.
IEEE Transactions in Pattern Analysis and Machine Intelligence -
Sergio Escalera, David Tax, Oriol Pujol, Petia Radeva, and Robert Duin, ,
.
http://cataleg.upc.edu/record=b1203811~S1*cat
Proceedings of the British Machine Vision Conference (BMVA) -
Clocksin, W.F.; Fitzgibbon, A.W.; Torr, P.H.S. (eds.), British Machine Vision Association ,
2005.
IEEE 11th International Conference on Computer Vision, 14-21 Oct. 2007 -
Rabinovich, A. Vedaldi, C. Galleguillos, E. Wiewiora and S. Belongie, IEEE Computer Society ,
2007.
ICML '05: Proceedings of the 22nd international conference on machine learning -
S. Calinon, A. Billard, International Machine Learning Society ,
2005.