En este curso, analizaremos el paradigma del reconocimiento automático de objetos desde los puntos de vista de Visión artificial y Aprendizaje automático. Revisaremos los desafíos pasados y recientes en el reconocimiento de objetos, tales como el reconocimiento de objetos multimodal, de múltiples partes, de múltiples escalas, de múltiples vistas, de múltiples clases, de múltiples etiquetas y de gran escala, incluidas las arquitecturas recientes de aprendizaje profundo. También revisaremos las tendencias actuales para un tipo particular y complejo de objetos: "personas en datos visuales". Trataremos el problema de la recuperación de la pose humana y el análisis de comportamiento automático, describiendo las aplicaciones potenciales y las futuras líneas de investigación en el campo.
Profesorado
Responsable
Sergio Escalera Guerrero (
)
Horas semanales
Teoría
1.5
Problemas
0
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
0
Competencias
Competencias Técnicas Genéricas
Genéricas
CG2 - Capacidad para dirigir, planificar y supervisar equipos multidisciplinares.
Competencias Técnicas de cada especialidad
Académicas
CEA3 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas principales de Aprendizaje Automático, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA4 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas principales de Inteligencia Computacional, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA6 - Capacidad de comprender los principios básicos de funcionamiento de las técnicas de Visión Computacional, y saber utilizarlas en el entorno de un sistema o servicio inteligente.
CEA8 - Capacidad de realizar investigación en nuevas técnicas, metodologías, arquitecturas, servicios o sistemas en el área de la Inteligencia Artificial.
CEA13 - Capacidad de comprender las técnicas avanzadas de Modelización, Razonamiento y Resolución de problemas, y saber diseñar, implementar y aplicar estas técnicas en el desarrollo de aplicaciones, servicios o sistemas inteligentes.
CEA14 - Capacidad de comprender las técnicas avanzadas de Visión, Percepción y Robótica, y saber diseñar, implementar y aplicar estas técnicas en el desarrollo de aplicaciones, servicios o sistemas inteligentes.
Profesionales
CEP3 - Capacidad de aplicación de las técnicas de Inteligencia Artificial en entornos tecnológicos e industriales para la mejora de la calidad y la productividad.
CEP6 - Capacidad de asimilar e integrar los cambios del entorno economico, social y tecnologico a los objetivos y procedimientos del trabajo informatico en sistemas inteligentes.
CEP8 - Capacidad de respetar el entorno ambiental y diseñar y desarrollar sistemas inteligentes sostenibles.
Competencias Transversales
Actitud frente al trabajo
CT5 - Estar motivado para el desarrollo profesional, para afrontar nuevos retos y para la mejora continua. Tener capacidad de trabajo en situaciones de falta de informacion.
Básicas
CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
Objetivos
Introduction to object and human recognition
Multi-modal object recognition
Multi-part object recognition
Multi-scale object recognition
Multi-view object recognition
Multi-class object recognition
Multi-label object recognition
Multi-ple data: deep-learning for large scale object recognition
Object Recognition in context: scene understanding and grammars
Human Pose Recovery
Human Behavior Analysis
Competencias relacionadas:
CT5,
CEA13,
CEA14,
CEA3,
CEA4,
CEA6,
CB7,
CEA8,
CEP3,
CEP6,
CEP8,
CG2,
Semana:
15 (Fuera de horario lectivo) Tipo:
examen final
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
30h
Laboratory 1
Semana:
2 Tipo:
entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h
Laboratory 2
Semana:
5 Tipo:
entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h
Laboratory 3
Semana:
8 Tipo:
entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h
Laboratory 4
Semana:
12 Tipo:
entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
4h
Theoretical class
Teoría
22.5h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Practical sessions
Teoría
0h
Problemas
0h
Laboratorio
15h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Metodología docente
T Each week it will be a 1.5h theoretical topic exposition class.
P Each week it will be a 1h practical session.
The rest of the course are devoted to autonomous lectures, programming, and studying.
Método de evaluación
The course will follow a continuous evaluation consisting in four practical reports (PR) and two in-class presentations (PS). At the end of the course a test exam will be performed (TS). The final score (FS) will be computed as follows:
FS = 0.5 * PR + 0.3 * PS + 0.2 * TS
A minimum score of 3 over 10 points is required for each part PR, PS, and TS in order to compute the final score FS.
IEEE Transactions in Pattern Analysis and Machine Intelligence -
Sergio Escalera, David Tax, Oriol Pujol, Petia Radeva, and Robert Duin, ,
.
http://cataleg.upc.edu/record=b1203811~S1*cat
Proceedings of the British Machine Vision Conference (BMVA) -
Clocksin, W.F.; Fitzgibbon, A.W.; Torr, P.H.S. (eds.), British Machine Vision Association ,
2005.
IEEE 11th International Conference on Computer Vision, 14-21 Oct. 2007 -
Rabinovich, A. Vedaldi, C. Galleguillos, E. Wiewiora and S. Belongie, IEEE Computer Society ,
2007.
ICML '05: Proceedings of the 22nd international conference on machine learning -
S. Calinon, A. Billard, International Machine Learning Society ,
2005.