En aquest curs analitzarem el paradigma del reconeixement automàtic d'objectes des d'un punt de vista Visió per computadora i aprenentatge automàtic. Anem a revisar els reptes passats i recents en el reconeixement d'objectes, com ara el reconeixement d'objectes multi-modal, multipart, multi-escala, multi-vista, multi-classe, multi-etiqueta i gran escala, incloses les recents arquitectures d'aprenentatge profund. També revisarem les tendències actuals per a un tipus particular i complex d'objectes: "persones en dades visuals". Anem a tractar el problema de la recuperació de posicions humanes i l'anàlisi del comportament automàtic, que descriu les aplicacions potencials, així com futures línies de recerca en el camp.
Professorat
Responsable
Sergio Escalera Guerrero (
)
Altres
Meysam Madadi (
)
Hores setmanals
Teoria
1.5
Problemes
0
Laboratori
1
Aprenentatge dirigit
0
Aprenentatge autònom
0
Competències
Competències Tècniques Generals
Genèriques
CG2 - Capacitat per a dirigir, planificar i supervisar equips multidisciplinaris.
Competències Tècniques de cada especialitat
Acadèmiques
CEA3 - Capacitat de comprendre els principis bàsics de funcionament de les tècniques principals d'Aprenentatge Automàtic, i saber utilitzar-les en l'entorn d'un sistema o servei intel·ligent.
CEA4 - Capacitat de comprendre els principis bàsics de funcionament de les tècniques principals d'Intel·ligència Computacional, i saber utilitzar-les en l'entorn d'un sistema o servei intel·ligent.
CEA6 - Capacitat de comprendre els principis bàsics de funcionament de les tècniques de Visió Computacional, i saber utilitzar-les en l'entorn d'un sistema o servei intel·ligent.
CEA8 - Capacitat de realitzar investigació en noves tècniques, metodologies, arquitectures, serveis o sistemes en l'àrea de la Intel·ligència Artificial.
CEA13 - Capacitat de comprendre les tècniques avançades de Modelització, Raonament i Resolució de problemes, i saber dissenyar, implementar i aplicar aquestes tècniques en el desenvolupament d'aplicacions, serveis o sistemes intel·ligents.
CEA14 - Capacitat de comprendre les tècniques avançades de Visió, Percepció i Robòtica, i saber dissenyar, implementar i aplicar aquestes tècniques en el desenvolupament d'aplicacions, serveis o sistemes intel·ligents.
Professionals
CEP3 - Capacitat d'aplicació de les tècniques d'Intel·ligència Artificial en entorns tecnològics i industrials per a la millora de la qualitat i la productivitat.
CEP6 - Capacitat d'assimilar i integrar els canvis de l'entorn econòmic, social i tecnològic als objectius i procediments del treball informàtic en sistemes intel·ligents.
CEP8 - Capacitat de respectar l'entorn ambiental i dissenyar i desenvolupar sistemes intel·ligents sostenibles.
Competències Transversals
Actitud adequada davant el treball
CT5 - Estar motivat pel desenvolupament professional, per a afrontar nous reptes i per a la millora contínua. Tenir capacitat de treball en situacions de falta d'informació.
Bàsiques
CB7 - Que els estudiants siguin capaços d'integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d'una informació que, essent incomplerta o limitada, inclogui reflexions sobre les responsabilitats socials i ètiques vinculades a l'aplicació dels seus coneixements i judicis.
Objectius
Introduction to object and human recognition
Multi-modal object recognition
Multi-part object recognition
Multi-scale object recognition
Multi-view object recognition
Multi-class object recognition
Multi-label object recognition
Multi-ple data: deep-learning for large scale object recognition
Object Recognition in context: scene understanding and grammars
Human Pose Recovery
Human Behavior Analysis
Competències relacionades:
CT5,
CEA13,
CEA14,
CEA3,
CEA4,
CEA6,
CB7,
CEA8,
CEP3,
CEP6,
CEP8,
CG2,
T Each week it will be a 1.5h theoretical topic exposition class.
P Each week it will be a 1h practical session.
The rest of the course are devoted to autonomous lectures, programming, and studying.
Mètode d'avaluació
Es seguirà una metodologia d'avaluació continuada que consisteix en l'entrega de quatre informes de pràctiques (PR) i 2 presentacions a fer en classe (PS) sobre treballs de l'estat de l'art relacionats amb els continguts de l'assignatura. Al final del curs es farà un examen tipus test (TS). La nota final del curs (FS) serà calculada de la següent manera:
FS = 0.5 * PR + 0.3 * PS + 0.2 * TS
Es requereix una nota mínima de 3 punts sobre 10 a cadascuna de les parts PR, PS, i TS per optar a la avaluació final FS.
IEEE Transactions in Pattern Analysis and Machine Intelligence -
Sergio Escalera, David Tax, Oriol Pujol, Petia Radeva, and Robert Duin, ,
.
http://cataleg.upc.edu/record=b1203811~S1*cat
Proceedings of the British Machine Vision Conference (BMVA) -
Clocksin, W.F.; Fitzgibbon, A.W.; Torr, P.H.S. (eds.), British Machine Vision Association ,
2005.
IEEE 11th International Conference on Computer Vision, 14-21 Oct. 2007 -
Rabinovich, A. Vedaldi, C. Galleguillos, E. Wiewiora and S. Belongie, IEEE Computer Society ,
2007.
ICML '05: Proceedings of the 22nd international conference on machine learning -
S. Calinon, A. Billard, International Machine Learning Society ,
2005.