Aquesta assignatura és curs bàsic de visió per ordinador, que inclou els principis del processament d'imatges, el reconeixement d'escenes i la classificació d'objectes
Professorat
Responsable
Isiah Zaplana Agut (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
Bàsiques
CB1 - Que els estudiants hagin demostrat posseir i comprendre coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es recolza en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda del seu camp d'estudi.
CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia
Competències Tècniques
Específiques
CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.
CE03 - Identificar i aplicar els procediments algorítmics bàsics de les tecnologies informàtiques per dissenyar solucions a problemes, analitzant la idoneïtat i complexitat dels algoritmes proposats.
CE04 - Dissenyar i utilitzar de forma eficient els tipus i estructures de dades més adequats a la resolució d'un problema.
CE13 - Avaluar la complexitat computacional d'un problema, identificar estratègies algorítmiques que puguin conduir a la seva resolució i recomanar, desenvolupar i implementar aquella que garanteixi el millor rendiment d'acord amb els requisits establerts.
CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
CE19 - Utilitzar els sistemes de computació actuals, inclosos sistemes d'alt rendiment, per al procés de grans volums de dades des del coneixement de la seva estructura, funcionament i particularitats.
CE26 - Dissenyar i aplicar tècniques de processat i anàlisi d'imatges i visió per computador en l'àmbit de la intel·ligència artificial i la robòtica
Competències Tècniques Generals
Genèriques
CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
CG6 - Identificar oportunitats per a aplicacions innovadores de la intel·ligència artificial i la robòtica en entorns tecnològics en contínua evolució.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Objectius
Definir i quantificar les característiques d'una imatge
Competències relacionades:
CB1,
CE04,
Comparar i seleccionar les eines més adients de processat d'imatges en funció del problema a resoldre.
Competències relacionades:
CE26,
CB1,
CE01,
CE02,
CE03,
CE04,
CE15,
CE19,
Trobar els descriptors més significatius per a caracteritzar regions o punts d'interés d'un objecte
Competències relacionades:
CE26,
CG2,
CG4,
CG8,
CG9,
CT6,
CB5,
CE14,
CE15,
CE18,
Detectar i reconèixer la presència de determinats ítems en una imatge (amb i sense deep learning)
Competències relacionades:
CE26,
CG2,
CG4,
CG6,
CG8,
CG9,
CT6,
CE14,
CE15,
CE18,
CE19,
Realitzar correctament experiments per avaluar els mètodes proposats, les seves limitacions i punts febles, en base a resultats objectivables.
Competències relacionades:
CG2,
CG4,
CG8,
CB2,
CE01,
CE02,
CE03,
CE14,
Continguts
Fonaments de la imatge digital
La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies.
Processament lineal, no-lineal i morfològic d'imatges
Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
Segmentació d'imatges
Binarització. Extracció de contorns. Clustering per color. Segmentació morfològica.
Descriptors i característiques
Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar.
Reconeixement d'objectes
Reconeixement mediant l'ús de plantilles. Reconeixement amb l'ús de classificadors. Aparellament local. Aparellament global.
Visió amb aprenentatge profund
Reconeixement, detecció i identificació d'objectes. Arquitectures: YOLO, Fast/Faster R-CNN, Mask R-CNN. Visual transformers.
Activitats
ActivitatActe avaluatiu
Fonaments de la imatge digital
La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies. Objectius:1 Continguts:
Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar. Objectius:4 Continguts:
Les classes teòriques es complementaran amb la posada en pràctica sobre PC de les tècniques exposades.
En les classes de laboratori es resoldran problemes reals de visió per computador.
Es plantejaran problemes de complexitat superior que l'alumne haurà de resoldre a casa.
Mètode d'avaluació
- Hi haurà dues proves parcials P1 i P2 amb notes NP1 i NP2. No hi ha examen final.
- Hi haurà un mínim d'un exercici plantejat a classe (teòric) i un plantejat als laboratoris informàtics (pràctic) amb notes ET i EP.
- Hi haurà un projecte final amb nota NPF.
La nota final s'obtindrà de la forma NF = 0'3*NP1+0,3*NP2 + 0,05*ET + 0,05*EP + 0,3*NPF.