Visió per Ordinador

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
ESAII
Aquesta assignatura és curs bàsic de visió per ordinador, que inclou els principis del processament d'imatges, el reconeixement d'escenes i la classificació d'objectes

Professorat

Responsable

  • Isiah Zaplana Agut ( )

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Competències Transversals

Transversals

  • CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.

Bàsiques

  • CB1 - Que els estudiants hagin demostrat posseir i comprendre coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es recolza en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda del seu camp d'estudi.
  • CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
  • CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia

Competències Tècniques

Específiques

  • CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
  • CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.
  • CE03 - Identificar i aplicar els procediments algorítmics bàsics de les tecnologies informàtiques per dissenyar solucions a problemes, analitzant la idoneïtat i complexitat dels algoritmes proposats.
  • CE04 - Dissenyar i utilitzar de forma eficient els tipus i estructures de dades més adequats a la resolució d'un problema.
  • CE13 - Avaluar la complexitat computacional d'un problema, identificar estratègies algorítmiques que puguin conduir a la seva resolució i recomanar, desenvolupar i implementar aquella que garanteixi el millor rendiment d'acord amb els requisits establerts.
  • CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
  • CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
  • CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
  • CE19 - Utilitzar els sistemes de computació actuals, inclosos sistemes d'alt rendiment, per al procés de grans volums de dades des del coneixement de la seva estructura, funcionament i particularitats.
  • CE26 - Dissenyar i aplicar tècniques de processat i anàlisi d'imatges i visió per computador en l'àmbit de la intel·ligència artificial i la robòtica

Competències Tècniques Generals

Genèriques

  • CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
  • CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
  • CG6 - Identificar oportunitats per a aplicacions innovadores de la intel·ligència artificial i la robòtica en entorns tecnològics en contínua evolució.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
  • CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.

Objectius

  1. Definir i quantificar les característiques d'una imatge
    Competències relacionades: CB1, CE04,
  2. Comparar i seleccionar les eines més adients de processat d'imatges en funció del problema a resoldre.
    Competències relacionades: CE26, CB1, CE01, CE02, CE03, CE04, CE15, CE19,
  3. Segmentar i etiquetar les regions d'una imatge
    Competències relacionades: CE26, CG2, CG4, CB5, CE01, CE03, CE04, CE13, CE15,
  4. Trobar els descriptors més significatius per a caracteritzar regions o punts d'interés d'un objecte
    Competències relacionades: CE26, CG2, CG4, CG8, CG9, CT6, CB5, CE14, CE15, CE18,
  5. Detectar i reconèixer la presència de determinats ítems en una imatge (amb i sense deep learning)
    Competències relacionades: CE26, CG2, CG4, CG6, CG8, CG9, CT6, CE14, CE15, CE18, CE19,
  6. Realitzar correctament experiments per avaluar els mètodes proposats, les seves limitacions i punts febles, en base a resultats objectivables.
    Competències relacionades: CG2, CG4, CG8, CB2, CE01, CE02, CE03, CE14,

Continguts

  1. Fonaments de la imatge digital
    La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies.
  2. Processament lineal, no-lineal i morfològic d'imatges
    Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
  3. Segmentació d'imatges
    Binarització. Extracció de contorns. Clustering per color. Segmentació morfològica.
  4. Descriptors i característiques
    Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar.
  5. Reconeixement d'objectes
    Reconeixement mediant l'ús de plantilles. Reconeixement amb l'ús de classificadors. Aparellament local. Aparellament global.
  6. Visió amb aprenentatge profund
    Reconeixement, detecció i identificació d'objectes. Arquitectures: YOLO, Fast/Faster R-CNN, Mask R-CNN. Visual transformers.

Activitats

Activitat Acte avaluatiu


Fonaments de la imatge digital

La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies.
Objectius: 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
4h

Processament lineal, no-lineal i morfològic d'imatges (I)

Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
Objectius: 2
Continguts:
Teoria
4h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Processament lineal, no-lineal i morfològic d'imatges (II)

Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
Objectius: 2
Continguts:
Teoria
4h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Segmentació d'imatges

Binarització. Extracció de contorns. Clustering per color. Segmentació morfològica.
Objectius: 3
Continguts:
Teoria
2h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
4h

Primer parcial


Objectius: 1 2 3
Setmana: 7 (Fora d'horari lectiu)
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
12h

Segon parcial


Objectius: 4 5 6
Setmana: 15 (Fora d'horari lectiu)
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
12h

Descriptors i característiques

Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar.
Objectius: 4
Continguts:
Teoria
6h
Problemes
0h
Laboratori
6h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Reconeixement d'objectes

Reconeixement mediant l'ús de plantilles. Reconeixement amb l'ús de classificadors. Aparellament local. Aparellament global.
Objectius: 5 6
Continguts:
Teoria
2h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Visió amb aprenentatge profund

Reconeixement, detecció i identificació d'objectes. Arquitectures: YOLO, Fast/Faster R-CNN, Mask R-CNN. Visual transformers.
Objectius: 5 6
Continguts:
Teoria
6h
Problemes
0h
Laboratori
6h
Aprenentatge dirigit
0h
Aprenentatge autònom
20h

Metodologia docent

Les classes teòriques es complementaran amb la posada en pràctica sobre PC de les tècniques exposades.
En les classes de laboratori es resoldran problemes reals de visió per computador.
Es plantejaran problemes de complexitat superior que l'alumne haurà de resoldre a casa.

Mètode d'avaluació

- Hi haurà dues proves parcials P1 i P2 amb notes NP1 i NP2. No hi ha examen final.

- Hi haurà un mínim d'un exercici plantejat a classe (teòric) i un plantejat als laboratoris informàtics (pràctic) amb notes ET i EP.

- Hi haurà un projecte final amb nota NPF.

La nota final s'obtindrà de la forma NF = 0'3*NP1+0,3*NP2 + 0,05*ET + 0,05*EP + 0,3*NPF.

Bibliografia

Bàsica:

Capacitats prèvies

Àlgebra lineal, càlcul vectorial i probabilitat.
Estructures de dades i programació