Anàlisi Multivariant

Crèdits
6
Tipus
Obligatòria d'especialitat (Ciència de les Dades)
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
EIO
L'objectiu del curs és proporcionar els conceptes estadístics de l'anàlisi de dades multivariants i les seves tècniques bàsiques, que constitueixen un dels pilars fonamentals de la Mineria de Dades.

Professors

Responsable

  • Arturo Palomino Gayete ( )

Altres

  • Belchin Adriyanov Kostov ( )
  • Daniel Fernández Martínez ( )
  • Dante Conti ( )

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0.15
Aprenentatge autònom
7.39

Competències

Competències Tècniques Generals

Genèriques

  • CG1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
  • CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.

Competències Transversals

ús solvent dels recursos d'informació

  • CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.

Raonament

  • CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.

Competències Tècniques de cada especialitat

Específiques comunes

  • CEC1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
  • CEC2 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.

Objectius

  1. Descripció multivariant de les dades
    Competències relacionades: CG1, CG3, CEC1, CEC2, CTR4, CTR6,
  2. Visualització de les dades
    Competències relacionades: CG3, CTR4,
  3. Inferencia multivariada
    Competències relacionades: CG3, CEC1, CEC2, CTR6,
  4. Classificació de nous individus
    Competències relacionades: CG1, CG3, CEC1, CEC2, CTR6,

Continguts

  1. Introducció a l'Anàlisi de Dades Multivariada
    Avantatges del tractament multivariant. Exemples de dades multivariades. Mètodes probables i lliures de distribució. Enfocament exploratori versus modelatge.
  2. Anàlisi de components principals
    Anàlisi d'individus. Anàlisi de variables. Representació visual de la informació. Reducció de dimensionalitat. Informació suplementària.
  3. Anàlisi de correspondències
    Mètode per explorar i visualitzar files i columnes d'una taula de contingència.
  4. Anàlisi de Correspondències Múltiples
    Mètode per explorar i visualitzar conjunts de dades amb variables categòriques. Normalment, conjunts de dades obtinguts d'una enquesta o d'un qüestionari.
  5. Anàlisi Factorial
    Mètode de reducció de dimensions. Molt comú a la mineria de text. Es detallaran exemples de com utilitzar-lo per a dades textuals.
  6. Regles d'associació
    Trobar patrons, associacions, correlacions o estructures causals freqüents entre conjunts d'elements o objectes en bases de dades de transaccions, bases de dades relacionals i altres repositoris d'informació.
  7. Anàlisi Factorial Múltiple
    Aquest mètode tracta del conjunt de dades on les variables s'organitzen en grups. Normalment, a partir de dades procedents de diferents fonts de variables. El mètode posa de manifest una estructura comuna de tots els grups i l'especificitat de cada grup. Permet comparar els resultats de diversos PCA o MCA en un marc de referència únic. Els grups de variables poden ser continus, categòrics o poden ser una taula de contingència.
  8. Anàlisi Discriminant i Naïve Bayes
    L'anàlisi discriminant (DA) i Naïve Bayes (NB) són mètodes de classificació. DA classifica les observacions en grups no superposats, basant-se en les puntuacions d'una o més variables predictores quantitatives. NB és un algorisme d'aprenentatge senzill que utilitza la regla de Bayes juntament amb una suposició ferma que els atributs són independents condicionalment, donada la classe.
  9. Árbres de Classificació i Regressió
    Aquest mètode pot predir o classificar. Explica com es poden predir o classificar els valors d'una variable de resultat en funció d'altres valors. Té una estructura gràfica molt útil.
  10. Clustering Jeràrquic i de Particions
    Dos enfocaments per agrupar mètodes utilitzats per classificar les observacions, dins d'un conjunt de dades, en múltiples grups en funció de la seva semblança.
  11. Clustering basat en models
    A la família d'aquest algoritmes, s'utilitzen determinats models per a clústers i s'intenta optimitzar l'ajust entre les dades i els models. En l'enfocament basat en models basats en el clúster, les dades es veuen provinents d'una barreja de distribucions de probabilitats, cadascuna de les quals representa un clúster diferent.

Activitats

Activitat Acte avaluatiu


Presentació de l'assignatura + Anàlisi Multivariant de Dades


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi de Components Principals


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi de Correspondències


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi de Correspondències Múltiples


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi Factorial


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Regles d'associació


Objectius: 2 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi Factorial Múltiple


Objectius: 2 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Anàlisi Discriminant i Naïve Bayes


Objectius: 3 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Árbres de Classificació i Regressió


Objectius: 2 3 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Clustering Jeràrquic i de Particions


Objectius: 2 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Clustering basat en models


Objectius: 2 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Regles d'associació


Objectius: 4
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Pràctica Final



Setmana: 18
Tipus: entrega
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
1h
Aprenentatge autònom
13h

Examen de conceptes



Setmana: 14
Tipus: examen de teoria
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
13h

Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h

Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5h


Metodologia docent

El curs té com a objectiu proporcionar les bases estadístiques per a la mineria de dades. L'aprenentatge es realitza mitjançant una combinació d'explicació teòrica i la seva aplicació a un cas real. Les classes desenvoluparan els coneixements científics necessaris, mentre que les classes de laboratori seran la seva aplicació per resoldre problemes de mineria de dades. La implementació de pràctiques afavoreix habilitats genèriques relacionades amb el treball en equip i la presentació de resultats i serveix per integrar diferents coneixements de la matèria. El programari utilitzat serà principalment R.

Mètode d'avaluació

L'avaluació de el curs es basarà en les notes obtingudes en els exercicis pràctics realitzats durant el curs, una nota d'examen i la nota obtinguda en la pràctica final.
Cada pràctica donarà lloc a la redacció de la corresponent redacció de l'informe i podrà realitzar-se de forma conjunta, fins a un màxim de tres alumnes per grup.
Els exercicis realitzats al llarg de el curs tenen com a objectiu consolidar l'aprenentatge de tècniques multivariants.
La pràctica final és que els estudiants demostrin la seva maduresa per resoldre un problema real utilitzant tècniques de visualització multivariant, interpretació d'agrupament i predicció. Els estudiants triaran entre diferents alternatives per resoldre el problema. Aquesta pràctica serà presentada i defensada públicament, en la qual l'alumne haurà de respondre a qualsevol dubte sobre els models teòrics i mètodes utilitzats en la solució. Les pràctiques es realitzen utilitzant el programari R.
La prova escrita es realitzarà l'últim dia de classe i avaluarà l'assimilació dels conceptes bàsics de l'assignatura. Mentre que la presentació de la segona pràctica es realitzarà durant el període d'exàmens.

Els exercicis a classe tenen una ponderació del 30%, l'examen del 30% i la pràctica final del 40%.

Bibliografia

Bàsica:

Complementaria:

Web links

Capacitats prèvies

L'assignatura suposa haver efectuat previament un curs basic d'estadística, programació i matemàtiques, en particular tenir adquirits els conceptes següents
- Concepte de mitjana, matriu de covariancies i correlacions.
- Concepte de prova de hipòtesis.
- Operacions d'algebra matricial, valors i vectors propis.
- Programació d'algorismes.
- Regressió lineal múltiple

Addenda

Continguts

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE TEACHING GUIDE

Metodologia docent

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE TEACHING GUIDE

Mètode d'avaluació

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE TEACHING GUIDE

Pla de contingència

FER LES CLASSES PER VIDEOCONFERENCIA DO THE CLASSES BY VIDEOCONFERENCE