Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
EIO
Web
https://www.fib.upc.edu/en/studies/masters/master-data-science/curriculum/syllabus/MVA-MDS
Professorat
Responsable
- Nihan Acar Denizli ( nihan.acar.denizli@upc.edu )
Altres
- Belchin Adriyanov Kostov ( belchin.adriyanov.kostov@upc.edu )
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
7.11
Competències
Ús solvent dels recursos d'informació
Tercera llengua
Emprenedoria i innovació
Bàsiques
Genèriques
Específiques
Objectius
-
Visualització de les dades
Competències relacionades: CT4, CT5, CT1, CG2, CE5, CB8, -
Descripció multivariant de les dades
Competències relacionades: CT4, CE7, CE8, CE12, CE13, CB7, CB9, CB10, -
Mètodes de reducció de dimensions
Competències relacionades: CT4, CT5, CG2, CE5, CE6, CE11, CE8, CE10, CB6, CB8, CB9, CB10, -
Inferencia multivariada
Competències relacionades: CT1, CG2, CG3, CE6, CE11, CE8, CE9, CE10, CB6, CB7, CB9, -
Classificació de nous individus
Competències relacionades: CT1, CG3, CE6, CE10, CB6, CB7,
Continguts
-
Introducció a l'Anàlisi de Dades Multivariada
Preprocessament i visualització de dades multivariants. -
Anàlisi de components principals
Anàlisi d'individus. Anàlisi de variables. Representació visual de la informació. Reducció de dimensionalitat. Informació suplementària. Descomposició en valors singulars. -
Escalament Multidimensional
Reducció de la dimensió basada en matrius de similitud o distància amb aplicacions. -
Anàlisi de Correspondències
Reducció de dimensions de dues variables categòriques i visualització de relacions entre categories. -
Anàlisi de Correspondències Multiple
L'anàlisi i visualització de relacions entre categories de més de dues variables categòriques mitjançant reducció de dimensió. -
Anàlisi de Cluster
L'ús de mètodes de clustering jeràrquics i no jeràrquics per classificar les observacions en grups basats en dades multivariants. -
Mètodes de profiling
Els mètodes de profiling ajuden a entendre les característiques comunes dels clusters. -
Distribució normal multivariant
La funció de densitat de probabilitat de distribució normal multivariada i proves d'hipòtesi de mitjana per a dades multivariades. -
Anàlisi Discriminant
Classificació d'observacions en grups donats mitjançant l'ús d'anàlisi discriminant lineal, anàlisi discriminant quadràtic i mètodes Naive Bayes. -
Regles d'associació
Trobar patrons, associacions, correlacions o estructures causals freqüents entre conjunts d'elements o objectes en bases de dades de transaccions, bases de dades relacionals i altres repositoris d'informació.
Activitats
Activitat Acte avaluatiu
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
5.5h
Sessió de Dubtes
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Tasca 2
En aquesta tasca l'alumne ha d'aplicar els mètodes de classificació sobre un cas d'estudi i interpretar els resultats. Aquesta tasca es realitza en grups de tres alumnes.Objectius: 4 5 3
Setmana: 13 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Examen Final
A l'examen final l'alumnat serà responsable de tots els mètodes que hagi vist al llarg del semestre. Hi haurà preguntes tant teòriques com d'interpretació basades en resultats R a l'examen.Objectius: 2 4 5 1 3
Setmana: 15 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Projecte Final
El projecte final inclou l'aplicació i interpretació dels mètodes d'anàlisi de dades multivariants sobre un conjunt de dades reals que es podrien seleccionar en funció dels interessos dels estudiants. S'ha de fer en grups de tres alumnes.Objectius: 2 4 5 1 3
Setmana: 14 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
Aquesta assignatura pretén donar una explicació teòrica de diferents mètodes per a l'anàlisi de dades multivariants i les seves aplicacions en conjunts de dades reals. A les classes de teoria s'explicaran els fonaments i l'estructura teòrica dels mètodes mentre que a les sessions de laboratori es farà l'aplicació de mètodes considerats sobre diferents conjunts de dades a R. Els projectes i els deures de l'assignatura es faran en grups que permetin als estudiants col·loborar per construir un treball en equip.Mètode d'avaluació
Durant el curs els estudiants hauran de lliurar dos deures (tasques) i un treball final que s'haurà de realitzar en grups de tres estudiants. Els primers deures se centren en l'aplicació de mètodes de reducció de dimensió mentre que els segons se centren en mètodes de classificació.En el projecte final de l'assignatura els estudiants hauran de treballar en un conjunt de dades reals que descarreguen o rastregen webs i aplicar els mètodes vistos durant el curs en els conjunts de dades escollits. Els resultats s'han de presentar en un informe escrit en format pdf.La nota global dels estudiants serà del 15% per la primera tasca, del 15% per la segona, del %40 pel projecte final i del 30% per l'examen final.
Bibliografia
Bàsic
-
Applied multivariate statistical analysis
- Johnson, Richard A.; Wichern, Dean W,
Pearson Education Limited,
[2014].
ISBN: 9781292024943
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=5174865 -
Exploratory multivariate analysis by example using R
- Husson, F.; Lê, S.; Pagès, J,
CRC Press, Taylor & Francis Group,
2017.
ISBN: 9781315301860
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=4856173 -
Multivariate statistical methods : a primer
- Manly, Bryan F. J,
CRC Press, Taylor & Francis Group,
[2017].
ISBN: 9781498728966
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004178359706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementari
-
Análisis de datos multivariantes
- Peña, Daniel,
McGraw-Hill/Interamericana de España, S.L,
[2010].
ISBN: 9788448136109
https://www-ingebook-com.recursos.biblioteca.upc.edu/ib/NPcd/IB_BooksVis?cod_primaria=1000187&codigo_libro=4203
Web links
- Homepage of R https://cran.r-project.org/
- R for Data Science (2e) https://r4ds.hadley.nz/
- R Cookbook https://rc2e.com/
- Rstudio homepage https://rstudio.com/
Capacitats prèvies
L'assignatura suposa haver efectuat previament un curs basic d'estadística, programació i matemàtiques, en particular tenir adquirits els conceptes següents:- Anàlisi estadística descriptiva.
- Concepte de prova de hipòtesis.
- Operacions d'algebra matricial, valors i vectors propis.
- Programació d'algorismes.
- Regressió lineal múltiple