Model.lització estadística és la segona d'una seqüència de 4 assignatures del grau dedicades a l'estadística i les dades. Com a continuació de l'assignatura precedent introductòria en l'àmbit de la probabilitat i estadística, aquesta assignatura aporta formació en els principals models estadístics que permeten extreure coneixement de les dades.
Les tècniques de model.lització estadística constitueixen un dels pilars fonamentals de l'àmbit del suport a la presa de decisions, i l'anàlisi intel.ligent de dades
En aquest curs es veuran els principals models multivariants predictius (model lineal general), i descriptius (anàlisi multivariant i clustering), així com nocions de disseny d'experiments que seran útils en la configuració dels conjunts de dades d'entrenament i validació dels models, no només per aquesta assignatura, sinó també per les d'aprenentatge automàtic que també es veuen en el grau. S'inclou en el programa de l'assignatura eines de modelització dinàmica per dades amb caràcter temporal.
Les eines vistes en aquesta assignatura complementaran les vistes a aprenentatge automàtic i seran input imprescindible per les assignatures de la matèria anàlisi intel·ligent de dades i sistemes intel·ligents de suport a la presa de decisions.
Professorat
Responsable
Jordi Cortés Martínez (
)
Altres
Dante Conti (
)
Karina Gibert Oliveras (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT3 [Avaluable] - Comunicació eficaç oral i escrita. Comunicar-se de forma oral i escrita amb altres persones sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions; participar en debats sobre temes de la pròpia especialitat.
CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.
Bàsiques
CB3 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
CB4 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
Competències Tècniques
Específiques
CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
CE09 - Concebre, dissenyar i integrar sistemes d'anàlisi intel·ligent de dades amb aplicació en entorns de producció i de serveis.
CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.
Competències Tècniques Generals
Genèriques
CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
Objectius
Dissenyar jocs de proves i d'entrenament solvents i orientats a objectius
Competències relacionades:
CG8,
CT8,
CB3,
CE09,
Identificar quin model predictiu és adequat per un problema concret i unes dades concretes
Competències relacionades:
CG4,
CE01,
CE09,
CE20,
Construir i interpretar models vàlids per l'evolució temporal d'una variable numèrica
Competències relacionades:
CG4,
CT3,
CT4,
CE01,
CE09,
CE20,
Identificar classes en un conjunt de dades i saber-les validar i interpretar conceptualment
Competències relacionades:
CG2,
CG4,
CT3,
CT4,
CE01,
CE09,
CE20,
Caracteritzar les relacions multivariants en un conjunt de dades amb tècniques d'anàlisi factorial
Competències relacionades:
CG4,
CT3,
CT4,
CE01,
CE09,
CE20,
Poder fer l'anàlisi bàsica no supervisada d'una base de dades textual amb tècniques bàsiques de topic modelling i anàlisi multivariant per dades textuals
Competències relacionades:
CG4,
CT3,
CT4,
CE01,
CE09,
CE20,
Saber construir i validar el model adequat per una situació real nova
Competències relacionades:
CG2,
CG4,
CT3,
CT4,
CE01,
CE09,
CE20,
Saber integrar els continguts dels diferents temes d'aquest curs i els previs en una solució global per un problema complex
Competències relacionades:
CG2,
CE01,
CE09,
CE20,
Saber planificar a llarg termini la modelització d'un problema real complex i resoldre'l al llarg del curs en equip
Competències relacionades:
CT3,
CT4,
CB4,
Continguts
Models lineals generalitzats
Introducció als conceptes de models lineals generalitzats. Models logístics
Sèries temporals
Introducció als processos estocàstics. Sèrie cronològica vs Sèrie temporal
Metodologia Box-Jenkins
Principals models de sèries temporals: MA, AR , ARIMA, SARIMA (concepte i estudi de casos)
Anàlisis factorial
Métodes de reducció de dimensionalitat
Clustering
Introducció. Principal models de classificació. Distàncies.
Profiling
Descripció de les classificacions a partir de l'estudi de significativitat de variables
Disseny d'experiments
Dissenys 2k complets i fraccionals. Anàlisis de sensibilitat i explicabilitat dels models. Identificació d'efectes principals i interaccions. Disseny de conjunts de dades d'entrenament per aprenentatge automàtic. Disseny de jocs de test per validació de models de dades
Activitats
ActivitatActe avaluatiu
Treball en equip
Els alumnes s'organitzen en grups i busquen unes dades reals que compleixen certs requisits marcats pel professor Les utilitzen per anar aplicant les tècniques i metodologies que es vegin al llarg del curs. Al final presenten un informe amb els resultats i fan una presentació oral amb els resultats més rellevants de l'estudi Objectius:123456789 Continguts:
Execució de scripts pràctics a R sobre els conceptes vistos en teoria.
Teoria
0h
Problemes
0h
Laboratori
12.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Quiz 1
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:2 Setmana:
4
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0.5h
Quiz 2
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:23 Setmana:
7
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0.5h
Presentació inicial de la pràctica
Presentació inicial de la pràctica Objectius:123456789 Continguts:
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:23 Setmana:
8
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0.5h
Quiz 4
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:4 Setmana:
11
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0.5h
Quiz 5
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:1 Setmana:
13
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0.5h
Presentació final pràctica
Presentació final pràctica Objectius:23456789 Setmana:
14
Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Examen Final
Examen Final Objectius:123456789 Setmana:
15 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Metodologia docent
L'assignatura consta de dues hores de teoria i dues de laboratori per setmana
Al web de l'assignatura hi haurà el calendari de l'assignatura i els materials per preparar cada classe. La classe de teoria es dedicarà fonamentalment a explicar conceptes i a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, el desenvolupament de problemes.
Els estudiants realitzaran per grups de 4 persones un treball pràctic amb dades que buscaran ells mateixos i que compliran certes característiques fixades pel professorat. Amb aquestes dades cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del tema treballat a la sessió de teoria. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori.
A mitjans i a final de curs els equips presentaran els seus resultats en una sessió de posada en comú on es debatrà conjuntament sobre tots els projectes.
Mètode d'avaluació
Avaluació Ordinària:
---------------------------
(Q) Qüestionaris. 20%
(P) Projecte. 40%
(EF) Examen Final. 40%
Nota Final Ordinària = 0,2 * Q + 0,4 * P + 0,4 * EF
Q. Consta de 5 qüestionaris individuals i presencials amb el mateix pes sobre la nota final.
Q = (Q1 + Q2 + Q3 + Q4 + Q5) / 5
P. Projecte en grup on es valoraran les següents competències: (P1) Recol·lecció de dades, anàlisi i interpretació de resultats (37,5%); (P2) Transmissió de resultats (25%); (P3) Comunicació oral i escrita (12,5%); (P4) Treball en equip (12,5%); (P5) Perspectiva de gènere (12,5%)
P = 0,375 * P1 + 0,25 * P2 + 0,125 * P3 + 0,125 * P4 + 0,125 * P5
S'haurà d'obtenir una nota mínima d'un 3,5 en les proves individuals i presencials, és a dir,
1/3 * Q + 2/3 * EF > 3,5 per aprovar l'assignatura. Per altra banda, la realització del projecte també serà obligatòria per poder aprovar durant l'avaluació ordinària.
Avaluació Extraordinària:
---------------------------------
(EF) Examen Final Extraordinari
Nota Extraordinària = Mínim{5, Màxim{EE, 0,2 * Q + 0,4 * P + 0,4 * EE}}
En aquesta convocatòria no hi haurà nota mínima per aprovar. La màxima nota en aquesta convocatòria és un 5.
Practical time series analysis: prediction with statistics and machine learning -
Nielsen, Aileen,
O'Reilly Media, Inc, 2019. ISBN: 9781492041658
Capacitats prèvies
Introducció a l'Estadística
Coneixements de teoria de la probabilitat
Coneixements d'inferència estadística
Coneixements de models estadístics simples
Coneixements de visualització de dades
Coneixements bàsics de programació
Coneixements bàsics d'R
Àlgebra