L'estadística és la ciència d'extracció d'informació a partir de dades més antiga de totes i durant dècades s'ha utilitzat per comprendre la realitat i extreure'n models que permetin conèixer-la millor, fer-ne prediccions i aportar elements de descripció de la realitat útils en la presa de decisions, especialment aquelles que fan referència a situacions d'alts nivells de complexitat.
Aquesta assignatura senta bases metodològics d'àmplia utilitat en l'observació de la realitat i la presa de decisions informada i prepara també per abordar models més complexos que es presenten en assignatures posteriors.
Els mètodes estadístics juguen un paper nuclear en molts dels mètodes d'intel.ligència artificial o anàlisi intel.ligent de dades que es veuran en assignatures posteriors. Per aquest motiu aquesta assignatura sentarà bases formals per poder seguir adequadament assignatures posteriors, a més de capacitar per a la resolució de problemes reals abordables amb estadística bàsica. Així, s'introduiran els principis estadístics bàsics des de la perspectiva del suport que poden aportar a l'anàlisi de problemes on intervé la intel.ligència artificial.
Aquesta assignatura aporta eines bàsiques per al tractament de dades, criteris d'elecció de mostres o construcció d'experiments per a constatar hipòtesis concretes a través de les dades en aplicacions reals, tests i proves d'hipòtesis associades a inferència estadística sobre dades i necessàries en statistical learning entre d'altres, models estadístics bàsics que es completaran amb l'assignatura següent de modelització estadística i que seran utilitzats a anàlisi intel.ligent de dades i a aprenentatge automàtic entre d'altres assignatures de la carrera.
L'assignatura tindrà un caràcter eminenment aplicat i posarà el focus en la resolució de problemes reals de l'àmbit de la IA utilitzant mètodes estadístics bàsics.
Professorat
Responsable
Klaus Gerhard Langohr (
)
Mireia Besalú Mayol (
)
Altres
Albert Solà Vilalta (
)
Xavier Angerri Torredeflot (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT3 [Avaluable] - Comunicació eficaç oral i escrita. Comunicar-se de forma oral i escrita amb altres persones sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions; participar en debats sobre temes de la pròpia especialitat.
CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.
Competències Tècniques
Específiques
CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.
Competències Tècniques Generals
Genèriques
CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
Objectius
Familiaritzar-se amb les eines d'estadística bàsica per poder tractar dades de forma correcta i interioritzar la metodologia estadística com un esquema bàsic d'extracció d'informació rellevant sobre fenòmens complexos
Competències relacionades:
CG4,
CE01,
CE02,
Subcompetences:
Interioritzar la metodologia estadística
Tractar dades correctament
Aplicar la metodologia estadística per extreure coneixement de fenòmens complexos
Seleccionar les dades rellevants per donar suport a una pregunta específica
Competències relacionades:
CG8,
CT8,
CE01,
Dissenyar els criteris d'elegibilitat d'una mostra correctament per respondre a un problema real
Competències relacionades:
CT8,
CE02,
Realitzar preprocessament bàsic de les dades
Competències relacionades:
CG4,
CE02,
Seleccionar els mètodes de modelització estadística més adecuats al problema, a la vista de l'estructura de les dades disponibles, els objectius de l'estudi i els usos posteriors dels resultats del model
Competències relacionades:
CG4,
CE01,
CE02,
Construir els models estadístics correctament a partir de les dades, fent us del software necessari, el context del problema de referència i presentar-lo públicament
Competències relacionades:
CG4,
CE01,
CE02,
Aplicar de forma integrada els coneixements estadístics obtinguts a classe en l'anàlisi d'un joc de dades real (aprofitant les fonts d'open data) donant resposta a un problema de referència de qualsevol àmbit real rellevant per la intel.ligència artificial, com salut, medi ambient, sostenibilitat, indústria4.0
Competències relacionades:
CG4,
CE01,
CE02,
Subcompetences:
Aprofitar open data rellevants per un problema
Analitzar jocs de dades reals (salut, mediambient, ...)
Integrar de coneixements estadístics de diferents temes de l'assignatura per solucionar un problema complex
Desenvolupar treballs pràctics i projectes amb perspectiva de gènere
Competències relacionades:
CT8,
Integrar els mecanismes de treball en equip en la realització dels treballs pràctics
Competències relacionades:
CT4,
Manegar amb destresa les eines informàtiques necessàries per resoldre els problemes reals plantejats amb les tècniques d'estadística bàsica vistes durant el curs.
Competències relacionades:
CE02,
Interpretar i contextualitzar els models estadístics construïts a partir de dades
Competències relacionades:
CG4,
CT3,
CT8,
Incorporar les recomanacions ètiques de la CE en matèria d'IA als treballs pràctics
Competències relacionades:
CG8,
Validar els models obtinguts i fer una interpretació crítica dels resultats des d'un punt de vista tècnic i contextualitzant els resultats en el marc del problema
Competències relacionades:
CG4,
CG8,
CE02,
Realitzar un informe automàtic amb la descriptiva d'una Base de dades, els models validats, i l'anàlisi integrada i crítica dels resultats en el context del problema de referència
Competències relacionades:
CG4,
CG8,
CT3,
CT4,
CT8,
Presentar públicament un informe estadístic que inclogui descriptiva, models i conclusions, comunicat adequadament a audiències tècniques i/o sense competències tècniques
Competències relacionades:
CG8,
CT3,
CT4,
CT8,
Continguts
Anàlisi descriptiva de les dades
Es treballarà com utilitzar eines estadístiques numèriques i gràfiques per descriure un conjunt de dades, així com les eines de reporting automàtic necessàries per realitzar informes automàtics amb aquesta descripció
Introducció a la teoria de la probabilitat
S'aportaran les nocions bàsiques de probabilitat per a comprendre el concepte d'incertesa i els principals formalismes probabilístics per modelar-la, incloent conceptes de probabilitat condicionada i el teorema de Bayes, rellevant en assignatures posteriors
Variables aleatòries
Definició de variable aleatòria discreta i contínua. Variables aleatòries conegudes: Bernoulli, Binomial, Poisson i Normal
Inferència estadística
Proves d'hipòtesi, concepte de p-valor, intervals de confiança. Limitacions en aplicacions reals de la inferència clàssica. Inferència no paramètrica, test de permutacions de Fisher. Proves d'hipòtesi en statistical learning
Regressió
Model bàsic (regressió lineal simple, mean least squares). Mesures de bondat de l'ajustament, validació. Regressió lineal múltple. Model lineal general (ANOVA, ANCOVA)
Activitats
ActivitatActe avaluatiu
Treball en equip
Els alumnes s'organitzen en grups i busquen unes dades reals que compleixen certs requisits marcats pel professor
Les utilitzen per anar aplicant les tècniques i metodologies que es vegin al llarg del curs. Al final presenten un informe amb els resultats i fan una presentació oral amb els resultats més rellevants de l'estudi Objectius:810 Continguts:
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:111926534 Setmana:
5
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Prova 2
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori Objectius:810126714 Setmana:
12
Teoria
0h
Problemes
0h
Laboratori
0.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Presentació inicial de la pràctica
Presentació inicial de la pràctica Objectius:91315 Continguts:
L'assignatura consta de dues hores de teoria i dues de laboratori per setmana
En les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Al web de l'assignatura hi haurà el calendari de l'assignatura i els materials a portar preparats abans de cada classe. Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe. La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, el desenvolupament de problemes o la realització de qüestionaris curts puntuals.
Els estudiants realitzaran per grups grans un treball pràctic amb dades que buscaran ells mateixos i que compliran certes característiques fixades pel professorat. Amb aquestes dades cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del tema treballat a la sessió de teoria. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori
Al final de curs els equips presentaran els seus resultats en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes
Mètode d'avaluació
Ítems que formen part de la nota:
(T) Treball en equip fet al llarg del curs. 20%
(O) Prova oral de control de coneixements (discussió amb el professorat en la presentació oral dels treballs en equip). 10%
(CT4) Qualitat i rendiment de l'equip de treball. 5%
(CT3) Comunicació oral i escrita. 5%
(CT8) Perspectiva de gènere de l'equip i del treball. 5%
(E) Ètica de l'equip de treball i del treball pròpiament dit. 5%
(Q) Mitjana de dues proves individuals i presencials fetes al llarg del curs. 20%
(EF) Examen final presencial. 30%
Nota Projecte: P= 0.2*T+0.1*O + 0.05*CT4+ 0.05*CT3+ 0.05*CT8+ 0.05*E
Nota final= P+ 0.2*Q + 0.3*EF
Cal que 1/3*Q+2/3*EF sigui com a mínim 3.5.
_________________________________________________________________
(EE) Examen Final Extraordinari
Nota reavaluació = mín (7, màx(EE, P+ 0.2*Q + 0.3*EE)). La nota màxima de la reavaluació serà un 7.
Per l'examen final extraordinari no hi ha nota mínima. Només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final l'hagin suspès.
Practical statistics for data scientists : 50+ essential concepts using R and Python -
Bruce, Peter; Bruce, Andrew; Gedeck, Peter,
O'Reilly Media, Inc, 2020. ISBN: 9781492072942
A modern introduction to probability and statistics: understanding why and how -
Dekking, F.M; Kraaikamp, C.; Lopuhaä, H.P,
Springer, 2005. ISBN: 9781846281686