Introducció a l'Estadística

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
EIO
L'estadística és la ciència d'extracció d'informació a partir de dades més antiga de totes i durant dècades s'ha utilitzat per comprendre la realitat i extreure'n models que permetin conèixer-la millor, fer-ne prediccions i aportar elements de descripció de la realitat útils en la presa de decisions, especialment aquelles que fan referència a situacions d'alts nivells de complexitat.

Aquesta assignatura senta bases metodològics d'àmplia utilitat en l'observació de la realitat i la presa de decisions informada i prepara també per abordar models més complexos que es presenten en assignatures posteriors.
Els mètodes estadístics juguen un paper nuclear en molts dels mètodes d'intel.ligència artificial o anàlisi intel.ligent de dades que es veuran en assignatures posteriors. Per aquest motiu aquesta assignatura sentarà bases formals per poder seguir adequadament assignatures posteriors, a més de capacitar per a la resolució de problemes reals abordables amb estadística bàsica. Així, s'introduiran els principis estadístics bàsics des de la perspectiva del suport que poden aportar a l'anàlisi de problemes on intervé la intel.ligència artificial.


Aquesta assignatura aporta eines bàsiques per al tractament de dades, criteris d'elecció de mostres o construcció d'experiments per a constatar hipòtesis concretes a través de les dades en aplicacions reals, tests i proves d'hipòtesis associades a inferència estadística sobre dades i necessàries en statistical learning entre d'altres, models estadístics bàsics que es completaran amb l'assignatura següent de modelització estadística i que seran utilitzats a anàlisi intel.ligent de dades i a aprenentatge automàtic entre d'altres assignatures de la carrera.

L'assignatura tindrà un caràcter eminenment aplicat i posarà el focus en la resolució de problemes reals de l'àmbit de la IA utilitzant mètodes estadístics bàsics.

Professorat

Responsable

  • Karina Gibert Oliveras ( )

Altres

  • Dante Conti ( )
  • Sergi Ramirez Mitjans ( )
  • Xavier Angerri Torredeflot ( )

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Competències Transversals

Transversals

  • CT3 [Avaluable] - Comunicació eficaç oral i escrita. Comunicar-se de forma oral i escrita amb altres persones sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions; participar en debats sobre temes de la pròpia especialitat.
  • CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
  • CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.

Competències Tècniques

Específiques

  • CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
  • CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.

Competències Tècniques Generals

Genèriques

  • CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.

Objectius

  1. Familiaritzar-se amb les eines d'estadística bàsica per poder tractar dades de forma correcta i interioritzar la metodologia estadística com un esquema bàsic d'extracció d'informació rellevant sobre fenòmens complexos
    Competències relacionades: CG4, CE01, CE02,
    Subcompetences:
    • Interioritzar la metodologia estadística
    • Tractar dades correctament
    • Aplicar la metodologia estadística per extreure coneixement de fenòmens complexos
  2. Seleccionar les dades rellevants per donar suport a una pregunta específica
    Competències relacionades: CG8, CT8, CE01,
  3. Dissenyar els criteris d'elegibilitat d'una mostra correctament per respondre a un problema real
    Competències relacionades: CT8, CE02,
  4. Dissenyar experiments bàsics per estudiar problemes reals
    Competències relacionades: CT8, CE01,
  5. Realitzar preprocessament bàsic de les dades
    Competències relacionades: CG4, CE02,
  6. Seleccionar els mètodes de modelització estadística més adecuats al problema, a la vista de l'estructura de les dades disponibles, els objectius de l'estudi i els usos posteriors dels resultats del model
    Competències relacionades: CG4, CE01, CE02,
  7. Construir els models estadístics correctament a partir de les dades, fent us del software necessari, el context del problema de referència i presentar-lo públicament
    Competències relacionades: CG4, CE01, CE02,
  8. Aplicar de forma integrada els coneixements estadístics obtinguts a classe en l'anàlisi d'un joc de dades real (aprofitant les fonts d'open data) donant resposta a un problema de referència de qualsevol àmbit real rellevant per la intel.ligència artificial, com salut, medi ambient, sostenibilitat, indústria4.0
    Competències relacionades: CG4, CE01, CE02,
    Subcompetences:
    • Aprofitar open data rellevants per un problema
    • Analitzar jocs de dades reals (salut, mediambient, ...)
    • Integrar de coneixements estadístics de diferents temes de l'assignatura per solucionar un problema complex
  9. Desenvolupar treballs pràctics i projectes amb perspectiva de gènere
    Competències relacionades: CT8,
  10. Integrar els mecanismes de treball en equip en la realització dels treballs pràctics
    Competències relacionades: CT4,
  11. Manegar amb destresa les eines informàtiques necessàries per resoldre els problemes reals plantejats amb les tècniques d'estadística bàsica vistes durant el curs.
    Competències relacionades: CE02,
  12. Interpretar i contextualitzar els models estadístics construïts a partir de dades
    Competències relacionades: CG4, CT3, CT8,
  13. Incorporar les recomanacions ètiques de la CE en matèria d'IA als treballs pràctics
    Competències relacionades: CG8,
  14. Validar els models obtinguts i fer una interpretació crítica dels resultats des d'un punt de vista tècnic i contextualitzant els resultats en el marc del problema
    Competències relacionades: CG4, CG8, CE02,
  15. Realitzar un informe automàtic amb la descriptiva d'una Base de dades, els models validats, i l'anàlisi integrada i crítica dels resultats en el context del problema de referència
    Competències relacionades: CG4, CG8, CT3, CT4, CT8,
  16. Presentar públicament un informe estadístic que inclogui descriptiva, models i conclusions, comunicat adequadament a audiències tècniques i/o sense competències tècniques
    Competències relacionades: CG8, CT3, CT4, CT8,

Continguts

  1. Anàlisi descriptiva de les dades
    Es treballarà com utilitzar eines estadístiques numèriques i gràfiques per descriure un conjunt de dades, així com les eines de reporting automàtic necessàries per realitzar informes automàtics amb aquesta descripció
  2. Introducció a la teoria de la probabilitat
    S'aportaran les nocions bàsiques de probabilitat per a comprendre el concepte d'incertesa i els principals formalismes probabilístics per modelar-la, incloent conceptes de probabilitat condicionada i el teorema de Bayes, rellevant en assignatures posteriors
  3. Introducció a la teoria del mostreig
    concepte de mostra aleatòria simple, teoria del mostreig, tipus de mostreig
  4. Inferència estadística
    proves d'hipòtesi, concepte de p-valor, intervals de confiança. Limitacions en aplicacions reals de la inferència clàssica. Inferència no paramètrica, test de permutacions de Fisher. Proves d'hipòtesi en statistical learning
  5. Introducció al disseny d'experiments
    diferències entre estudis mostrals i experimentals. El disseny d'experiments en la validació de software. Biaixos i escalabilitat
  6. Regressió
    Model bàsic (regressió lineal simple, mean least squares). Mesures de bondat de l'ajustament, validació. Regressió lineal múltple. Model lineal general (ANOVA, ANCOVA)

Activitats

Activitat Acte avaluatiu


Treball en equip

Els alumnes s'organitzen en grups i busquen unes dades reals que compleixen certs requisits marcats pel professor Les utilitzen per anar aplicant les tècniques i metodologies que es vegin al llarg del curs. Al final presenten un informe amb els resultats i fan una presentació oral amb els resultats més rellevants de l'estudi
Objectius: 8 10
Continguts:
Teoria
0h
Problemes
0h
Laboratori
27h
Aprenentatge dirigit
0h
Aprenentatge autònom
50h

quiz 1

Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori
Objectius: 1 11 9 2 6 5 3 4
Setmana: 3
Tipus: examen de laboratori
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Quiz 2

Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratori
Objectius: 8 10 12 6 7 14
Setmana: 12
Tipus: examen de laboratori
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Presentació inicial de la pràctica

Presentació inicial de la pràctica
Objectius: 9 13 15
Continguts:
Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Presentació final pràctica

Presentació final pràctica
Objectius: 8 10 11 9 13 15 16 12 7 14
Setmana: 16 (Fora d'horari lectiu)
Tipus: examen final
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
3h
Aprenentatge autònom
0h

classes de teoria del temari de l'assignatura

classes de teoria del temari de l'assignatura
Objectius: 1
Continguts:
Teoria
30h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
30h

Metodologia docent

L'assignatura consta de dues hores de teoria i dues de laboratori per setmana
En les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Al web de l'assignatura hi haurà el calendari de l'assignatura i els materials a portar preparats abans de cada classe. Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe. La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, el desenvolupament de problemes o la realització de qüestionaris curts puntuals.
Els estudiants realitzaran per grups grans un treball pràctic amb dades que buscaran ells mateixos i que compliran certes característiques fixades pel professorat. Amb aquestes dades cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del tema treballat a la sessió de teoria. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori

Al final de curs els equips presentaran els seus resultats en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes

Mètode d'avaluació

(T) Treball en equip realitzat al llarg del curs 20%
(O) Prova oral de control de coneixements 10% (discussio amb el professorat en la presentació oral dels treballs en equip)
(CT4) Qualitat i rendiment de l'equip de treball (TG). 10%
(CT3) Comunicació oral i escrita 10%
(CT8) Perspectiva de gènere de l'equip i del treball 10%
(E) Ètica de l'equip de treball i del treball pròpiament dit 10%
(A) Assistència i participació en classes i laboratoris (AP). 10%
(Q) 2 Quiz al llarg del curs 20%

N= 0,2*T+0,1*O+0,1*CT4+0,1*CT3+0,1*E+0,1*CT8+0,1*A+0,2*Q

Q=0,5*Q1+0,5*Q2

Bibliografia

Bàsica:

Capacitats prèvies

Coneixements matemàtics de batxillerat