Processos d'Anàlisi Intel·ligent de Dades

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
EIO
Processos d'Anàlisi Intel.ligent de Dades és la quarta assignatura d'una seqüència on s'han adquirit els rudiments de probabilitat, inferència estadística i model·lització estadística. Aquesta assignatura culmina la formació per portar la dada a la presa de decisions més complexes, amb l'aprofondiment en el disseny de processos integrals de incorporin dades i que utilitzin diverses formes d'intel.ligència artificial i models avançats de dades en general per a extreure valor estratègic d'aquestes, alhora que es connecten els resultats dels models de dades amb altres components dels sistemes i processos de decisió.

En aquesta assignatura les tècniques vistes en una bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intl.ligent de dades", "Aprenentatge Automàtic", "Coneixement, Raonament Automàtic i Sistemes Basats en el Coneixement" i "Tractament del llenguatge humà" es veuran com peces de processos d'anàlisi més complexos, que van des de la recollida de dades fins a la integració de models basats en dades i coneixement en sistemes integrals de suport a la presa de decisió o diferents esquemes d'integrar la IA i les dades en les decisions.

Professorat

Responsable

  • Karina Gibert Oliveras ( )

Altres

  • Sergi Ramirez Mitjans ( )
  • Xavier Angerri Torredeflot ( )

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Competències Transversals

Transversals

  • CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
  • CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
  • CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.

Bàsiques

  • CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
  • CB3 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
  • CB4 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
  • CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia

Competències Tècniques

Específiques

  • CE09 - Concebre, dissenyar i integrar sistemes d'anàlisi intel·ligent de dades amb aplicació en entorns de producció i de serveis.
  • CE17 - Desenvolupar i avaluar sistemes interactius i de presentació d'informació complexa i la seva aplicació a la resolució de problemes de disseny d'interacció persona-ordinador i persona-robot.
  • CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
  • CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.

Competències Tècniques Generals

Genèriques

  • CG1 - Concebir, redactar, organitzar, planificar i desenvolupar projectes en l'àmbit de la intel·ligència artificial.
  • CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
  • CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
  • CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
  • CG5 - Treballar en equips i projectes multidisciplinaris relacionats amb la intel·ligència artificial i la robòtica, interactuant fluidament amb enginyers/es i professionals d'altres disciplines.
  • CG7 - Interpretar i aplicar la legislació vigent, així com especificacions, reglaments i normes en l'àmbit de la intel·ligència artificial.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
  • CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.

Objectius

  1. Us solvent de les fonts de dades obertes disponibles en combinació amb les dades privades
    Competències relacionades: CG8, CT6, CT8, CB3,
  2. Identificar quin tipus de preprocessament necessiten unes dades reals
    Competències relacionades: CG4, CG8,
  3. Conèixer mètodes d'anàlisi integrat de dades i coneixement i poder-los aplicar correctament a un problema real
    Competències relacionades: CG2, CG4, CE18,
  4. Donat un problema, unes dades i unes perspectives d'ús del model, saber triar el millor model a aplicar entre tots els que s'han vist a l'assignatura ia les precedents
    Competències relacionades: CG1, CG4, CG8, CT4, CT8, CB5, CE09, CE18, CE20,
  5. Combinar els resultats dels data-driven models amb mètodes de producció de coneixement útils per a la presa de decisions posterior
    Competències relacionades: CT4, CB2, CE09, CE17, CE18,
  6. Identificar les eines de reporting o visualització de resultats més adequades a un problema concret.
    Competències relacionades: CB4,
  7. Integrar les eines i els models que es coneixen en el disseny d'un procés d'anàlisi intel·ligent de dades adequat a un problema concret.
    Competències relacionades: CG2, CG3, CG4, CG9,
  8. Dominar les tecnologies de posada en producció d'un procés d'anàlisi intel·ligent de dades.
    Competències relacionades: CG3, CG7, CG9, CE18,
  9. Ser conscient de la petjada digital de la IA i poder aplicar estratègies que la redueixin en un procés d'anàlisi intel·ligent de dades.
    Competències relacionades: CG2, CG3, CG8, CE09, CE18,
  10. Integrar els processos d'anàlisi intel·ligent de dades en arquitectures de sistemes intel·ligents de suport a la presa de decisions.
    Competències relacionades: CG1, CG3, CG4, CG5, CG8, CG9, CT4, CT6, CT8, CB2, CE09, CE20,
  11. Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma
    Competències relacionades: CT6,
  12. Entendre els principis ètics del model actual de IA i valorar si podem implantar-la al debat.
    Competències relacionades: CG4, CG8, CG9, CT8, CB4,
  13. Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma i poder autoformar-se en el futur.
    Competències relacionades: CG5, CT6,

Continguts

  1. Introducció. La inserció de la dada en els processos de decisió reals
    Introducció a la teoria de la decisió i els processos de suport a la presa de decisions reals
  2. Sistemes intel·ligents de suport a la presa de decisions
    Sistemes intel·ligents de suport a la presa de decisions. Arquitectura de propòsit general per IDSS
  3. Sistemes intel·ligents de suport a la presa de decisions
    Sistemes intel·ligents de suport a la presa de decisions
  4. Disseny de les fonts de dades rellevants per un procés de presa de decisió
    Les fonts d'informació rellevants (dades, imatges, vídeos, coneixement); estàtiques/dinàmiques; on-line/off-line; dades obertes, mostrals, experimentals. Dades primàries/secundàries
    Vinculació de les dades amb els objectius de l'estudi. Representativitat de les dades, biaixos i polítiques de compensació
    Bones pràctiques des del disseny.
  5. Disseny integrat del preprocessament
    Construcció d'organigrames de preprocessament de dades per projectes complexos
    Paper dels objectius de l'estudi i els models de dades a entrenar en els processos de preprocessament de les dades
  6. Identificació automática dels mètodes de model.lització de dades del procés de suport a la decisió
    -Integració del DMMCM map en el procés de selecció del mètode
    - El model DMMT de representació dels mètodes basats en dades
    -Relació entre els mètodes disponibles i els objectius de l'estudi
    -Relació entre els mètodes disponibles i els dades disponibles
    -Relació entre els mètode disponibles i l'us previst del model
    -Relació entre diferents mètodes data-driven
  7. Criteris de determinació dels models de coneixement
    Criteris per determinar els models de representació del coneixement a integrar en el procés de decisió
    (ontologies, bases de coneixement, etiquetes lingüístiques, etc)
    Relació entre les components de coneixement/raonament i els models basats en dades en el procés de suport a la decisió
  8. Els models mixtes de IA basats en dades/coneixement en els IDSS
    Models mixtes de dades i coneixement. Sistemes hybrids d'Intel.ligència Artificial.
  9. Impacte del disseny d¿interfícies en el IDSS
    Inputs del IDSS, percepció, representació del coneixement en els inputs del sistema, accessos (rols, autenticació, permisos), escletxa digital, modes d¿interacció amb l¿usuari (veu, formularis, xatbots, etc). Bones practiques en el disseny de menús, accessibilitat, sistemes multilingües. Connexions amb dades (llacs, APIS, SQL, scrapping¿).
    Outputs: aplicacions de la visualització de dades a un IDSS, explicabilitat i argumentació, recomanadors, reporting automàtic, comunicación de mètriques i KPIS, retiment de comptes (registres), rol del sistema (agencia , assitència/automatització).
    Validació d'un IDSS
  10. Inserció de l'anàlisi intel.ligent de dades en processos real
    Sistemes de salut i benestar
    Negoci (retailing, negociacions¿)
    Processos administratius: administració pública, l'administració d'hospitals, de grans corporacions, etc
    Indústria 4.0
    Decisió estrat`gica (estratègies de negoci o elaboración de polítiques públiques)
    Sostenibilitat (biodiversitat, emprempta de carboni, etc)

Activitats

Activitat Acte avaluatiu


Introducció a les pràctiques i formació dels equips de treball



Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Introducció. La inserció de la dada en els processos de decisió reals


Objectius: 2
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
2h

Generació del Canvas AI d'un cas real

Un cop triat el tema de la prática definir el projecte d'Intel·ligència Artifial que es pot definir utilitzant la metodologia CANVAS-AI
Objectius: 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Sistemes intel.ligents de suport a la presa de decisions

Dissenyar l'arquitectura del sistema
Objectius: 2 3 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Disseny de les fonts de dades rellevants per un procés de presa de decisió


Objectius: 1 5
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Disseny integrat del preprocessament


Objectius: 6 7 8
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Elecció dels mètodes de model.lització de dades del procés de suport a la decisió


Objectius: 2 3 4
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Determinació dels models de coneixement


Objectius: 2 4 5 6 8
Continguts:
Teoria
2h
Problemes
0h
Laboratori
1.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Altres components del procés de decisió i integració


Objectius: 10 11 13
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Presentació intermèdia dels treballs pràctics


Objectius: 10
Setmana: 8 (Fora d'horari lectiu)
Teoria
3h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Model d'usuari i interfícies d'entrada en IDSS


Objectius: 1 7 8
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Disseny dels outputs del IDSS i explicabilitat dels models


Objectius: 5 6 7
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Validació global i pla de posta en producció del IDSS


Objectius: 3 5 7 8
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Consideracions ètiques i emprempta de carboni de la IA


Objectius: 9 12
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Presentacions finals de les pràctiques



Teoria
3h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
8h

Presentació d'apllicacions reals de IDSS



Teoria
0h
Problemes
0h
Laboratori
3h
Aprenentatge dirigit
0h
Aprenentatge autònom
2h

Metodologia docent

Els 12 temes suggerits es desenvoluparan en 12 sessions de classe teòriques (2 hores per setmana) amb les seves respectives pràctiques o sessió de laboratori associat (2 hores per setmana també).

Les 3 sessions que manca de les 15 sessions per quadrimestre establertes en la FIB, s'usaran per a avaluacions teòriques (quiz o similar) i avaluacions pràctiques (defensa de treballs pràctics a meitat del quadrimestre i final del quadrimestre), recordant a més que existeix un parell de setmanes no lectives per ser setmana d'exàmens parcials i/o exàmens finals, durant les quals es poden oferir assessories, suports i orientació als estudiants com a reforç o preparació per a les seves avaluacions.

En les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Es disposa d¿una pàgina web per a l'assignatura.
En aquesta(s) plataforma(s) es publicarà la distribució temporal dels continguts de l'assignatura i els materials a portar preparats abans de cada classe.
Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe.
La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, o la realització de qüestionaris curts puntuals.
Una de les activitats de les classes de teoria del curs serà el plantejament de casos reals amb propostes de disseny del sistema intel.ligent de dades per donar suport a certes decisions i la discussió oberta a l'aula sobre els punts forts i les mancances del disseny plantejat. Aquesta activitat és fonamental per entrenar l'estudiant en dissenyar processos solvents, segurs, viables i amb pocs riscos de fallida quan parlem d'entorns reals. Del resultat del debat en derivaran les qüestions metodològiques a aclarir per part del professor.

Adicionalment, els estudiants realitzaran per grups un bon nombre de treballs pràctics curts de disseny de processos d'anàlisi intel.ligent de dades en escenaris més o menys madurs des del punt de vista tecnològic on caldrà fer tot el procés des de l'eventual recollida o identificació de les fonts de dades o coneixment fins a la comunicació de resultats i recomanacions amb l'usuari.
El cas d'anàlisi el podran proposar els propis estudiants a partir d'unes certes característiques fixades pel professorat. Cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del curs vistes per abordar el repte. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori. La proposta de disseny inclourà una prova de concepte fins on els medis de l'assignatura ho permetin sobre la proposta plantejada.

Dos cops al curs els equips presentaran les seves propostes en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes.


Els recursos de material de suport inclouen:
* Diapositives/Transparències per cada tema en format pdf o similar.
* Links per a articles, fòrums, discussions o casos pràctics en repositoris congruents i fiables per a l'assignatura.
* Vídeos o similars per a mostrar casos pràctics o temes complementaris a les classes magistrals.
* Ús de programari GNU per a la part pràctica. Es proposa l'ús de R, RStudio i plataformes similars.
* Pot usar-se ús de programari especialitzat desenvolupat per grups de recerca dins de la UPC com GESCONDA i Klass, Freeling, etc.

Mètode d'avaluació

Es proposa el següent sistema d'avaluació:
- 4 Treballs en equip realitzats al llarg del curs 80%.

Per cada treball en equip s'avalua
- Qualitat tècnica del disseny proposat i integració de coneixements que involucra (30%)
- Prova de concepte (20%)
- Prova oral de control de coneixements 10% (discussió amb el professorat en la presentació oral dels treballs en equip).
- Qualitat i rendiment de l'equip de treball. 10%.
- Comunicació oral i escrita 10%.
- Ètica de l'equip de treball i del treball pròpiament dit 10%
-Perspectiva de gènere de l'equip i del treball 10%.


-Assistència i participació en classes i laboratoris. 10%
- 2 Quiz al llarg del curs 10% (5% cadascun).

Reavaluació: només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final l'hagin suspès. La nota màxima que es pot obtenir a la reavaluació és un 7.

Bibliografia

Bàsica:

Complementaria:

  • Exploratory multivariate analysis by example using R - Husson, F.; Lê, S.; Pagès, J., CRC Press , 2011. ISBN: 9780367658021

Capacitats prèvies

En aquesta assignatura les tècniques vistes en bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intel·ligent de dades", "Aprenentatge Automàtic", "Lògica, Raonament Automàtic i "Sistemes Basats en el Coneixement" i " Tractament del llenguatge humà i percepció"