Processos d'Anàlisi Intel.ligent de Dades és la quarta assignatura d'una seqüència on s'han adquirit els rudiments de probabilitat, inferència estadística i model·lització estadística. Aquesta assignatura culmina la formació per portar la dada a la presa de decisions més complexes, amb l'aprofondiment en el disseny de processos integrals de incorporin dades i que utilitzin diverses formes d'intel.ligència artificial i models avançats de dades en general per a extreure valor estratègic d'aquestes, alhora que es connecten els resultats dels models de dades amb altres components dels sistemes i processos de decisió.
En aquesta assignatura les tècniques vistes en una bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intl.ligent de dades", "Aprenentatge Automàtic", "Coneixement, Raonament Automàtic i Sistemes Basats en el Coneixement" i "Tractament del llenguatge humà" es veuran com peces de processos d'anàlisi més complexos, que van des de la recollida de dades fins a la integració de models basats en dades i coneixement en sistemes integrals de suport a la presa de decisió o diferents esquemes d'integrar la IA i les dades en les decisions.
Professorat
Responsable
Karina Gibert Oliveras (
)
Sergi Ramirez Mitjans (
)
Altres
Xavier Angerri Torredeflot (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.
Bàsiques
CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
CB3 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
CB4 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia
Competències Tècniques
Específiques
CE09 - Concebre, dissenyar i integrar sistemes d'anàlisi intel·ligent de dades amb aplicació en entorns de producció i de serveis.
CE17 - Desenvolupar i avaluar sistemes interactius i de presentació d'informació complexa i la seva aplicació a la resolució de problemes de disseny d'interacció persona-ordinador i persona-robot.
CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.
Competències Tècniques Generals
Genèriques
CG1 - Concebir, redactar, organitzar, planificar i desenvolupar projectes en l'àmbit de la intel·ligència artificial.
CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
CG5 - Treballar en equips i projectes multidisciplinaris relacionats amb la intel·ligència artificial i la robòtica, interactuant fluidament amb enginyers/es i professionals d'altres disciplines.
CG7 - Interpretar i aplicar la legislació vigent, així com especificacions, reglaments i normes en l'àmbit de la intel·ligència artificial.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Objectius
Us solvent de les fonts de dades obertes disponibles en combinació amb les dades privades
Competències relacionades:
CG8,
CT6,
CT8,
CB3,
Identificar quin tipus de preprocessament necessiten unes dades reals
Competències relacionades:
CG4,
CG8,
Conèixer mètodes d'anàlisi integrat de dades i coneixement i poder-los aplicar correctament a un problema real
Competències relacionades:
CG2,
CG4,
CE18,
Donat un problema, unes dades i unes perspectives d'ús del model, saber triar el millor model a aplicar entre tots els que s'han vist a l'assignatura ia les precedents
Competències relacionades:
CG1,
CG4,
CG8,
CT4,
CT8,
CB5,
CE09,
CE18,
CE20,
Combinar els resultats dels data-driven models amb mètodes de producció de coneixement útils per a la presa de decisions posterior
Competències relacionades:
CT4,
CB2,
CE09,
CE17,
CE18,
Identificar les eines de reporting o visualització de resultats més adequades a un problema concret.
Competències relacionades:
CB4,
Integrar les eines i els models que es coneixen en el disseny d'un procés d'anàlisi intel·ligent de dades adequat a un problema concret.
Competències relacionades:
CG2,
CG3,
CG4,
CG9,
Dominar les tecnologies de posada en producció d'un procés d'anàlisi intel·ligent de dades.
Competències relacionades:
CG3,
CG7,
CG9,
CE18,
Ser conscient de la petjada digital de la IA i poder aplicar estratègies que la redueixin en un procés d'anàlisi intel·ligent de dades.
Competències relacionades:
CG2,
CG3,
CG8,
CE09,
CE18,
Integrar els processos d'anàlisi intel·ligent de dades en arquitectures de sistemes intel·ligents de suport a la presa de decisions.
Competències relacionades:
CG1,
CG3,
CG4,
CG5,
CG8,
CG9,
CT4,
CT6,
CT8,
CB2,
CE09,
CE20,
Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma
Competències relacionades:
CT6,
Entendre els principis ètics del model actual de IA i valorar si podem implantar-la al debat
Otra opción, salgo hacia madrid. la hacer online?
Competències relacionades:
CG4,
CG8,
CG9,
CT8,
CB4,
Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma i poder autoformar-se en el futur.
Competències relacionades:
CG5,
CT6,
Continguts
Introducció. La inserció de la dada en els processos de decisió reals
Esquema general d'un procés de dades (preprocessament, processament, postprocessament, interpretació, inserció en el procés de decisió)
Sistemes intel·ligents de suport a la presa de decisions
Sistemes intel·ligents de suport a la presa de decisions
Disseny de les fonts de dades rellevants per un procés de presa de decisió
Les fonts d'informació rellevants (dades, imatges, vídeos, coneixement); estàtiques/dinàmiques; dades obertes, mostrals, experimentals
Vinculació de les dades amb els objectius de l'estudi. Representativitat de les dades, biaixos i polítiques de compensació
Bones pràctiques des del disseny.
Disseny integrat del preprocessament
Construcció d'organigrames de preprocessament de dades per projectes complexos
Paper dels objectius de l'estudi i els models de dades a entrenar en els processos de preprocessament de les dades
Elecció dels mètodes de model.lització de dades del procés de suport a la decisió
-Integració del DMMCM map en el procés de selecció del mètode
- El model DMMT de representació dels mètodes basats en dades
-Relació entre els mètodes disponibles i els objectius de l'estudi
-Relació entre els mètodes disponibles i els dades disponibles
-Relació entre els mètode disponibles i l'us previst del model
Determinació dels models de coneixement
Criteris per determinar els models de representació del coneixement a integrar en el procés de decisió
(ontologies, bases de coneixement, etiquetes lingüístiques, etc)
Relació entre les components de coneixement i els models basats en dades en el procés de suport a la decisió
Representació del coneixement i explicabilitat dels models de dades
Components mixtes de dades i coneixment
Altres components del procés de decisió
Visualització
Interfície d'usuari
Modes d'interacció amb l'usuari (veu, text, etc etc)
Inserció de l'anàlisi intel.ligent de dades en processos administratius
Es treballaran casos reals relacionats amb l'administració pública, l'administració d'hospitals, de grans corporacions, etc
Inserció de l'anàlsis intel.ligent de dades en processos industrials
Es treballaran casos reals d'indústria 4.0
Inserció de l'anàlisi intel.ligent de dades en processos de negoci
Es treballaran casos reals per millorar els processos de negoci a través de la inserció de la dada i l'anàlisi intel.ligent (retailing, negociacions, etc)
Inserció de l'anàlisi intel.ligent de dades en processos de decisió estratègica
Casos reals en l'àmbit de la definició d'estratègies de negoci i d'elaboració de polítiques públiques
Consideracions ètiques i emprempta de carboni de la IA
Models ètics europeus, eines d'avaluació
Petjada de carboni de carboni de la IA, estratègies per reduir-la
Activitats
ActivitatActe avaluatiu
Introducció. La inserció de la dada en els processos de decisió reals
Disseny d'un procés intel.ligent per millorar un procés administratiu
Treball en equip sobre un cas real aplicant les tècniques vistes en el curs al disseny d'un procés d'anàlisi intel.ligent de dades per millorar un procés administratiu Objectius:10
Teoria
2h
Problemes
0h
Laboratori
7h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Disseny d'un sistema de suport a la presa de decisions per un procés de decisió estratègica
Treball en equip sobre dades reals seguint arquitectures d'IDSS vistes a classe Objectius:10
Teoria
2h
Problemes
0h
Laboratori
7h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Disseny d'un procés intel.ligent de dades per millorar un procés de negoci
En aquest cas, es tractarà d'un treball en equip per millorar un procés de negoci, però es farà focus en les petites empreses encara no tecnificades i que no disposen de dades massives ni monitorització contínua Objectius:10
Teoria
2h
Problemes
0h
Laboratori
7h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Disseny d'un sistema intel.ligent de suport a un procés industrial
Treball en equip per un procés productiu industrial altament tecnificat Objectius:10
Teoria
2h
Problemes
0h
Laboratori
7h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Consideracions ètiques i emprempta de carboni de la IA
Els 12 temes suggerits es desenvoluparan en 12 sessions de classe teòriques (2 hores per setmana) amb les seves respectives pràctiques o sessió de laboratori associat (2 hores per setmana també).
Les 3 sessions que manca de les 15 sessions per quadrimestre establertes en la FIB, s'usaran per a avaluacions teòriques (quiz o similar) i avaluacions pràctiques (defensa de treballs pràctics a meitat del quadrimestre i final del quadrimestre), recordant a més que existeix un parell de setmanes no lectives per ser setmana d'exàmens parcials i/o exàmens finals, durant les quals es poden oferir assessories, suports i orientació als estudiants com a reforç o preparació per a les seves avaluacions.
En les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Es disposa d¿una pàgina web per a l'assignatura.
En aquesta(s) plataforma(s) es publicarà la distribució temporal dels continguts de l'assignatura i els materials a portar preparats abans de cada classe.
Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe.
La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, o la realització de qüestionaris curts puntuals.
Una de les activitats de les classes de teoria del curs serà el plantejament de casos reals amb propostes de disseny del sistema intel.ligent de dades per donar suport a certes decisions i la discussió oberta a l'aula sobre els punts forts i les mancances del disseny plantejat. Aquesta activitat és fonamental per entrenar l'estudiant en dissenyar processos solvents, segurs, viables i amb pocs riscos de fallida quan parlem d'entorns reals. Del resultat del debat en derivaran les qüestions metodològiques a aclarir per part del professor.
Adicionalment, els estudiants realitzaran per grups un bon nombre de treballs pràctics curts de disseny de processos d'anàlisi intel.ligent de dades en escenaris més o menys madurs des del punt de vista tecnològic on caldrà fer tot el procés des de l'eventual recollida o identificació de les fonts de dades o coneixment fins a la comunicació de resultats i recomanacions amb l'usuari.
El cas d'anàlisi el podran proposar els propis estudiants a partir d'unes certes característiques fixades pel professorat. Cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del curs vistes per abordar el repte. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori. La proposta de disseny inclourà una prova de concepte fins on els medis de l'assignatura ho permetin sobre la proposta plantejada.
Dos cops al curs els equips presentaran les seves propostes en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes.
Els recursos de material de suport inclouen:
* Diapositives/Transparències per cada tema en format pdf o similar.
* Links per a articles, fòrums, discussions o casos pràctics en repositoris congruents i fiables per a l'assignatura.
* Vídeos o similars per a mostrar casos pràctics o temes complementaris a les classes magistrals.
* Ús de programari GNU per a la part pràctica. Es proposa l'ús de R, RStudio i plataformes similars.
* Pot usar-se ús de programari especialitzat desenvolupat per grups de recerca dins de la UPC com GESCONDA i Klass, Freeling, etc.
Mètode d'avaluació
Es proposa el següent sistema d'avaluació:
- 4 Treballs en equip realitzats al llarg del curs 80%.
Per cada treball en equip s'avalua
- Qualitat tècnica del disseny proposat i integració de coneixements que involucra (30%)
- Prova de concepte (20%)
- Prova oral de control de coneixements 10% (discussió amb el professorat en la presentació oral dels treballs en equip).
- Qualitat i rendiment de l'equip de treball. 10%.
- Comunicació oral i escrita 10%.
- Ètica de l'equip de treball i del treball pròpiament dit 10%
-Perspectiva de gènere de l'equip i del treball 10%.
-Assistència i participació en classes i laboratoris. 10%
- 2 Quiz al llarg del curs 10% (5% cadascun).
A survey on pre-processing techniques: Relevant issues in the context of environmental data -
GIBERT, Karina; SÁNCHEZ-MARRÉ, Miquel; IZQUIERDO, J,
IOS Press, 2016.
Analytics, Data Science, & Artificial Intelligence: Systems for Decision Support -
Ramesh Sharda, Dursun Delen, Efraim Turban,
11th Edition, 2020. ISBN: 978-1292341552
Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems -
KLEPPMANN, Martin,
O'Reilly, 2016. ISBN: 978-1449373320
Fundamentals of Data Engineering: Designing and Building Scalable Data Systems for Modern Applications -
MURRAY, Brian,
ISBN: 979-8391793649
Complementaria:
Exploratory multivariate analysis by example using R -
Husson, F.; Lê, S.; Pagès, J., CRC Press ,
2011.
ISBN: 9780367658021
Capacitats prèvies
En aquesta assignatura les tècniques vistes en bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intel·ligent de dades", "Aprenentatge Automàtic", "Lògica, Raonament Automàtic i "Sistemes Basats en el Coneixement" i " Tractament del llenguatge humà i percepció"