Processos d'Anàlisi Intel.ligent de Dades és la quarta assignatura d'una seqüència on s'han adquirit els rudiments de probabilitat, inferència estadística i model·lització estadística. Aquesta assignatura culmina la formació per portar la dada a la presa de decisions més complexes, amb l'aprofondiment en el disseny de processos integrals de incorporin dades i que utilitzin diverses formes d'intel.ligència artificial i models avançats de dades en general per a extreure valor estratègic d'aquestes, alhora que es connecten els resultats dels models de dades amb altres components dels sistemes i processos de decisió.
En aquesta assignatura les tècniques vistes en una bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intl.ligent de dades", "Aprenentatge Automàtic", "Coneixement, Raonament Automàtic i Sistemes Basats en el Coneixement" i "Tractament del llenguatge humà" es veuran com peces de processos d'anàlisi més complexos, que van des de la recollida de dades fins a la integració de models basats en dades i coneixement en sistemes integrals de suport a la presa de decisió o diferents esquemes d'integrar la IA i les dades en les decisions.
Professorat
Responsable
Karina Gibert Oliveras (
)
Altres
Sergi Ramirez Mitjans (
)
Xavier Angerri Torredeflot (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
CT8 [Avaluable] - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.
Bàsiques
CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
CB3 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
CB4 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia
Competències Tècniques
Específiques
CE09 - Concebre, dissenyar i integrar sistemes d'anàlisi intel·ligent de dades amb aplicació en entorns de producció i de serveis.
CE17 - Desenvolupar i avaluar sistemes interactius i de presentació d'informació complexa i la seva aplicació a la resolució de problemes de disseny d'interacció persona-ordinador i persona-robot.
CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.
Competències Tècniques Generals
Genèriques
CG1 - Concebir, redactar, organitzar, planificar i desenvolupar projectes en l'àmbit de la intel·ligència artificial.
CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
CG5 - Treballar en equips i projectes multidisciplinaris relacionats amb la intel·ligència artificial i la robòtica, interactuant fluidament amb enginyers/es i professionals d'altres disciplines.
CG7 - Interpretar i aplicar la legislació vigent, així com especificacions, reglaments i normes en l'àmbit de la intel·ligència artificial.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Objectius
Us solvent de les fonts de dades obertes disponibles en combinació amb les dades privades
Competències relacionades:
CG8,
CT6,
CT8,
CB3,
Identificar quin tipus de preprocessament necessiten unes dades reals
Competències relacionades:
CG4,
CG8,
Conèixer mètodes d'anàlisi integrat de dades i coneixement i poder-los aplicar correctament a un problema real
Competències relacionades:
CG2,
CG4,
CE18,
Donat un problema, unes dades i unes perspectives d'ús del model, saber triar el millor model a aplicar entre tots els que s'han vist a l'assignatura ia les precedents
Competències relacionades:
CG1,
CG4,
CG8,
CT4,
CT8,
CB5,
CE09,
CE18,
CE20,
Combinar els resultats dels data-driven models amb mètodes de producció de coneixement útils per a la presa de decisions posterior
Competències relacionades:
CT4,
CB2,
CE09,
CE17,
CE18,
Identificar les eines de reporting o visualització de resultats més adequades a un problema concret.
Competències relacionades:
CB4,
Integrar les eines i els models que es coneixen en el disseny d'un procés d'anàlisi intel·ligent de dades adequat a un problema concret.
Competències relacionades:
CG2,
CG3,
CG4,
CG9,
Dominar les tecnologies de posada en producció d'un procés d'anàlisi intel·ligent de dades.
Competències relacionades:
CG3,
CG7,
CG9,
CE18,
Ser conscient de la petjada digital de la IA i poder aplicar estratègies que la redueixin en un procés d'anàlisi intel·ligent de dades.
Competències relacionades:
CG2,
CG3,
CG8,
CE09,
CE18,
Integrar els processos d'anàlisi intel·ligent de dades en arquitectures de sistemes intel·ligents de suport a la presa de decisions.
Competències relacionades:
CG1,
CG3,
CG4,
CG5,
CG8,
CG9,
CT4,
CT6,
CT8,
CB2,
CE09,
CE20,
Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma
Competències relacionades:
CT6,
Entendre els principis ètics del model actual de IA i valorar si podem implantar-la al debat.
Competències relacionades:
CG4,
CG8,
CG9,
CT8,
CB4,
Ser capaç de documentar-se sobre nous mètodes o tecnologies de manera autònoma i poder autoformar-se en el futur.
Competències relacionades:
CG5,
CT6,
Continguts
Introducció. La inserció de la dada en els processos de decisió reals
Introducció a la teoria de la decisió i els processos de suport a la presa de decisions reals
Sistemes intel·ligents de suport a la presa de decisions
Sistemes intel·ligents de suport a la presa de decisions. Arquitectura de propòsit general per IDSS
Sistemes intel·ligents de suport a la presa de decisions
Sistemes intel·ligents de suport a la presa de decisions
Disseny de les fonts de dades rellevants per un procés de presa de decisió
Les fonts d'informació rellevants (dades, imatges, vídeos, coneixement); estàtiques/dinàmiques; on-line/off-line; dades obertes, mostrals, experimentals. Dades primàries/secundàries
Vinculació de les dades amb els objectius de l'estudi. Representativitat de les dades, biaixos i polítiques de compensació
Bones pràctiques des del disseny.
Disseny integrat del preprocessament
Construcció d'organigrames de preprocessament de dades per projectes complexos
Paper dels objectius de l'estudi i els models de dades a entrenar en els processos de preprocessament de les dades
Identificació automática dels mètodes de model.lització de dades del procés de suport a la decisió
-Integració del DMMCM map en el procés de selecció del mètode
- El model DMMT de representació dels mètodes basats en dades
-Relació entre els mètodes disponibles i els objectius de l'estudi
-Relació entre els mètodes disponibles i els dades disponibles
-Relació entre els mètode disponibles i l'us previst del model
-Relació entre diferents mètodes data-driven
Criteris de determinació dels models de coneixement
Criteris per determinar els models de representació del coneixement a integrar en el procés de decisió
(ontologies, bases de coneixement, etiquetes lingüístiques, etc)
Relació entre les components de coneixement/raonament i els models basats en dades en el procés de suport a la decisió
Els models mixtes de IA basats en dades/coneixement en els IDSS
Models mixtes de dades i coneixement. Sistemes hybrids d'Intel.ligència Artificial.
Impacte del disseny d¿interfícies en el IDSS
Inputs del IDSS, percepció, representació del coneixement en els inputs del sistema, accessos (rols, autenticació, permisos), escletxa digital, modes d¿interacció amb l¿usuari (veu, formularis, xatbots, etc). Bones practiques en el disseny de menús, accessibilitat, sistemes multilingües. Connexions amb dades (llacs, APIS, SQL, scrapping¿).
Outputs: aplicacions de la visualització de dades a un IDSS, explicabilitat i argumentació, recomanadors, reporting automàtic, comunicación de mètriques i KPIS, retiment de comptes (registres), rol del sistema (agencia , assitència/automatització).
Validació d'un IDSS
Inserció de l'anàlisi intel.ligent de dades en processos real
Sistemes de salut i benestar
Negoci (retailing, negociacions¿)
Processos administratius: administració pública, l'administració d'hospitals, de grans corporacions, etc
Indústria 4.0
Decisió estrat`gica (estratègies de negoci o elaboración de polítiques públiques)
Sostenibilitat (biodiversitat, emprempta de carboni, etc)
Activitats
ActivitatActe avaluatiu
Introducció a les pràctiques i formació dels equips de treball
Teoria
0h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Introducció. La inserció de la dada en els processos de decisió reals
Un cop triat el tema de la prática definir el projecte d'Intel·ligència Artifial que es pot definir utilitzant la metodologia CANVAS-AI Objectius:4 Continguts:
Els 12 temes suggerits es desenvoluparan en 12 sessions de classe teòriques (2 hores per setmana) amb les seves respectives pràctiques o sessió de laboratori associat (2 hores per setmana també).
Les 3 sessions que manca de les 15 sessions per quadrimestre establertes en la FIB, s'usaran per a avaluacions teòriques (quiz o similar) i avaluacions pràctiques (defensa de treballs pràctics a meitat del quadrimestre i final del quadrimestre), recordant a més que existeix un parell de setmanes no lectives per ser setmana d'exàmens parcials i/o exàmens finals, durant les quals es poden oferir assessories, suports i orientació als estudiants com a reforç o preparació per a les seves avaluacions.
En les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Es disposa d¿una pàgina web per a l'assignatura.
En aquesta(s) plataforma(s) es publicarà la distribució temporal dels continguts de l'assignatura i els materials a portar preparats abans de cada classe.
Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe.
La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, o la realització de qüestionaris curts puntuals.
Una de les activitats de les classes de teoria del curs serà el plantejament de casos reals amb propostes de disseny del sistema intel.ligent de dades per donar suport a certes decisions i la discussió oberta a l'aula sobre els punts forts i les mancances del disseny plantejat. Aquesta activitat és fonamental per entrenar l'estudiant en dissenyar processos solvents, segurs, viables i amb pocs riscos de fallida quan parlem d'entorns reals. Del resultat del debat en derivaran les qüestions metodològiques a aclarir per part del professor.
Adicionalment, els estudiants realitzaran per grups un bon nombre de treballs pràctics curts de disseny de processos d'anàlisi intel.ligent de dades en escenaris més o menys madurs des del punt de vista tecnològic on caldrà fer tot el procés des de l'eventual recollida o identificació de les fonts de dades o coneixment fins a la comunicació de resultats i recomanacions amb l'usuari.
El cas d'anàlisi el podran proposar els propis estudiants a partir d'unes certes característiques fixades pel professorat. Cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del curs vistes per abordar el repte. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori. La proposta de disseny inclourà una prova de concepte fins on els medis de l'assignatura ho permetin sobre la proposta plantejada.
Dos cops al curs els equips presentaran les seves propostes en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes.
Els recursos de material de suport inclouen:
* Diapositives/Transparències per cada tema en format pdf o similar.
* Links per a articles, fòrums, discussions o casos pràctics en repositoris congruents i fiables per a l'assignatura.
* Vídeos o similars per a mostrar casos pràctics o temes complementaris a les classes magistrals.
* Ús de programari GNU per a la part pràctica. Es proposa l'ús de R, RStudio i plataformes similars.
* Pot usar-se ús de programari especialitzat desenvolupat per grups de recerca dins de la UPC com GESCONDA i Klass, Freeling, etc.
Mètode d'avaluació
Es proposa el següent sistema d'avaluació:
- 4 Treballs en equip realitzats al llarg del curs 80%.
Per cada treball en equip s'avalua
- Qualitat tècnica del disseny proposat i integració de coneixements que involucra (30%)
- Prova de concepte (20%)
- Prova oral de control de coneixements 10% (discussió amb el professorat en la presentació oral dels treballs en equip).
- Qualitat i rendiment de l'equip de treball. 10%.
- Comunicació oral i escrita 10%.
- Ètica de l'equip de treball i del treball pròpiament dit 10%
-Perspectiva de gènere de l'equip i del treball 10%.
-Assistència i participació en classes i laboratoris. 10%
- 2 Quiz al llarg del curs 10% (5% cadascun).
Reavaluació: només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final l'hagin suspès. La nota màxima que es pot obtenir a la reavaluació és un 7.
A survey on pre-processing techniques: Relevant issues in the context of environmental data -
GIBERT, Karina; SÁNCHEZ-MARRÉ, Miquel; IZQUIERDO, J,
IOS Press, 2016.
Analytics, Data Science, & Artificial Intelligence: Systems for Decision Support -
Ramesh Sharda, Dursun Delen, Efraim Turban,
11th Edition, 2020. ISBN: 978-1292341552
Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems -
KLEPPMANN, Martin,
O'Reilly, 2016. ISBN: 978-1449373320
Fundamentals of Data Engineering: Designing and Building Scalable Data Systems for Modern Applications -
MURRAY, Brian,
ISBN: 979-8391793649
Complementaria:
Exploratory multivariate analysis by example using R -
Husson, F.; Lê, S.; Pagès, J., CRC Press ,
2011.
ISBN: 9780367658021
Capacitats prèvies
En aquesta assignatura les tècniques vistes en bona part de les assignatures de les matèries precedents com "Probabilitat i Estadística", "Anàlisi intel·ligent de dades", "Aprenentatge Automàtic", "Lògica, Raonament Automàtic i "Sistemes Basats en el Coneixement" i " Tractament del llenguatge humà i percepció"