La mineria de dades és el procés d'extracció i descoberta de patrons en conjunts de dades grans (generalment) que impliquen mètodes a la intersecció de l'aprenentatge automàtic, les estadístiques multivariants i els sistemes de bases de dades. Actualment utilitza aquests mètodes d'una manera principiada per formar un procés d'extrem a extrem, des d'un conjunt de dades en brut fins a informació d'alt nivell, expressada en una estructura comprensible per a l'usuari final.
L'objectiu d'aquest curs és presentar i estudiar alguns dels algorismes més estesos, útils i elegants perquè els estudiants siguin capaços d'identificar i aplicar les eines adequades per a una determinada aplicació. Les classes magistrals tractaran la teoria, els algorismes i l'ús pràctic de les tècniques.
Professorat
Responsable
Jose Luis Balcázar Navarro (
)
Luis Antonio Belanche Muñoz (
)
Altres
Marta Arias Vicente (
)
Hores setmanals
Teoria
1
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6.375
Competències
Competències Tècniques de cada especialitat
Computació avançada
CEE3.1 - Capacitat per a identificar barreres computacionals i analitzar la complexitat de problemes computacionals en diversos àmbits de la ciència i la tecnologia; així com per representar problemes d'alta complexitat en estructures matemàtiques que puguin ser tractades eficientment amb esquemes algorítmics.
CEE3.2 - Capacitat per utilitzar un espectre ampli i variat de recursos algorítmics per resoldre problemes d'alta dificultat algorísmica.
CEE3.3 - Capacitat per entendre les necessitats computacionals de problemes de disciplines diferents de la informàtica i efectuar contribucions significatives en equips multidisciplinaris que facin servir la computació.
Competències Tècniques Generals
Genèriques
CG1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.
CG5 - Capacitat per aplicar solucions innovadores i realitzar avenços en el coneixement que explotin els nous paradigmes de la Informàtica, particularment en entorns distribuïts.
Competències Transversals
Treball en equip
CTR3 - Ser capaç de treballar com a membre d'un equip, ja sigui com a un membre més, ja sigui realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes d'una manera pragmàtica i amb sentit de la responsabilitat; assumir compromisos tenint en compte els recursos disponibles.
ús solvent dels recursos d'informació
CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.
Actitud adequada davant el treball
CTR5 - Tenir motivació per a la realització professional i per a afrontar nous reptes, tenir una visió àmplia de les possibilitats de la carrera professional en l'àmbit de l'enginyeria en informàtica. Sentir-se motivat per la qualitat i la millora contínua, i actuar amb rigor en el desenvolupament professional. Capacitat d'adaptació als canvis organitzatius o tecnològics. Capacitat de treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Raonament
CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.
Bàsiques
CB6 - Que els estudiants sàpiguen aplicar els coneixements adquirits y la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contexts més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
CB8 - Que els estudiants sàpiguen comunicar les seves conclusions i els coneixements i raons darreres que les sustenten- a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats.
CB9 - Que els estudiants posseeixin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma.
Objectius
Conèixer la problemàtica, tant teòrica com pràctica, de la Mineria de Dades, i entendre els principals models i algorismes que permeten afrontarla: tant a nivell conceptual com al de la seva aplicació mitjançant eines comercials, preferentment de codi obert.
Competències relacionades:
CB6,
CTR4,
CTR5,
CTR6,
CEE3.1,
CEE3.2,
CEE3.3,
CG1,
CG3,
CG5,
Obtenir i mostrar la capacitat de fer servir el coneixement adquirit mitjançant el desenvolupament autònom, en equip, d'un cas pràctic de mineria de dades, tot incloent-hi una presentació pública del treball fet.
Competències relacionades:
CB6,
CTR3,
CTR4,
CTR5,
CTR6,
CEE3.2,
CB9,
CG3,
CB8,
Continguts
Tècniques i algorismes seleccionats per a la mineria de dades
Algorithms and techniques are representative of the good and the best a data practitioner needs to know, among which:
backpropagation
expectation-maximization
association rules
pagerank
GLMs
Each topic of study is focused in 3 aspects:
theoretical
algorithmic
practical
Activitats
ActivitatActe avaluatiu
Estudi teòric i conceptual dels principals algorismes de mineria de dades.
Estudi teòric i conceptual dels principals algorismes de mineria de dades. Objectius:1 Continguts:
Classes teòriques, exercicis i problemes amb o sense component de programació i desenvolupament de casos d'estudi.
Mètode d'avaluació
L'avaluació es fa totalment fora de les aules i no hi haurà exàmens. Cada persona ha de contribuir amb tres (3) casos pràctics, exercicis resolts o problemes estudiats (informe escrit i eventualment codi) sobre temes relacionats amb l'assignatura; cadascun d'ells ha de ser elaborat per tres (3) persones, de la següent manera:
- 2 persones fan l'exercici per se
- 1 persona valora el treball realitzat
La funció d'avaluador serà assumida per cada membre exactament una vegada. L'ordre es deixarà a la decisió dels membres del grup. El/s professor/s avaluen tant el treball realitzat com la pròpia avaluació. Es disposaran de rúbriques que mostren la forma precisa en què es duen a terme totes les avaluacions, totes elles disponibles públicament en tot moment. La informació addicional com les dates de lliurament, el format del document, etc. es donarà en el seu moment.
La nota final es calcularà de la següent manera. Sigui
Ri = avaluació del treball 'i' per part del professor
SEi = avaluació del treball 'i' per part de l'estudiant
LEi = avaluació de l'avaluació 'i' per part del professor
FGi = nota final del treball 'i' = 1/2*(Ri + 10 - |SEi - LEi|)
FS = nota final = [3*FG1 + 3*FG2 + 3*FG3 + SS]/10
on SS és el grau de les habilitats no tècniques o genèriques (vegi's la guia docent de l'assignatura per més informació).
El tema de cada treball s'ha d'acordar amb el/s professor/s per cada grup d'estudiants. Al llarg de les classes es faran molts suggeriments. Dit això, es fomenta especialment la iniciativa individual i els enfocaments per iniciativa pròpia. Els temes dels treballs poden ser diferents o, alternativament, treball encadenat pot aprofundir successivament sobre els mateixos temes o temes íntimament relacionats.
Comprensió adequada de la informàtica en general, en especial algorísmia; bon nivell de diversos llenguatges de programació (com R, python, Julia) o voluntat d'assolir-lo; capacitat bàsica a mitjana per formalitzar matemàticament conceptes en informàtica, estadística, etc.