La Mineria de Dades és una disciplina en la qual s'han desenvolupat tecnologies que, oportunament emprades, permeten a una organització millorar el seu rendiment a partir de l'anàlisi de dades disponibles i de la identificació de patrons en ells. No obstant això, malgrat les diverses "success stories" disponibles, és imprescindible ser conscient de les limitacions d'aquestes tecnologies: aquí es desenvoluparà l'estudi dels algorismes més habituals i dels seus principals paràmetres, de manera que els alumnes siguin capaços d'identificar l'eina adequada per a una aplicació. S'explicarà la teoria i l'ús pràctic de clusterizadores, asociadores i classificadors de manera que l'alumne adquireixi criteris per fixar els valors dels molts paràmetres lliures de cada un d'aquests algorismes.
Professorat
Responsable
Jose Luis Balcázar Navarro (
)
Luis Antonio Belanche Muñoz (
)
Altres
Marta Arias Vicente (
)
Hores setmanals
Teoria
1
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
0
Competències
Competències Tècniques de cada especialitat
Computació avançada
CEE3.1 - Capacitat per a identificar barreres computacionals i analitzar la complexitat de problemes computacionals en diversos àmbits de la ciència i la tecnologia; així com per representar problemes d'alta complexitat en estructures matemàtiques que puguin ser tractades eficientment amb esquemes algorítmics.
CEE3.2 - Capacitat per utilitzar un espectre ampli i variat de recursos algorítmics per resoldre problemes d'alta dificultat algorísmica.
CEE3.3 - Capacitat per entendre les necessitats computacionals de problemes de disciplines diferents de la informàtica i efectuar contribucions significatives en equips multidisciplinaris que facin servir la computació.
Competències Tècniques Generals
Genèriques
CG1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.
CG5 - Capacitat per aplicar solucions innovadores i realitzar avenços en el coneixement que explotin els nous paradigmes de la Informàtica, particularment en entorns distribuïts.
Competències Transversals
Treball en equip
CTR3 - Ser capaç de treballar com a membre d'un equip, ja sigui com a un membre més, ja sigui realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes d'una manera pragmàtica i amb sentit de la responsabilitat; assumir compromisos tenint en compte els recursos disponibles.
ús solvent dels recursos d'informació
CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.
Actitud adequada davant el treball
CTR5 - Tenir motivació per a la realització professional i per a afrontar nous reptes, tenir una visió àmplia de les possibilitats de la carrera professional en l'àmbit de l'enginyeria en informàtica. Sentir-se motivat per la qualitat i la millora contínua, i actuar amb rigor en el desenvolupament professional. Capacitat d'adaptació als canvis organitzatius o tecnològics. Capacitat de treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Raonament
CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.
Bàsiques
CB6 - Que els estudiants sàpiguen aplicar els coneixements adquirits y la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contexts més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
CB8 - Que els estudiants sàpiguen comunicar les seves conclusions i els coneixements i raons darreres que les sustenten- a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats.
CB9 - Que els estudiants posseeixin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma.
Objectius
Conèixer la problemàtica, tant teòrica com pràctica, de la Mineria de Dades, i entendre els principals models i algorismes que permeten afrontarla: tant a nivell conceptual com al de la seva aplicació mitjançant eines comercials, preferentment de codi obert.
Competències relacionades:
CG1,
CG3,
CEE3.1,
CEE3.2,
CEE3.3,
CB6,
CTR4,
CTR5,
CTR6,
CG5,
Obtenir i mostrar la capacitat de fer servir el coneixement adquirit mitjançant el desenvolupament autònom, en equip, d'un cas pràctic de mineria de dades, tot incloent-hi una presentació pública del treball fet.
Competències relacionades:
CG3,
CEE3.2,
CB6,
CB8,
CB9,
CTR3,
CTR4,
CTR5,
CTR6,
Continguts
Main models and algorithms for Data Mining
Activitats
ActivitatActe avaluatiu
Estudi teòric i conceptual dels principals algorismes de mineria de dades.
Estudi teòric i conceptual dels principals algorismes de mineria de dades. Objectius:1 Continguts:
Classes teòriques, problemes amb o sense component de programació, pràctiques amb software comercial de mineria de dades, desenvolupament d'un estudi de cas.
Mètode d'avaluació
Evaluation is fully offline and there will be no exams. Each person must contribute 4 written documents on topics related to the course. Coauthorship is allowed but the sets of coauthors in each pair of documents must be disjoint. Final grade will be the average of the grades of the documents.
The topic of each document is to be individually agreed with the lecturer by each student. Many suggestions will be provided along the teaching but individual initiative and open-minded approaches are particularly encouraged. The topics of the documents may be different or, alternatively, several documents may deepen successively on the same or closely related topics.
The only condition is that at least one of the documents focuses on the practical usage of data mining algorithms, preferably as implemented in a standard platform, on a dataset of the student's choice.
In normal times, the last document may be replaced by an oral presentation. In times of remote teaching due to confinement or otherwise, this option will not be available.
Thorough understanding of computing in general; good command of several programming languages; basic ability to formalize mathematically issues in informatics engineering.