Algorísmia per a Mineria de Dades

Esteu aquí

Crèdits
6
Tipus
Complementària d'especialitat (Ciència de les Dades)
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
CS
La Mineria de Dades és una disciplina en la qual s'han desenvolupat tecnologies que, oportunament emprades, permeten a una organització millorar el seu rendiment a partir de l'anàlisi de dades disponibles i de la identificació de patrons en ells. No obstant això, malgrat les diverses "success stories" disponibles, és imprescindible ser conscient de les limitacions d'aquestes tecnologies: aquí es desenvoluparà l'estudi dels algorismes més habituals i dels seus principals paràmetres, de manera que els alumnes siguin capaços d'identificar l'eina adequada per a una aplicació. S'explicarà la teoria i l'ús pràctic de clusterizadores, asociadores i classificadors de manera que l'alumne adquireixi criteris per fixar els valors dels molts paràmetres lliures de cada un d'aquests algorismes.

Professors

Responsable

  • Jose Luis Balcázar Navarro ( )

Altres

  • Jorge Castro Rabal ( )
  • Jose Carmona Vargas ( )
  • Marta Arias Vicente ( )
  • Ricard Gavaldà Mestre ( )

Hores setmanals

Teoria
1
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
0

Competències

Competències Tècniques de cada especialitat

Computació avançada

  • CEE3.1 - Capacitat per a identificar barreres computacionals i analitzar la complexitat de problemes computacionals en diversos àmbits de la ciència i la tecnologia; així com per representar problemes d'alta complexitat en estructures matemàtiques que puguin ser tractades eficientment amb esquemes algorítmics.
  • CEE3.2 - Capacitat per utilitzar un espectre ampli i variat de recursos algorítmics per resoldre problemes d'alta dificultat algorísmica.
  • CEE3.3 - Capacitat per entendre les necessitats computacionals de problemes de disciplines diferents de la informàtica i efectuar contribucions significatives en equips multidisciplinaris que facin servir la computació.

Competències Tècniques Generals

Genèriques

  • CG1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
  • CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.
  • CG5 - Capacitat per aplicar solucions innovadores i realitzar avenços en el coneixement que explotin els nous paradigmes de la Informàtica, particularment en entorns distribuïts.

Competències Transversals

Treball en equip

  • CTR3 - Ser capaç de treballar com a membre d'un equip, ja sigui com a un membre més, ja sigui realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes d'una manera pragmàtica i amb sentit de la responsabilitat; assumir compromisos tenint en compte els recursos disponibles.

ús solvent dels recursos d'informació

  • CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.

Actitud adequada davant el treball

  • CTR5 - Tenir motivació per a la realització professional i per a afrontar nous reptes, tenir una visió àmplia de les possibilitats de la carrera professional en l'àmbit de l'enginyeria en informàtica. Sentir-se motivat per la qualitat i la millora contínua, i actuar amb rigor en el desenvolupament professional. Capacitat d'adaptació als canvis organitzatius o tecnològics. Capacitat de treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.

Raonament

  • CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.

Bàsiques

  • CB6 - Que els estudiants sàpiguen aplicar els coneixements adquirits y la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contexts més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • CB8 - Que els estudiants sàpiguen comunicar les seves conclusions i els coneixements i raons darreres que les sustenten- a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats.
  • CB9 - Que els estudiants posseeixin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma.

Objectius

  1. Conèixer la problemàtica, tant teòrica com pràctica, de la Mineria de Dades, i entendre els principals models i algorismes que permeten afrontarla: tant a nivell conceptual com al de la seva aplicació mitjançant eines comercials, preferentment de codi obert.
    Related competences: CG1, CG3, CEE3.1, CEE3.2, CEE3.3, CB6, CTR4, CTR5, CTR6, CG5,
  2. Obtenir i mostrar la capacitat de fer servir el coneixement adquirit mitjançant el desenvolupament autònom, en equip, d'un cas pràctic de mineria de dades, tot incloent-hi una presentació pública del treball fet.
    Related competences: CG3, CEE3.2, CB6, CB8, CB9, CTR3, CTR4, CTR5, CTR6,

Continguts

  1. Main models and algorithms for Data Mining

Activitats

Activitat Acte avaluatiu


Estudi teòric i conceptual dels principals algorismes de mineria de dades.

Estudi teòric i conceptual dels principals algorismes de mineria de dades.
Objectius: 1
Continguts:
Teoria
18h
Problemes
6h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Desenvolupament d'un cas pràctic

Deploy of a practical case study
Objectius: 1 2
Continguts:
Teoria
0h
Problemes
0h
Laboratori
36h
Aprenentatge dirigit
0h
Aprenentatge autònom
18h

Metodologia docent

Classes teòriques, problemes amb o sense component de programació, pràctiques amb software comercial de mineria de dades, desenvolupament d'un estudi de cas.

Mètode d'avaluació

Optional mid-term exam, final exam, presentation of the development of the case study.

The final grade will be the sum of two grades:

Basic understanding mark, between 0 and 7.

Commendable understanding mark, between 0 and 3.

The commendable understanding mark is obtained through specific questions in the final exam, clearly marked as such, and worth 3 points.

The basic understanding mark is the sum of three marks: the mid-term exam, worth 4 points; the presentation of the case study, worth 4 points; and the rest of the final exam, worth 4 points. If this sum is higher than 7, it gets truncated at 7.

Bibliografia

Bàsica:

  • The Top Ten Algorithms in Data Mining - Xindong Wu (Redactor), Vipin Kumar (Redactor) , Chapman & Hall/CRC Data Mining and Knowledge Discovery Series, ISBN: 978-1420089646

Capacitats prèvies

Thorough understanding of computing in general; good command of several programming languages; basic ability to formalize mathematically issues in informatics engineering.