Algorísmia per a Mineria de Dades

Esteu aquí

Crèdits
6
Tipus
  • MDS: Optativa
  • MIRI: Complementària d'especialitat (Computació Avançada)
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
CS
La mineria de dades és el procés d'extracció i descoberta de patrons en conjunts de dades grans (generalment) que impliquen mètodes a la intersecció de l'aprenentatge automàtic, les estadístiques multivariants i els sistemes de bases de dades. Actualment utilitza aquests mètodes d'una manera principiada per formar un procés d'extrem a extrem, des d'un conjunt de dades en brut fins a informació d'alt nivell, expressada en una estructura comprensible per a l'usuari final.

L'objectiu d'aquest curs és presentar i estudiar alguns dels algorismes més estesos, útils i elegants perquè els estudiants siguin capaços d'identificar i aplicar les eines adequades per a una determinada aplicació. Les classes magistrals tractaran la teoria, els algorismes i l'ús pràctic de les tècniques.

Professorat

Responsable

  • Jose Luis Balcázar Navarro ( )
  • Luis Antonio Belanche Muñoz ( )

Altres

  • Marta Arias Vicente ( )

Hores setmanals

Teoria
1
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6.375

Competències

Competències Tècniques de cada especialitat

Computació avançada

  • CEE3.1 - Capacitat per a identificar barreres computacionals i analitzar la complexitat de problemes computacionals en diversos àmbits de la ciència i la tecnologia; així com per representar problemes d'alta complexitat en estructures matemàtiques que puguin ser tractades eficientment amb esquemes algorítmics.
  • CEE3.2 - Capacitat per utilitzar un espectre ampli i variat de recursos algorítmics per resoldre problemes d'alta dificultat algorísmica.
  • CEE3.3 - Capacitat per entendre les necessitats computacionals de problemes de disciplines diferents de la informàtica i efectuar contribucions significatives en equips multidisciplinaris que facin servir la computació.

Competències Tècniques Generals

Genèriques

  • CG1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
  • CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.
  • CG5 - Capacitat per aplicar solucions innovadores i realitzar avenços en el coneixement que explotin els nous paradigmes de la Informàtica, particularment en entorns distribuïts.

Competències Transversals

Treball en equip

  • CTR3 - Ser capaç de treballar com a membre d'un equip, ja sigui com a un membre més, ja sigui realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes d'una manera pragmàtica i amb sentit de la responsabilitat; assumir compromisos tenint en compte els recursos disponibles.

ús solvent dels recursos d'informació

  • CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.

Actitud adequada davant el treball

  • CTR5 - Tenir motivació per a la realització professional i per a afrontar nous reptes, tenir una visió àmplia de les possibilitats de la carrera professional en l'àmbit de l'enginyeria en informàtica. Sentir-se motivat per la qualitat i la millora contínua, i actuar amb rigor en el desenvolupament professional. Capacitat d'adaptació als canvis organitzatius o tecnològics. Capacitat de treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.

Raonament

  • CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.

Bàsiques

  • CB6 - Que els estudiants sàpiguen aplicar els coneixements adquirits y la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contexts més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • CB8 - Que els estudiants sàpiguen comunicar les seves conclusions i els coneixements i raons darreres que les sustenten- a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats.
  • CB9 - Que els estudiants posseeixin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma.

Objectius

  1. Conèixer la problemàtica, tant teòrica com pràctica, de la Mineria de Dades, i entendre els principals models i algorismes que permeten afrontarla: tant a nivell conceptual com al de la seva aplicació mitjançant eines comercials, preferentment de codi obert.
    Competències relacionades: CG1, CG3, CEE3.1, CEE3.2, CEE3.3, CB6, CTR4, CTR5, CTR6, CG5,
  2. Obtenir i mostrar la capacitat de fer servir el coneixement adquirit mitjançant el desenvolupament autònom, en equip, d'un cas pràctic de mineria de dades, tot incloent-hi una presentació pública del treball fet.
    Competències relacionades: CG3, CEE3.2, CB6, CB8, CB9, CTR3, CTR4, CTR5, CTR6,

Continguts

  1. Tècniques i algorismes seleccionats per a la mineria de dades
    Algorithms and techniques are representative of the good and the best a data practitioner needs to know, among which:

    backpropagation
    expectation-maximization
    association rules
    pagerank
    GLMs

    Each topic of study is focused in 3 aspects:

    theoretical
    algorithmic
    practical

Activitats

Activitat Acte avaluatiu


Estudi teòric i conceptual dels principals algorismes de mineria de dades.

Estudi teòric i conceptual dels principals algorismes de mineria de dades.
Objectius: 1
Continguts:
Teoria
18h
Problemes
6h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Desenvolupament d'un cas pràctic

Deploy of a practical case study
Objectius: 1 2
Continguts:
Teoria
0h
Problemes
0h
Laboratori
36h
Aprenentatge dirigit
0h
Aprenentatge autònom
18h

Metodologia docent

Classes teòriques, exercicis i problemes amb o sense component de programació i desenvolupament de casos d'estudi.

Mètode d'avaluació

L'avaluació es fa totalment fora de les aules i no hi haurà exàmens. Cada persona ha de contribuir amb tres (3) casos pràctics, exercicis resolts o problemes estudiats (informe escrit i eventualment codi) sobre temes relacionats amb l'assignatura; cadascun d'ells ha de ser elaborat per tres (3) persones, de la següent manera:

- 2 persones fan l'exercici per se
- 1 persona valora el treball realitzat

La funció d'avaluador serà assumida per cada membre exactament una vegada. L'ordre es deixarà a la decisió dels membres del grup. El/s professor/s avaluen tant el treball realitzat com la pròpia avaluació. Es disposaran de rúbriques que mostren la forma precisa en què es duen a terme totes les avaluacions, totes elles disponibles públicament en tot moment. La informació addicional com les dates de lliurament, el format del document, etc. es donarà en el seu moment.

La nota final es calcularà de la següent manera. Sigui

Ri = avaluació del treball 'i' per part del professor
SEi = avaluació del treball 'i' per part de l'estudiant
LEi = avaluació de l'avaluació 'i' per part del professor

FGi = nota final del treball 'i' = 1/2*(Ri + 10 - |SEi - LEi|)

FS = nota final = [3*FG1 + 3*FG2 + 3*FG3 + SS]/10

on SS és el grau de les habilitats no tècniques o genèriques (vegi's la guia docent de l'assignatura per més informació).

El tema de cada treball s'ha d'acordar amb el/s professor/s per cada grup d'estudiants. Al llarg de les classes es faran molts suggeriments. Dit això, es fomenta especialment la iniciativa individual i els enfocaments per iniciativa pròpia. Els temes dels treballs poden ser diferents o, alternativament, treball encadenat pot aprofundir successivament sobre els mateixos temes o temes íntimament relacionats.

Bibliografia

Bàsica:

Capacitats prèvies

Comprensió adequada de la informàtica en general, en especial algorísmia; bon nivell de diversos llenguatges de programació (com R, python, Julia) o voluntat d'assolir-lo; capacitat bàsica a mitjana per formalitzar matemàticament conceptes en informàtica, estadística, etc.