Data Warehousing

Crèdits
6
Tipus
Obligatòria d'especialitat (Ciència de les Dades)
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
ESSI
L'assignatura introdueix els conceptes de bases de dades orientades a la intel·ligència empresarial. En concret, això inclou bases de dades multidimensionals i magatzems de dades (DW), així com els processos ETL (Extract, Transform, Load) i conceptes bàsics de quadres de comandaments. Seran introduïdes les tècniques necessàries per a dissenyar, implementar, explotar, i mantenir els magatzems de dades parant especial atenció a dades espai-temporals.

Se donarà una atenció especial als problemes que planteja la integració de dades heterogenies i la qualitat de les dades. Els estudiants aprendran com definir, mesurar i mantenir la qualitat de les dades en el context de l'emmagatzematge de dades. S'expliquen les nocions clàssiques de magatzem de dades i OLAP: ETL, arquitectura, disseny lògic i conceptual, processament de consultes i optimització. Al final de curs, l'estudiant sabrà dissenyar, construir i consultar un magatzem de dades de manera eficient, per tal de crear gràfiques descriptives.

Professorat

Altres

  • Petar Jovanovic ( )

Hores setmanals

Teoria
1.9
Problemes
0
Laboratori
1.9
Aprenentatge dirigit
0
Aprenentatge autònom
96

Competències

Competències Tècniques de cada especialitat

Enginyeria de serveis

  • CEE5.1 - Capacitat per participar en projectes de millora o creació de sistemes de serveis, aportant especialment: a) propostes d'innovació i recerca basades en nous usos i desenvolupaments de les tecnologies de la informació b) l'aplicació dels principis de l'enginyeria del programari i les bases de dades en el desenvolupament dels sistemes d'informació que siguin més adequats, c) la determinació, instal·lació i gestió de la infraestructura/plataforma informàtica necessària per al funcionament eficient dels sistemes de servei.
  • CEE5.3 - Capacitat per treballar en equips interdisciplinaris d'enginyeria de serveis i, disposant de l'experiència de domini necessària, capacitat per a treballar autònomament en sistemes de serveis concrets.

Específiques comunes

  • CEC2 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.

Competències Tècniques Generals

Genèriques

  • CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.

Competències Transversals

Treball en equip

  • CTR3 - Ser capaç de treballar com a membre d'un equip, ja sigui com a un membre més, ja sigui realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes d'una manera pragmàtica i amb sentit de la responsabilitat; assumir compromisos tenint en compte els recursos disponibles.

Bàsiques

  • CB6 - Que els estudiants sàpiguen aplicar els coneixements adquirits y la seva capacitat de resolució de problemes en entorns nous o poc coneguts dins de contexts més amplis (o multidisciplinaris) relacionats amb la seva àrea d'estudi.
  • CB7 - Que els estudiants siguin capaços d'integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d'una informació que, essent incomplerta o limitada, inclogui reflexions sobre les responsabilitats socials i ètiques vinculades a l'aplicació dels seus coneixements i judicis.
  • CB8 - Que els estudiants sàpiguen comunicar les seves conclusions i els coneixements i raons darreres que les sustenten- a públics especialitzats i no especialitzats d'una manera clara i sense ambigüitats.
  • CB9 - Que els estudiants posseeixin les habilitats d'aprenentatge que els permetin continuar estudiant d'una manera que haurà de ser en gran mesura autodirigida o autònoma.

Objectius

  1. Ser capaç de modelar magatzems de dades multidimensionals i analitzar les seves dades de forma visual
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3,
  2. Ser capaç d'aplicar tècnicas específiques de diseny físic per a sistemes decisionals
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB7, CB8, CB9, CEC2, CTR3,
  3. Ser capaç de disenyar i implementar processos de migració de dades (ETL)
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3,

Continguts

  1. Introducció
    Comparació entre sistemes operacionals i decisionals; Metadades.
  2. Arquitectures d'emmagatzemament de dades
    Corporate Information Factory; DW 2.0
  3. Modelització multidimensional, eines OLAP
    Structure; Integrity constraints; Operations; Advanced concepts
  4. Disseny físic de bases de dades per a consultes analítiques
    Star-join i join indexes; Bitmaps; Vistes materialitzades; Dades espai-temporals
  5. Extracció, Tranformació i Càrrega
    Qualitat de les dades; Integració de dades i esquemes; Gestió de ETL
  6. Visualització i anàlisi descriptiu de la informació
    Indicadors de Rendiment Empresarial; Quadres de Comandament

Activitats

Activitat Acte avaluatiu


Classes de teoria

En aquestes activitats, el professor introduirà els conceptes teòrics bàsics d'aquesta assignatura. A més de les exposicions, es faran servir tècniques d'aprenentatge cooperatiu. Això requerirà la participació activa dels estudiants i, conseqüentment, seran avaluats.
Objectius: 1 2 3
Continguts:
Teoria
25h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h

Classes de laboratori

A l'estudiant se li demanarà que practiqui els diferents conceptes introduïts en les classes teòriques. Això inclou resoldre problemes a l'ordinador o en paper.
Objectius: 1 2 3
Continguts:
Teoria
0h
Problemes
0h
Laboratori
27h
Aprenentatge dirigit
0h
Aprenentatge autònom
54h

Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
17h

Metodologia docent

L'assignatura es compon de teoria, i sessions de laboratori.

Teoria: S'utilitzaran tècniques de classe invertida que requereixen que l'estudiant trabaje materials multimedia abans de la classe. Les classes de teoria consisteixen en explicacions complementàries del professor i resolució de problemes.

Laboratori: S'utilitzaran algunes eines representatives per a l'aplicació de conceptes teòrics (per exemple, Indyco Builder, PotgreSQL, Oracle, Pentaho Data Integration, Tableau). El curs inclou pràctiques contínues a través d'un projecte de curs, dividit en tres blocs lògics: modelatge de magatzem de dades, integració i migració de dades (ETL), i visualització descriptiva, en què els estudiants treballaran en equips. Hi haurà tres entregables del projecte fora de l'horari de classe, però els estudiants també seran avaluats individualment a l'aula sobre els coneixements adquirits durant cada bloc de el projecte.

Mètode d'avaluació

Final Mark = min(10 ; 60%E + 40%L + 10%P)

L = Weighted average of the marks of the three lab deliverables
E = Final exam
P = Participation in the class

Bibliografia

Bàsica:

Complementaria:

Web links

Capacitats prèvies

Coneixement bàsic de bases de dades relacionals i SQL.

Especificamente, s'assumirà coneixements de:
- Diagrames de classes UML
- Algebra relacional
- Consultes SQL
- Vistes relacionals
- Operacions d'arbres-B (insercions i splits)
- Conceptes bàsic d'optimització física de consultes