Data Warehousing

Crèdits
6
Tipus
Obligatòria d'especialitat (Ciència de les Dades)
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
ESSI
L'assignatura introdueix els conceptes de bases de dades orientades a la intel·ligència empresarial. En concret, això inclou bases de dades multidimensionals i magatzems de dades (DW), així com els processos ETL (Extract, Transform, Load) i conceptes bàsics de quadres de comandaments. Seran introduïdes les tècniques necessàries per a dissenyar, implementar, explotar, i mantenir els magatzems de dades parant especial atenció a dades espai-temporals.

Se donarà una atenció especial als problemes que planteja la integració de dades heterogenies i la qualitat de les dades. Els estudiants aprendran com definir, mesurar i mantenir la qualitat de les dades en el context de l'emmagatzematge de dades. S'expliquen les nocions clàssiques de magatzem de dades i OLAP: ETL, arquitectura, disseny lògic i conceptual, processament de consultes i optimització. Al final de curs, l'estudiant sabrà dissenyar, construir i consultar un magatzem de dades de manera eficient, per tal de crear gràfiques descriptives.

Professorat

Altres

  • Petar Jovanovic ( )

Hores setmanals

Teoria
1.9
Problemes
0
Laboratori
1.9
Aprenentatge dirigit
0
Aprenentatge autònom
96

Objectius

  1. Ser capaç de modelar magatzems de dades multidimensionals i analitzar les seves dades de forma visual
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3,
  2. Ser capaç d'aplicar tècnicas específiques de diseny físic per a sistemes decisionals
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB7, CB8, CB9, CEC2, CTR3,
  3. Ser capaç de disenyar i implementar processos de migració de dades (ETL)
    Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3,

Continguts

  1. Introducció
    Comparació entre sistemes operacionals i decisionals; Metadades.
  2. Arquitectures d'emmagatzemament de dades
    Corporate Information Factory; DW 2.0
  3. Modelització multidimensional, eines OLAP
    Structure; Integrity constraints; Operations; Advanced concepts
  4. Disseny físic de bases de dades per a consultes analítiques
    Star-join i join indexes; Bitmaps; Vistes materialitzades; Dades espai-temporals
  5. Extracció, Tranformació i Càrrega
    Qualitat de les dades; Integració de dades i esquemes; Gestió de ETL
  6. Visualització i anàlisi descriptiu de la informació
    Indicadors de Rendiment Empresarial; Quadres de Comandament

Activitats

Activitat Acte avaluatiu


Classes de teoria

En aquestes activitats, el professor introduirà els conceptes teòrics bàsics d'aquesta assignatura. A més de les exposicions, es faran servir tècniques d'aprenentatge cooperatiu. Això requerirà la participació activa dels estudiants i, conseqüentment, seran avaluats.
Objectius: 1 2 3
Continguts:
Teoria
25h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h

Classes de laboratori

A l'estudiant se li demanarà que practiqui els diferents conceptes introduïts en les classes teòriques. Això inclou resoldre problemes a l'ordinador o en paper.
Objectius: 1 2 3
Continguts:
Teoria
0h
Problemes
0h
Laboratori
27h
Aprenentatge dirigit
0h
Aprenentatge autònom
54h

Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
17h

Metodologia docent

L'assignatura es compon de teoria, i sessions de laboratori.

Teoria: S'utilitzaran tècniques de classe invertida que requereixen que l'estudiant trabaje materials multimedia abans de la classe. Les classes de teoria consisteixen en explicacions complementàries del professor i resolució de problemes.

Laboratori: S'utilitzaran algunes eines representatives per a l'aplicació de conceptes teòrics (per exemple, Indyco Builder, PotgreSQL, Oracle, Pentaho Data Integration, Tableau). El curs inclou pràctiques contínues a través d'un projecte de curs, dividit en tres blocs lògics: modelatge de magatzem de dades, integració i migració de dades (ETL), i visualització descriptiva, en què els estudiants treballaran en equips. Hi haurà tres entregables del projecte fora de l'horari de classe, però els estudiants també seran avaluats individualment a l'aula sobre els coneixements adquirits durant cada bloc de el projecte.

Mètode d'avaluació

Final Mark = min(10 ; 60%E + 40%L + 10%P)

L = Weighted average of the marks of the three lab deliverables
E = Final exam
P = Participation in the class

Bibliografia

Bàsica:

Complementaria:

Web links

Capacitats prèvies

Coneixement bàsic de bases de dades relacionals i SQL.

Especificamente, s'assumirà coneixements de:
- Diagrames de classes UML
- Algebra relacional
- Consultes SQL
- Vistes relacionals
- Operacions d'arbres-B (insercions i splits)
- Conceptes bàsic d'optimització física de consultes