Crèdits
6
Tipus
Optativa
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
ESSI
Se donarà una atenció especial als problemes que planteja la integració de dades heterogenies i la qualitat de les dades. Els estudiants aprendran com definir, mesurar i mantenir la qualitat de les dades en el context de l'emmagatzematge de dades. S'expliquen les nocions clàssiques de magatzem de dades i OLAP: ETL, arquitectura, disseny lògic i conceptual, processament de consultes i optimització. Al final de curs, l'estudiant sabrà dissenyar, construir i consultar un magatzem de dades de manera eficient, per tal de crear gràfiques descriptives.
Professorat
Altres
- Petar Jovanovic (petar.jovanovic@upc.edu)
Hores setmanals
Teoria
1.9
Problemes
0
Laboratori
1.9
Aprenentatge dirigit
0
Aprenentatge autònom
96
Objectius
-
Ser capaç de modelar magatzems de dades multidimensionals i analitzar les seves dades de forma visual
Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3, -
Ser capaç d'aplicar tècnicas específiques de diseny físic per a sistemes decisionals
Competències relacionades: CEE5.1, CEE5.3, CG3, CB7, CB8, CB9, CEC2, CTR3, -
Ser capaç de disenyar i implementar processos de migració de dades (ETL)
Competències relacionades: CEE5.1, CEE5.3, CG3, CB6, CB7, CB8, CB9, CEC2, CTR3,
Continguts
-
Introducció
Comparació entre sistemes operacionals i decisionals; Metadades. -
Arquitectures d'emmagatzemament de dades
Corporate Information Factory; DW 2.0 -
Modelització multidimensional, eines OLAP
Structure; Integrity constraints; Operations; Advanced concepts -
Disseny físic de bases de dades per a consultes analítiques
Star-join i join indexes; Bitmaps; Vistes materialitzades; Dades espai-temporals -
Extracció, Tranformació i Càrrega
Qualitat de les dades; Integració de dades i esquemes; Gestió de ETL -
Visualització i anàlisi descriptiu de la informació
Indicadors de Rendiment Empresarial; Quadres de Comandament
Activitats
Activitat Acte avaluatiu
Classes de teoria
En aquestes activitats, el professor introduirà els conceptes teòrics bàsics d'aquesta assignatura. A més de les exposicions, es faran servir tècniques d'aprenentatge cooperatiu. Això requerirà la participació activa dels estudiants i, conseqüentment, seran avaluats.Objectius: 1 2 3
Continguts:
Teoria
25h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h
Metodologia docent
L'assignatura es compon de teoria, i sessions de laboratori.Teoria: S'utilitzaran tècniques de classe invertida que requereixen que l'estudiant trabaje materials multimedia abans de la classe. Les classes de teoria consisteixen en explicacions complementàries del professor i resolució de problemes.
Laboratori: S'utilitzaran algunes eines representatives per a l'aplicació de conceptes teòrics (per exemple, Indyco Builder, PotgreSQL, Oracle, Pentaho Data Integration, Tableau). El curs inclou pràctiques contínues a través d'un projecte de curs, dividit en tres blocs lògics: modelatge de magatzem de dades, integració i migració de dades (ETL), i visualització descriptiva, en què els estudiants treballaran en equips. Hi haurà tres entregables del projecte fora de l'horari de classe, però els estudiants també seran avaluats individualment a l'aula sobre els coneixements adquirits durant cada bloc de el projecte.
Mètode d'avaluació
Final Mark = min(10 ; 60%E + 40%L + 10%P)L = Weighted average of the marks of the three lab deliverables
E = Final exam
P = Participation in the class
Bibliografia
Bàsic
-
Data warehouse design: modern principles and methodologies
- Golfarelli, M.; Rizzi, S,
McGraw Hill,
2009.
ISBN: 9780071610391
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003628169706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Multidimensional databases and data warehousing
- Jensen, C.S.; Pedersen, T.B.; Thomsen, C.W,
Morgan & Claypool,
2010.
ISBN: 9781608455379
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003948319706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Corporate information factory
- Inmon, W.H.; Imhoff, C.; Sousa, R,
John Wiley,
2001.
ISBN: 0471399612
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003133419706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The data warehouse lifecycle toolkit
- Kimball, R. [et al.],
Wiley publishing,
2008.
ISBN: 9780470149775
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003464519706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database systems: the complete book
- Garcia-Molina, H.; Ullman, J.D.; Widom, J,
Pearson Education Limited,
2013.
ISBN: 9781292024479
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004168919706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data warehouse systems: design and implentation
- Vaisman, A.; Zimanyi, E,
Springer,
2014.
ISBN: 9783642546549
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004038639706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementari
-
Database modeling and design: logical design
- Teorey, T.J.; Nadeau, T.; Lightstone, S,
Morgan Kaufmann Publishers/Elsevier,
2011.
ISBN: 9780123820204
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004000559706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Physical database design: the database professional's guide to exploiting indexes, views, storage, and more
- Lightstone, S.; Teorey, T.J.; Nadeau, T,
Morgan Kaufmann Publishers,
2007.
ISBN: 9780123693891
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003252949706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database management systems
- Ramakrishnan, R.; Gehrke, J,
McGraw-Hill,
2003.
ISBN: 0071151109
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002855579706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Cost-based oracle fundamentals
- Lewis, J,
Apress,
2006.
ISBN: 9781590596364
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003403389706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Web links
- Summer school http://cs.ulb.ac.be/conferences/ebiss.html
- Transforming Data With Intelligence (former Data Warehouse Institute) http://tdwi.org
- MSCA-ITN-Erasmus Joint Doctorate on Data Engineering for Data Science https://deds.ulb.ac.be
Capacitats prèvies
Coneixement bàsic de bases de dades relacionals i SQL.Especificamente, s'assumirà coneixements de:
- Diagrames de classes UML
- Algebra relacional
- Consultes SQL
- Vistes relacionals
- Operacions d'arbres-B (insercions i splits)
- Conceptes bàsic d'optimització física de consultes