Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
ESSI
Web
https://learnsql.fib.upc.es/moodle
Se donarà una atenció especial als problemes que planteja la integració de dades heterogenies i la qualitat de les dades. Els estudiants aprendran com definir, mesurar i mantenir la qualitat de les dades en el context de l'emmagatzematge de dades. S'expliquen les nocions clàssiques de magatzem de dades i OLAP: ETL, arquitectura, disseny lògic i conceptual, processament de consultes i optimització. Al final de curs, l'estudiant sabrà dissenyar, construir i consultar un magatzem de dades de manera eficient, per tal de crear gràfiques descriptives.
Professorat
Responsable
- Petar Jovanovic ( petar.jovanovic@upc.edu )
Altres
- Xavier Oriol Hilari ( xavier.oriol@upc.edu )
Hores setmanals
Teoria
1.9
Problemes
0
Laboratori
1.9
Aprenentatge dirigit
0
Aprenentatge autònom
6.85
Competències
Treball en equip
Tercera llengua
Emprenedoria i innovació
Bàsiques
Genèriques
Específiques
Objectius
-
Ser capaç de modelar magatzems de dades multidimensionals i analitzar les seves dades de forma visual
Competències relacionades: CT3, CT5, CT1, CE3, CE5, CB6, CB7, CB8, CB9, CB10, -
Ser capaç d'aplicar tècnicas específiques de diseny físic per a sistemes decisionals
Competències relacionades: CT3, CT5, CG1, CE2, CE5, CB6, CB7, CB8, CB9, -
Ser capaç de disenyar i implementar processos de migració de dades (ETL)
Competències relacionades: CT3, CT5, CG1, CE2, CE3, CE5, CE7, CB6, CB7, CB8, CB9, CB10,
Continguts
-
Introducció
Comparació entre sistemes operacionals i decisionals; Metadades. -
Arquitectures d'emmagatzemament de dades
Corporate Information Factory; DW 2.0 -
Modelització multidimensional, eines OLAP
Estructura; Restriccions d'Integritat; Operacions; Conceptes avançats -
Disseny físic de bases de dades per a consultes analítiques
Star-join i join indexes; Bitmaps; Vistes materialitzades; Dades espai-temporals -
Extracció, Tranformació i Càrrega
Qualitat de les dades; Integració de dades i esquemes; Gestió de ETL -
Visualització i anàlisi descriptiu de la informació
Indicadors de Rendiment Empresarial; Quadres de Comandament
Activitats
Activitat Acte avaluatiu
Classes de teoria
En aquestes activitats, el professor introduirà els conceptes teòrics bàsics d'aquesta assignatura. A més de les exposicions, es faran servir tècniques d'aprenentatge cooperatiu. Això requerirà la participació activa dels estudiants i, conseqüentment, seran avaluats.Objectius: 1 3 2
Continguts:
Teoria
25h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h
Metodologia docent
L'assignatura es compon de teoria, i sessions de laboratori.Teoria: El professor exposa el tema. Els estudiants segueixen la lliçó, prenen apunts i preparen material addicional fora de classe. També se'ls pot demanar que portin a terme activitats avaluatòries dins d'aquestes sessions.
Laboratori: S'utilitzaran algunes eines representatives per a l'aplicació de conceptes teòrics (per exemple, PotgreSQL, Oracle, Talend, Tableau). El curs inclou pràctiques contínues a través d'un projecte de curs, dividit en tres blocs lògics: modelatge de magatzem de dades, integració i migració de dades (ETL), i visualització descriptiva, en què els estudiants treballaran en equips. Hi haurà tres entregables del projecte fora de l'horari de classe, però els estudiants també seran avaluats individualment a l'aula sobre els coneixements adquirits durant cada bloc de el projecte.
Mètode d'avaluació
Final grade = max(20%EP+40%EF ; 60% EF) + 40% PEP = partial (mid term) exam mark
EF = final exam mark
P = Weighted average of the marks of the project deliverables
Bibliografia
Bàsic
-
Data warehouse design: modern principles and methodologies
- Golfarelli, M.; Rizzi, S,
McGraw Hill,
2009.
ISBN: 9780071610391
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003628169706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Multidimensional databases and data warehousing
- Jensen, C.S.; Pedersen, T.B.; Thomsen, C.W,
Morgan & Claypool,
2010.
ISBN: 9781608455379
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003948319706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Corporate information factory
- Inmon, William H; Imhoff, Claudia; Sousa, Ryan,
John Wiley,
2001.
ISBN: 0471399612
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003133419706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The data warehouse lifecycle toolkit
- Kimball, R. [et al.],
Wiley publishing,
2008.
ISBN: 9780470149775
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003464519706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database systems: the complete book
- Garcia-Molina, H.; Ullman, J.D.; Widom, J,
Pearson Education Limited,
2014.
ISBN: 9781292024479
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=5174436 -
Data warehouse systems: design and implentation
- Vaisman, A.; Zimanyi, E,
Springer,
2014.
ISBN: 9783642546549
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004038639706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data warehousing and analytics: fueling the data engine
- Taniar, D.; Rahayu, W,
Springer,
2021.
ISBN: 9783030819781
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005193379806711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementari
-
Database modeling and design: logical design
- Teorey, Toby ... [et al.],
Morgan Kaufmann Publishers/Elsevier,
2011.
ISBN: 9780123820204
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004000559706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Physical database design: the database professional's guide to exploiting indexes, views, storage, and more
- Lightstone, S.; Teorey, T.J.; Nadeau, T,
Morgan Kaufmann Publishers,
2007.
ISBN: 9780123693891
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003252949706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database management systems
- Ramakrishnan, R.; Gehrke, J,
McGraw-Hill,
2003.
ISBN: 0071151109
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002855579706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Cost-based oracle fundamentals
- Lewis, J,
Apress,
2006.
ISBN: 9781590596364
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003403389706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Web links
- Summer school http://cs.ulb.ac.be/conferences/ebiss.html
- Transforming Data With Intelligence (former Data Warehouse Institute) http://tdwi.org
- MSCA-ITN-Erasmus Joint Doctorate on Data Engineering for Data Science https://deds.ulb.ac.be
Capacitats prèvies
Coneixement bàsic de bases de dades relacionals i SQL.Especificamente, s'assumirà coneixements de:
- Diagrames de classes UML
- Algebra relacional
- Consultes SQL
- Vistes relacionals
- Operacions d'arbres-B (insercions i splits)
- Conceptes bàsic d'optimització física de consultes