Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
ESSI
Professorat
Responsable
- Alberto Abello Gamazo (alberto.abello@upc.edu)
Altres
- Besim Bilalli (besim.bilalli@upc.edu)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències tècniques
Transversals
Bàsiques
Genèriques
Objectius
-
Ser capaç de discutir i justificar amb detall els principis arquitectonics i colls d'ampolla dels gestors relacionals enfront de sistemes d'emmagatzematge i processament alternatius.
Competències relacionades: CB2, CB3, CT4, CT6, CE7, CG1, CG2, -
Ser capaç d'obtenir l'esquema lògic d'un magatzem de dades a partir d'un esquema conceptual expressat en UML, detectar i corregir els seus defectes.
Competències relacionades: CB2, CB3, CT4, CT6, CE7, -
Ser capaç d'explicar i utilitzar els principals mecanismes de processament paral·lel de consultes en entorns distribuïts, i detectar colls d'ampolla.
Competències relacionades: CB2, CB3, CT4, CT6, CE7, CG2, -
Ser capaç de justificar i utilitzar sistemes d'emmagatzemament NOSQL.
Competències relacionades: CB2, CB3, CT4, CT6, CE7, CG1, CG2,
Continguts
-
Introducció
Emmagatzemament de dades en entorns analítics i Big Data -
Magatzems de dades
Emmagatzemament de dades. Fluxes de dades ETL. Integració de dades. Eines OLAP. -
Bases de dades distribuïdes
Taxonomia de bases de dades distribuïdes. Arquitectures. Disseny de bases de dades distribuïdes (fragmentació i replicació). Paral·lelisme. Mesures d'escalabilitat. Sistemes de fitxers distribuits. -
Processament distribuït de dades
Importància de l'accés seqüencial paral·lel. Barreres de sincronització (Bulk Synchronous Parallel model). Arquitectures de Big Data i sistemes NOSQL.
Activitats
Activitat Acte avaluatiu
Introducció
Introducció de l'assignatura, motivació i visió general de les eines de gestió de dades existents actualment, els seus avantatges i inconvenientsObjectius: 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Teoria
10h
Problemes
0h
Laboratori
14h
Aprenentatge dirigit
0h
Aprenentatge autònom
38h
Metodologia docent
L'assignatura es compon de teoria, i sessions de laboratori.Teoria: S'utilitzaran tècniques de classe invertida que requereixen que l'estudiant traballi materials multimedia abans de la classe. Les classes de teoria consisteixen en explicacions complementàries del professor i resolució de problemes.
Laboratori: S'utilitzaran eines representatives per a l'aplicació de conceptes teòrics (per exemple, PotgreSQL, Talend, HDFS, MongoDB). Es faran també dos projectes, en què els estudiants treballaran en equips: un d'anàlisi descriptiu de dades en un magatzem de dades i l'altre d'anàlisi predictiu en un entorn Big Data. Consequentment, hi haurà dos entregables fora de l'horari de classe, però els estudiants també seran avaluats individualment a l'aula sobre els coneixements adquirits durant cadascun dels projectes.
El curs té una component d'aprenentatge autònom, donat que els estudiants hauran de treballar amb diferents eines de gestió i processament de dades. A part del material de suport, els estudiants han de ser capaços de resoldre dubtes o problemes d'ús d'aquestes eines.
Mètode d'avaluació
Nota final = max(20%EP+40%EF ; 60% EF) + 40% PEP = nota de l'examen parcial
EF = nota de l'examen final
P = nota de projecte, com a promig ponderat dels projectes del curs
Pels estudiants que puguin concórrer a la reavalaució, la nota de examen de reavaluació substituirà EF.
Bibliografia
Bàsic
-
Database systems : the complete book
- Garcia-Molina, Hector; Ullman, Jeffrey D; Widom, Jennifer,
Pearson Education,
2013.
ISBN: 9781292024479
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004168919706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data warehouse design: modern principles and methodologies
- Golfarelli, M.; Rizzi, S,
McGraw Hill,
2009.
ISBN: 9780071610391
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003628169706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data warehouse systems: design and implentation
- Vaisman, A.; Zimányi, E,
Springer,
2022.
ISBN: 9783662651667
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005155876506711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Principles of distributed database systems
- Özsu, M.T.; Valduriez, P,
Springer,
2020.
ISBN: 9783030262525
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004193569706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
NoSQL distilled: a brief guide to the emerging world of polygot persistence
- Sadalage, P.J.; Fowler, M,
Addison-Wesley,
2013.
ISBN: 9780321826626
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003990429706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
SQL for data science : data cleaning, wrangling and analytics with relational databases
- Badia, Antonio,
Springer,
2020.
ISBN: 9783030575915
http://cataleg.upc.edu/record=99100491633840671~S1*cat -
Data Warehousing and OLAP
- Abelló, Alberto; Jovanovic, Petar,
-
Big Data Management
- Abelló, Albero; Nadal, Sergi,
-
Slides on Advanced Databases course
- Database Technologies and Information Management,
Complementari
-
Exercises Big Data Management
- ,
-
Exercises Data Warehousing
- ,
Web links
- Erasmus Mundus Master on Big Data Management and Analytics https://bdma.ulb.ac.be/bdma
- European Big Data Management and Analytics Summer School (eBISS) https://cs.ulb.ac.be/conferences/ebiss.html
Capacitats prèvies
Ser capaç de llegir i entendre materials en anglès.Ser capaç d'enumerar les etapes que conformen el procés de l'enginyeria de software.
Ser capaç d'entendre esquemes conceptuals en UML.
Ser capaç de crear, consultar i manipular bases de dades amb SQL.
Ser capaç de programar amb programació funcional tipus Spark.