Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos
, pero tiene capacidades previas
Departamento
ESSI
Web
https://learnsql.fib.upc.es/moodle
Se dará una atención especial a los problemas que plantea la integración de datos heterogéneos y la calidad de los datos. Los estudiantes aprenderán cómo definir, medir y mantener la calidad de los datos en el contexto del almacenamiento de datos. Se explican las nociones clásicas de almacén de datos y OLAP: ETL, arquitectura, diseño lógico y conceptual, procesamiento de consultas y optimización. Al final de curso, el estudiante sabrá diseñar, construir y consultar un almacén de datos de manera eficiente, para poder crear gràficas descriptivas.
Profesorado
Responsable
- Petar Jovanovic ( petar.jovanovic@upc.edu )
Otros
- Xavier Oriol Hilari ( xavier.oriol@upc.edu )
Horas semanales
Teoría
1.9
Problemas
0
Laboratorio
1.9
Aprendizaje dirigido
0
Aprendizaje autónomo
6.85
Competencias
Trabajo en equipo
Lengua extranjera
Espíritu emprendedor e innovador
Básicas
Genéricas
Específicas
Objetivos
-
Ser capaz de modelar almacenes de datos multidimensionales y analizar sus datos de forma visual
Competencias relacionadas: CT3, CT5, CT1, CE3, CE5, CB6, CB7, CB8, CB9, CB10, -
Ser capaz de aplicar técnicas específicas de diseño físico para sistemas decisionales
Competencias relacionadas: CT3, CT5, CG1, CE2, CE5, CB6, CB7, CB8, CB9, -
Ser capaz de diseñar e implementar procesos de migración de datos (ETL)
Competencias relacionadas: CT3, CT5, CG1, CE2, CE3, CE5, CE7, CB6, CB7, CB8, CB9, CB10,
Contenidos
-
Introducción
Comparación entre sistemas operacionales y decisionales; Metadatos. -
Arquitectura de almacenamiento de datos.
Factoria de Información Corporativa. DW 2.0 -
Modelado multidimensional, herramientas OLAP
Estructura; restricciones de integridad, operaciones, conceptos avanzados. -
Diseño físico de bases de datos para consultas analiticas
Star-join e indices-join; Bitmaps; Vistas materializadas; Datos espacio-temporales -
Extracción, transformación y carga
Calidad de los datos; Integración de datos y esquemas; Gestión de ETL -
Visualización y análisis descriptivo de la información
Indicadores de Rendimiento Empresarial; Cuadros de Mando
Actividades
Actividad Acto evaluativo
Clases de teoría
En estas actividades, el profesor introducirá los conceptos teóricos básicos de esta asignatura. Además de las exposiciones, se usarán técnicas de aprendizaje cooperativo. Esto requerirá la participación activa de los estudiantes y, consecuentemente, serán evaluados.Objetivos: 1 3 2
Contenidos:
Teoría
25h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
25h
Clases de laboratorio
Al estudiante se le pedirá que practique los diferentes conceptos introducidos en las clases teóricas. Esto incluye resolver problemas en el ordenador o en papel.Objetivos: 1 3 2
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
27h
Aprendizaje dirigido
0h
Aprendizaje autónomo
54h
Metodología docente
La asignatura se compone de teoría, y sesiones de laboratorio.Magistrales: El profesor expone el tema. Los estudiantes siguen la lección, toman apuntes y preparan material adicional fuera de clase. También se les puede pedir que lleven a cabo actividades evaluatorias dentro de estas sesiones.
Laboratorio: Se utilizarán algunas herramientas representativas para la aplicación de conceptos teóricos (por ejemplo, PotgreSQL, Oracle, Talend, Tableau). El curso incluye prácticas continuas a través de un proyecto del curso, dividido en tres bloques lógicos: modelado de almacén de datos, integración y migración de datos (ETL), y visualización descriptiva, en los que los estudiantes trabajarán en equipos. Habrá tres entregables del proyecto fuera del horario de clase, pero los estudiantes también serán evaluados individualmente en el aula sobre los conocimientos adquiridos durante cada bloque del proyecto.
Método de evaluación
Final grade = max(20%EP+40%EF ; 60% EF) + 40% PEP = partial (mid term) exam mark
EF = final exam mark
P = Weighted average of the marks of the project deliverables
Bibliografía
Básico
-
Data warehouse design: modern principles and methodologies
- Golfarelli, M.; Rizzi, S,
McGraw Hill,
2009.
ISBN: 9780071610391
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003628169706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Multidimensional databases and data warehousing
- Jensen, C.S.; Pedersen, T.B.; Thomsen, C.W,
Morgan & Claypool,
2010.
ISBN: 9781608455379
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003948319706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Corporate information factory
- Inmon, William H; Imhoff, Claudia; Sousa, Ryan,
John Wiley,
2001.
ISBN: 0471399612
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003133419706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The data warehouse lifecycle toolkit
- Kimball, R. [et al.],
Wiley publishing,
2008.
ISBN: 9780470149775
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003464519706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database systems: the complete book
- Garcia-Molina, H.; Ullman, J.D.; Widom, J,
Pearson Education Limited,
2014.
ISBN: 9781292024479
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=5174436 -
Data warehouse systems: design and implentation
- Vaisman, A.; Zimanyi, E,
Springer,
2014.
ISBN: 9783642546549
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004038639706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data warehousing and analytics: fueling the data engine
- Taniar, D.; Rahayu, W,
Springer,
2021.
ISBN: 9783030819781
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005193379806711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementario
-
Database modeling and design: logical design
- Teorey, Toby ... [et al.],
Morgan Kaufmann Publishers/Elsevier,
2011.
ISBN: 9780123820204
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004000559706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Physical database design: the database professional's guide to exploiting indexes, views, storage, and more
- Lightstone, S.; Teorey, T.J.; Nadeau, T,
Morgan Kaufmann Publishers,
2007.
ISBN: 9780123693891
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003252949706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database management systems
- Ramakrishnan, R.; Gehrke, J,
McGraw-Hill,
2003.
ISBN: 0071151109
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002855579706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Cost-based oracle fundamentals
- Lewis, J,
Apress,
2006.
ISBN: 9781590596364
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003403389706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Web links
- Summer school http://cs.ulb.ac.be/conferences/ebiss.html
- Transforming Data With Intelligence (former Data Warehouse Institute) http://tdwi.org
- MSCA-ITN-Erasmus Joint Doctorate on Data Engineering for Data Science https://deds.ulb.ac.be
Capacidades previas
Conocimiento básico de bases de datos relacionales y SQL.Especificamente, se asumira conocimientos de:
- Diagramas de classes UML
- Algebra relacional
- Consultas SQL
- Vistas relacionales
- Operaciones de árboles-B (inserciones y splits)
- Conceptes bàsics d'optimització física de consultes