Data Warehousing

Créditos
6
Tipos
Obligatoria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
ESSI
La asignatura introduce los conceptos de bases de datos orientados a la inteligencia empresarial. En concreto, esto incluye bases de datos multidimensionales y almacenes de datos (DW), así como los procesos ETL (Extract, Transform, Load) y conceptos básicos de cuadros de mando. Serán introducidas las técnicas necesarias para diseñar, implementar, explotar, y mantener los almacenes de datos, con especial atención a datos espacio-temporales.

Se dará una atención especial a los problemas que plantea la integración de datos heterogéneos y la calidad de los datos. Los estudiantes aprenderán cómo definir, medir y mantener la calidad de los datos en el contexto del almacenamiento de datos. Se explican las nociones clásicas de almacén de datos y OLAP: ETL, arquitectura, diseño lógico y conceptual, procesamiento de consultas y optimización. Al final de curso, el estudiante sabrá diseñar, construir y consultar un almacén de datos de manera eficiente, para poder crear gràficas descriptivas.

Profesorado

Otros

  • Petar Jovanovic ( )

Horas semanales

Teoría
1.9
Problemas
0
Laboratorio
1.9
Aprendizaje dirigido
0
Aprendizaje autónomo
96

Objetivos

  1. Ser capaz de modelar almacenes de datos multidimensionales y analizar sus datos de forma visual
    Competencias relacionadas: CB7, CB8, CB9, CTR3, CEC2, CEE5.1, CEE5.3, CG3, CB6,
  2. Ser capaz de aplicar técnicas específicas de diseño físico para sistemas decisionales
    Competencias relacionadas: CB7, CB8, CB9, CTR3, CEC2, CEE5.1, CEE5.3, CG3,
  3. Ser capaz de diseñar e implementar procesos de migración de datos (ETL)
    Competencias relacionadas: CB6, CB7, CB8, CB9, CTR3, CEC2, CEE5.1, CEE5.3, CG3,

Contenidos

  1. Introducción
    Comparación entre sistemas operacionales y decisionales; Metadatos.
  2. Arquitectura de almacenamiento de datos.
    Factoria de Información Corporativa. DW 2.0
  3. Modelado multidimensional, herramientas OLAP
    Estructura; restricciones de integridad, operaciones, conceptos avanzados.
  4. Diseño físico de bases de datos para consultas analiticas
    Star-join e indices-join; Bitmaps; Vistas materializadas; Datos espacio-temporales
  5. Extracción, transformación y carga
    Calidad de los datos; Integración de datos y esquemas; Gestión de ETL
  6. Visualización y análisis descriptivo de la información
    Indicadores de Rendimiento Empresarial; Cuadros de Mando

Actividades

Actividad Acto evaluativo


Clases de teoría

En estas actividades, el profesor introducirá los conceptos teóricos básicos de esta asignatura. Además de las exposiciones, se usarán técnicas de aprendizaje cooperativo. Esto requerirá la participación activa de los estudiantes y, consecuentemente, serán evaluados.
Objetivos: 1 2 3
Contenidos:
Teoría
25h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
25h

Clases de laboratorio

Al estudiante se le pedirá que practique los diferentes conceptos introducidos en las clases teóricas. Esto incluye resolver problemas en el ordenador o en papel.
Objetivos: 1 2 3
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
27h
Aprendizaje dirigido
0h
Aprendizaje autónomo
54h

Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
17h

Metodología docente

La asignatura se compone de teoría, y sesiones de laboratorio.

Teoría: Se utilizarán tècnicas de classe invertida que requiren que els estudiante trabaje los materiales multimedia antes de la classe. Las clases de teoría consisten en explicaciones complementarias del profesor y resolución de problemas.

Laboratorio: Se utilizarán algunas herramientas representativas para la aplicación de conceptos teóricos (por ejemplo, Indyco Builder, PotgreSQL, Oracle, Pentaho Data Integration, Tableau). El curso incluye prácticas continuas a través de un proyecto del curso, dividido en tres bloques lógicos: modelado de almacén de datos, integración y migración de datos (ETL), y visualización descriptiva, en los que los estudiantes trabajarán en equipos. Habrá tres entregables del proyecto fuera del horario de clase, pero los estudiantes también serán evaluados individualmente en el aula sobre los conocimientos adquiridos durante cada bloque del proyecto.

Método de evaluación

Final Mark = min(10 ; 60%E + 40%L + 10%P)

L = Weighted average of the marks of the three lab deliverables
E = Final exam
P = Participation in the class

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

Conocimiento básico de bases de datos relacionales y SQL.

Especificamente, se asumira conocimientos de:
- Diagramas de classes UML
- Algebra relacional
- Consultas SQL
- Vistas relacionales
- Operaciones de árboles-B (inserciones y splits)
- Conceptes bàsics d'optimització física de consultes