Data Warehousing

Créditos
6
Tipos
Obligatoria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
ESSI
La asignatura introduce los conceptos de bases de datos orientados a la inteligencia empresarial. En concreto, esto incluye bases de datos multidimensionales y almacenes de datos (DW), así como los procesos ETL (Extract, Transform, Load). Serán introducidas las técnicas necesarias para diseñar, implementar, explotar, y mantener los almacenes de datos.

Se dará una atención especial a los problemas que plantea la integración de datos heterogéneos y la calidad de los datos. Los estudiantes aprenderán cómo definir, medir y mantener la calidad de los datos en el contexto del almacenamiento de datos. Se explican las nociones clásicas de almacén de datos y OLAP: ETL, arquitectura, diseño lógico y conceptual, procesamiento de consultas y optimización. Al final de curso, el estudiante sabrá diseñar, construir y consultar un almacén de datos de manera eficiente.

Profesores

Responsable

  • Alberto Abello Gamazo ( )

Otros

  • Petar Jovanovic ( )

Horas semanales

Teoría
1.9
Problemas
0
Laboratorio
1.9
Aprendizaje dirigido
0
Aprendizaje autónomo
96

Competencias

Competencias Técnicas de cada especialidad

Service engineering

  • CEE5.1 - Capacidad para participar en proyectos de mejora o creación de sistemas de servicios, aportando especialmente: a) propuestas de innovación e investigación basadas en nuevos usos y desarrollos de las tecnologías de la información b) la aplicación de los principios de la ingeniería del software y las bases de datos en el desarrollo de los sistemas de información que sean más adecuados, c) la determinación, instalación y gestión de la infraestructura/plataforma informática necesaria para el funcionamento eficiente de los sistemas de servicio.
  • CEE5.3 - Capacidad para trabajar en equipos interdisciplinarios de ingeniería de servicios y, disponiendo de la experiencia de dominio necesaria, capacidad para trabajar autónomamente en sistemas de servicios concretos.

Específicas comunes

  • CEC2 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.

Competencias Técnicas Genéricas

Genéricas

  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.

Competencias Transversales

Trabajo en equipo

  • CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.

Básicas

  • CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Objetivos

  1. Ser capaz de modelar almacenes de datos multidimensionales
    Competencias relacionadas: CEE5.1, CEE5.3, CG3, CB7, CB9, CEC2, CTR3,
  2. Ser capaz de aplicar técnicas específicas de diseño físico para sistemas decisionales
    Competencias relacionadas: CEE5.1, CEE5.3, CG3, CB7, CB9, CEC2, CTR3,
  3. Ser capaz de diseñar e implementar procesos de migración de datos (ETL)
    Competencias relacionadas: CEE5.1, CEE5.3, CG3, CB7, CB9, CEC2, CTR3,

Contenidos

  1. Introducción
    Comparación entre sistemas operacionales y decisionales; Metadatos.
  2. Arquitectura de almacenamiento de datos.
    Factoria de Información Corporativa. DW 2.0
  3. Modelado multidimensional y herramientas OLAP
    Estructura; restricciones de integridad, operaciones, conceptos avanzados.
  4. Diseño físico de bases de datos para consultas analiticas
    Star-join e indices-join; Bitmaps; Vistas materializadas; Datos espacio-temporales
  5. Extracción, transformación y carga
    Calidad de los datos; Integración; Gestión de ETL.

Actividades

Actividad Acto evaluativo


Clases de teoría

En estas actividades, el profesor introducirá los conceptos teóricos básicos de esta asignatura. Además de las exposiciones, se usarán técnicas de aprendizaje cooperativo. Esto requerirá la participación activa de los estudiantes y, consecuentemente, serán evaluados.
Objetivos: 1 2 3
Contenidos:
Teoría
25h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
25h

Clases de laboratorio

Al estudiante se le pedirá que practique los diferentes conceptos introducidos en las clases teóricas. Esto incluye resolver problemas en el ordenador o en papel.
Objetivos: 1 2 3
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
27h
Aprendizaje dirigido
0h
Aprendizaje autónomo
54h

Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
17h

Metodología docente

La asignatura se compone de teoría, y sesiones de laboratorio.

Teoría: las clases de teoría consisten en explicaciones del profesor and problem solving. Los estudiantes también deberán leer algunos contenidos fuera de clase.

Laboratorio: Principalmente, las sesiónes de laboratorio estarán dedicadas a la práctica (con o sin ordenador) de los conceptos introducidos en las clases de teoría, mediante ejercicios que serán hechos durante las horas de clase. Algunas herramientas serán usadas para el diseño y práctica en un SGBD o herramienta específica (p.e., Oracle). Habrá tres entregables de proyecto que se realizarán fuera de horas de clase.

Método de evaluación

Nota final = 60%E + 40%P

P = Media ponderada de las notas de los tres entregables de proyecto
E = Examen

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

Conocimiento básico de bases de datos relacionales y SQL.

Especificamente, se asumira conocimientos de:
- Diagramas de classes UML
- Algebra relacional
- Consultas SQL
- Vistas relacionales
- Operaciones de árboles-B (inserciones y splits)
- Conceptes bàsics d'optimització física de consultes