La asignatura introduce los conceptos de bases de datos orientados a la inteligencia empresarial. En concreto, esto incluye bases de datos multidimensionales y almacenes de datos (DW), así como los procesos ETL (Extract, Transform, Load) y conceptos básicos de cuadros de mando. Serán introducidas las técnicas necesarias para diseñar, implementar, explotar, y mantener los almacenes de datos, con especial atención a datos espacio-temporales.
Se dará una atención especial a los problemas que plantea la integración de datos heterogéneos y la calidad de los datos. Los estudiantes aprenderán cómo definir, medir y mantener la calidad de los datos en el contexto del almacenamiento de datos. Se explican las nociones clásicas de almacén de datos y OLAP: ETL, arquitectura, diseño lógico y conceptual, procesamiento de consultas y optimización. Al final de curso, el estudiante sabrá diseñar, construir y consultar un almacén de datos de manera eficiente, para poder crear gràficas descriptivas.   
  
    Profesorado
          Responsable
      
    
          Otros
      
                  - 
            Uchechukwu Fortune Njoku ( 
 
    )          
- 
            Xavier Oriol Hilari ( 
 
    )          
Horas semanales
    
      
        
        
        
        
        
          
            Aprendizaje autónomo
          
          
            6.85          
         
       
     
  
  
    Competencias
          Competencias Transversales
              Trabajo en equipo
        
                      - 
              CT3 - Ser capaz de trabajar como miembro de un equipo interdisciplinar ya sea como un miembro mas, o realizando tareas de direccion con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.                          
Lengua extranjera
        
                      - 
              CT5 - Conocer una tercera lengua, preferentemente el inglés, con un nivel adecuado oral y escrito y en consonancia con las necesidades que tendrán los titulados y tituladas.                          
Espíritu emprendedor e innovador
        
                      - 
              CT1 - Conocer y entender la organización de una empresa y las ciencias que rigen su actividad; tener capacidad para entender las normas laborales y las relaciones entre la planificación, las estrategias industriales y comerciales, la calidad y el beneficio. Conocer y entender los mecanismos en que se basa la investigación científica, así como los mecanismos e instrumentos de transferencia de resultados entre los diferentes agentes socioeconómicos implicados en los procesos de I+D+i.                          
Básicas
        
                      - 
              CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.                          
- 
              CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones  sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.                          
- 
              CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin  ambigüedades.                          
- 
              CB9 - Que los estudiantes posean las habilidades de aprendizaje que  les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.                          
- 
              CB10 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.                          
Competencias Técnicas Genéricas
              Genéricas
        
                      - 
              CG1 - Identificar y aplicar los métodos y procesos de gestión de datos más adecuados para gestionar el ciclo de vida de los datos, incluyendo datos estructurados y no estructurados                          
Competencias Técnicas
              Específicas
        
                      - 
              CE2 - Aplicar los fundamentos de la gestión y procesamiento de datos en un problema de ciencia de datos                           
- 
              CE3 - Aplicar métodos de integración de datos para dar solución a problemas de ciencia de datos en entornos heterogéneos                          
- 
              CE5 - Modelar, diseñar e implementar sistemas complejos de datos, incluyendo la visualización de datos                           
- 
              CE7 - Identificar las limitaciones impuestas por la calidad de datos en un problema de ciencia de datos y aplicar técnicas para disminuir su impacto                          
Objetivos
    
              - 
          Ser capaz de modelar almacenes de datos multidimensionales y analizar sus datos de forma visual           
 Competencias relacionadas:
                      CB10,
                      CB6,
                      CB7,
                      CB8,
                      CB9,
                      CT1,
                      CT3,
                      CT5,
                      CE3,
                      CE5,
- 
          Ser capaz de aplicar técnicas específicas de diseño físico para sistemas decisionales          
 Competencias relacionadas:
                      CB6,
                      CB7,
                      CB8,
                      CB9,
                      CT3,
                      CT5,
                      CE2,
                      CE5,
                      CG1,
- 
          Ser capaz de diseñar e implementar procesos de migración de datos (ETL)          
 Competencias relacionadas:
                      CB10,
                      CB6,
                      CB7,
                      CB8,
                      CB9,
                      CT3,
                      CT5,
                      CE2,
                      CE3,
                      CE5,
                      CE7,
                      CG1,
Contenidos
      
    
              - 
          Introducción          
 Comparación entre sistemas operacionales y decisionales; Metadatos.
- 
          Arquitectura de almacenamiento de datos.          
 Factoria de Información Corporativa. DW 2.0
- 
          Modelado multidimensional, herramientas OLAP          
 Estructura; restricciones de integridad, operaciones, conceptos avanzados.
- 
          Diseño físico de bases de datos para consultas analiticas                  
 Star-join e indices-join; Bitmaps; Vistas materializadas; Datos espacio-temporales
- 
          Extracción, transformación y carga          
 Calidad de los datos; Integración de datos y esquemas; Gestión de ETL
- 
          Visualización y análisis descriptivo de la información          
 Indicadores de Rendimiento Empresarial; Cuadros de Mando
Actividades
    
      Actividad
      Acto evaluativo
    
    
    
                      
          
            
              Clases de teoría
              En estas actividades, el profesor introducirá los conceptos teóricos básicos de esta asignatura. Además de las exposiciones, se usarán técnicas de aprendizaje cooperativo. Esto requerirá la participación activa de los estudiantes y, consecuentemente, serán evaluados.              
              
                              
Objetivos:
                                  1
                                  3
                                  2
                                            
                              Contenidos:
                
                                          
             
            
           
         
        
                      
          
            
              Clases de laboratorio
              Al estudiante se le pedirá que practique los diferentes conceptos introducidos en las clases teóricas. Esto incluye resolver problemas en el ordenador o en papel.              
              
                              
Objetivos:
                                  1
                                  3
                                  2
                                            
                              Contenidos:
                
                                          
             
            
           
         
        
                      
          
            
              Examen
              Examen escrito de los conceptos teóricos introducidos durante el curso.              
              
                              
Objetivos:
                                  1
                                  3
                                  2
                                            
                              Contenidos:
                
                                          
             
            
           
         
        
           
  
  
    Metodología docente
     
    La asignatura se compone de teoría, y sesiones de laboratorio. 
Magistrales: El profesor expone el tema. Los estudiantes siguen la lección, toman apuntes y preparan material adicional fuera de clase. También se les puede pedir que lleven a cabo actividades evaluatorias dentro de estas sesiones. 
Laboratorio: Se utilizarán algunas herramientas representativas para la aplicación de conceptos teóricos (por ejemplo, PotgreSQL, Oracle, Talend, Tableau). El curso incluye prácticas continuas a través de un proyecto del curso, dividido en tres bloques lógicos: modelado de almacén de datos, integración y migración de datos (ETL), y visualización descriptiva, en los que los estudiantes trabajarán en equipos. Habrá tres entregables del proyecto fuera del horario de clase, pero los estudiantes también serán evaluados individualmente en el aula sobre los conocimientos adquiridos durante cada bloque del proyecto.   
  
    Método de evaluación
      Final grade = max(20%EP+40%EF ; 60% EF) + 40% P
 
EP = partial (mid term) exam mark
EF = final exam mark
P = Weighted average of the marks of the project deliverables  
  
    Bibliografía
          Básica:
      
                  - 
            Data warehouse design: modern principles and methodologies -
            Golfarelli, M.; Rizzi, S,
            McGraw Hill,            2009.            ISBN: 9780071610391            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003628169706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Multidimensional databases and data warehousing -
            Jensen, C.S.; Pedersen, T.B.; Thomsen, C.W,
            Morgan & Claypool,            2010.            ISBN: 9781608455379            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003948319706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Corporate information factory -
            Inmon, William H; Imhoff, Claudia; Sousa, Ryan,
            John Wiley,            2001.            ISBN: 0471399612            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003133419706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            The data warehouse lifecycle toolkit -
            Kimball, R. [et al.],
            Wiley publishing,            2008.            ISBN: 9780470149775            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003464519706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Database systems: the complete book -
            Garcia-Molina, H.; Ullman, J.D.; Widom, J,
            Pearson Education Limited,            2014.            ISBN: 9781292024479            
 https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=5174436
- 
            Data warehouse systems: design and implentation -
            Vaisman, A.; Zimanyi, E,
            Springer,            2014.            ISBN: 9783642546549            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004038639706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Data warehousing and analytics: fueling the data engine -
            Taniar, D.; Rahayu, W,
            Springer,            2021.            ISBN: 9783030819781            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005193379806711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementaria:
      
                  - 
            Database modeling and design: logical design -
            Teorey, Toby ... [et al.], Morgan Kaufmann Publishers/Elsevier            ,
            2011.
            ISBN: 9780123820204            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004000559706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Physical database design: the database professional's guide to exploiting indexes, views, storage, and more -
            Lightstone, S.; Teorey, T.J.; Nadeau, T, Morgan Kaufmann Publishers            ,
            2007.
            ISBN: 9780123693891            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003252949706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Database management systems -
            Ramakrishnan, R.; Gehrke, J, McGraw-Hill            ,
            2003.
            ISBN: 0071151109            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002855579706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
- 
            Cost-based oracle fundamentals -
            Lewis, J, Apress            ,
            2006.
            ISBN: 9781590596364            
 https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003403389706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Capacidades previas
    Conocimiento básico de bases de datos relacionales y SQL.
Especificamente, se asumira conocimientos de:
- Diagramas de classes UML
- Algebra relacional
- Consultas SQL
- Vistas relacionales
- Operaciones de árboles-B (inserciones y splits)
- Conceptes bàsics d'optimització física de consultes