Análisis Multivariante

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
EIO
El objetivo de la asignatura es introducir a los estudiantes en los fundamentos de los métodos de análisis de datos multivariantes y proporcionarles las herramientas para tratar el preprocesamiento, la visualización, la reducción de dimensiones, la clasificación y la modelización de datos multivariantes.

Profesorado

Responsable

  • Nihan Acar Denizli ( )

Otros

  • Ariel Duarte López ( )
  • Belchin Adriyanov Kostov ( )
  • Dante Conti ( )
  • Karina Gibert Oliveras ( )
  • Sergi Ramirez Mitjans ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
7.11

Competencias

Competencias Transversales

Uso solvente de los recursos de información

  • CT4 - Gestionar la adquisicion, la estructuracion, el analisis y la visualizacion de datos e informacion en el ambito de la especialidad y valorar de forma critica los resultados de esta gestion.

Lengua extranjera

  • CT5 - Conocer una tercera lengua, preferentemente el inglés, con un nivel adecuado oral y escrito y en consonancia con las necesidades que tendrán los titulados y tituladas.

Espíritu emprendedor e innovador

  • CT1 - Conocer y entender la organización de una empresa y las ciencias que rigen su actividad; tener capacidad para entender las normas laborales y las relaciones entre la planificación, las estrategias industriales y comerciales, la calidad y el beneficio. Conocer y entender los mecanismos en que se basa la investigación científica, así como los mecanismos e instrumentos de transferencia de resultados entre los diferentes agentes socioeconómicos implicados en los procesos de I+D+i.

Básicas

  • CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
  • CB10 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.

Competencias Técnicas Genéricas

Genéricas

  • CG2 - Identificar y aplicar métodos de análisis, extracción de conocimiento y visualización de datos recogidos en formatos muy diversos.
  • CG3 - Definir, diseñar e implementar sistemas complejos que cubran todas las fases en proyectos de ciencia de datos

Competencias Técnicas

Específicas

  • CE5 - Modelar, diseñar e implementar sistemas complejos de datos, incluyendo la visualización de datos
  • CE6 - Diseñar el proceso de Ciencia de Datos y aplicar metodologías científicas para obtener conclusiones sobre poblaciones y tomar decisiones en consecuencia, a partir de datos estructurados o no estructurados y potencialmente almacenados en formatos heterogéneos.
  • CE7 - Identificar las limitaciones impuestas por la calidad de datos en un problema de ciencia de datos y aplicar técnicas para disminuir su impacto
  • CE8 - Extraer información de datos estructurados y no estructurados, teniendo en cuenta la naturaleza multivariante de los mismos.
  • CE9 - Aplicar métodos adecuados para el análisis de otro tipo de formatos, tales como procesos y grafos, dentro del ámbito de ciencia de datos
  • CE10 - Identificar los métodos de aprendizaje automático y modelización estadística a utilizar para resolver un problema específico de ciencia de datos y aplicarlos de forma rigurosa
  • CE11 - Analizar y extraer conocimiento de información no estructurada mediante técnicas de procesamiento de lenguaje natural, minería de textos e imágenes
  • CE12 - Aplicar la ciencia de datos en proyectos multidisciplinares para resolver problemas en dominios nuevos o poco conocidos y que sean económicamente viables, socialmente aceptables, y de acuerdo con la legalidad vigente
  • CE13 - Identificar las principales amenazas en el ámbito de la ética y la privacidad de datos en un proyecto de ciencia de datos (tanto en el aspecto de gestión como de análisis de datos) y desarrollar e implantar medidas adecuadas para mitigar dichas amenazas.

Objetivos

  1. Visualización de los datos
    Competencias relacionadas: CT4, CT5, CT1, CG2, CE5, CB8,
  2. Descripción multivariante de los datos
    Competencias relacionadas: CT4, CE7, CE8, CE12, CE13, CB7, CB9, CB10,
  3. Métodos de reducción de dimensiones
    Competencias relacionadas: CT4, CT5, CG2, CE5, CE6, CE11, CE8, CE10, CB6, CB8, CB9, CB10,
  4. Inferencia multivariada
    Competencias relacionadas: CT1, CG2, CG3, CE6, CE11, CE8, CE9, CE10, CB6, CB7, CB9,
  5. Clasificación de nuevos individuos
    Competencias relacionadas: CT1, CG3, CE6, CE10, CB6, CB7,

Contenidos

  1. Introducción al Análisis de Datos Multivariado
    Preprocesamiento y visualización de datos multivariantes.
  2. Análisis de Componentes Principales
    Análisis de individuos. Análisis de variables. Representación visual de la información. Reducción de dimensionalidad. Información suplementaria. Descomposición en valores singulares.
  3. Escalamiento Multidimensional
    Reducción de la dimensión basada en matrices de similitud o distancia con aplicaciones.
  4. Análisis de Correspondencias
    Reducción de dimensiones de dos variables categóricas y visualización de relaciones entre categorías.
  5. Análisis de Correspondencias Multiple
    El análisis y visualización de relaciones entre categorías de más de dos variables categóricas mediante reducción de dimensión.
  6. Análisis de Cluster
    Dos enfoques para agrupar métodos utilizados para clasificar las observaciones, dentro de un conjunto de datos, en múltiples grupos en función de su semejanza.
  7. Métodos de profiling
    Los métodos de profiling ayudan a entender las características comunes de los clusters
  8. Distribución normal multivariante
    La función de densidad de probabilidad de distribución normal multivariada y pruebas de hipótesis de media para datos multivariados.
  9. Análisis Discriminante
    Clasificación de observaciones en grupos dados mediante el uso de análisis discriminante lineal, análisis discriminante cuadrático y métodos Naive Bayes.
  10. Reglas de asociación
    Encontrar patrones, asociaciones, correlaciones o estructuras causales frecuentes entre conjuntos de elementos u objetos en bases de datos de transacciones, bases de datos relacionales y otros repositorios de información.

Actividades

Actividad Acto evaluativo


Presentación de la asignatura + Análisis Multivariante de datos


Objetivos: 2 1
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Analysis de Componentes Principales


Objetivos: 2 1 3
Teoría
4h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Escalamiento Multidimensional


Objetivos: 2 1 3
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Análisis de Correspondencies i Análisis Correspondencies Multiple


Objetivos: 2 1 3
Teoría
4h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Análisis de Cluster and Profiling


Objetivos: 2 5 3
Teoría
4h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Distribución normal multivariada e hipótesis tests de media para datos multivariados


Objetivos: 2 4
Teoría
4h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Análisis Discriminante


Objetivos: 4 5 1
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Reglas de asociación


Objetivos: 2 4
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h

Sessión de Dudas



Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Practicas


Objetivos: 2 1 3
Teoría
0h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Tarea 1

La aplicación e interpretación de los métodos de reducción de dimensión vistos durante la primera parte de la asignatura sobre un caso de estudio.
Objetivos: 2 1 3
Semana: 8 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.5h

Tarea 2

En esta tarea el alumno tiene que aplicar los métodos de clasificación sobre un caso de estudio e interpretar los resultados. Esta tarea se realiza en grupos de tres alumnos.
Objetivos: 4 5 3
Semana: 13 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.5h

Examen Final

Al examen final el alumnado será responsable de todos los métodos que haya visto a lo largo del semestre. Habrá preguntas tanto teóricas como de interpretación basadas en resultados R al examen.
Objetivos: 2 4 5 1 3
Semana: 15 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Proyecto Final

El proyecto final incluye la aplicación e interpretación de los métodos de análisis de datos multivariantes sobre un conjunto de datos reales que se podrían seleccionar en función de los intereses de los estudiantes. Se tiene que hacer en grupos de tres alumnos.
Objetivos: 2 4 5 1 3
Semana: 14 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
20h

Metodología docente

Esta asignatura pretende dar una explicación teórica de diferentes métodos para el análisis de datos multivariantes y sus aplicaciones en conjuntos de datos reales. En las clases de teoría se explicarán los cimientos y la estructura teórica de los métodos mientras que a las sesiones de laboratorio se hará la aplicación de métodos considerados sobre diferentes conjuntos de datos a R. Los proyectos y los deberes de la asignatura se harán en grupos que permitan a los estudiantes colaborar para construir un trabajo en equipo.

Método de evaluación

Durante el curso los estudiantes tendrán que librar dos deberes (tareas) y un trabajo final que se tendrá que realizar en grupos de tres estudiantes. Los primeros deberes se centran en la aplicación de métodos de reducción de dimensión mientras que los según se centran en métodos de clasificación.En el proyecto final de la asignatura los estudiantes tendrán que trabajar en un conjunto de datos reales que descargan o rastrean webs y aplicar los métodos vistos durante el curso en los conjuntos de datos escogidos. Los resultados se tienen que presentar en un informe escrito en formato pdf.

La nota global de los estudiantes será del 15% por la primera tarea, del 15% por la segunda, del %40 por el proyecto final y del 30% por el examen final.

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

La asignatura supone haber efectuado previamente un curso básico de estadística, programación y matemáticas, en particular tener adquiridos los conceptos:
-Análisis estadístico descriptivo
-Concepto de prueba de hipòtesis.
-Operaciones de algebra matricial, valores y vectores propis.
-Programación de algoritmos.
-Regresión lineal múltiple.