Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos
, pero tiene capacidades previas
Departamento
EIO
Profesorado
Responsable
- Nihan Acar Denizli (nihan.acar.denizli@upc.edu)
Otros
- Belchin Adriyanov Kostov (belchin.adriyanov.kostov@upc.edu)
Horas semanales
Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
7.11
Competencias
Uso solvente de los recursos de información
Lengua extranjera
Espíritu emprendedor e innovador
Básicas
Genéricas
Específicas
Objetivos
-
Visualización de los datos
Competencias relacionadas: CT4, CT5, CT1, CG2, CE5, CB8, -
Descripción multivariante de los datos
Competencias relacionadas: CT4, CE7, CE8, CE12, CE13, CB7, CB9, CB10, -
Métodos de reducción de dimensiones
Competencias relacionadas: CT4, CT5, CG2, CE5, CE6, CE11, CE8, CE10, CB6, CB8, CB9, CB10, -
Inferencia multivariada
Competencias relacionadas: CT1, CG2, CG3, CE6, CE11, CE8, CE9, CE10, CB6, CB7, CB9, -
Clasificación de nuevos individuos
Competencias relacionadas: CT1, CG3, CE6, CE10, CB6, CB7,
Contenidos
-
Introducción al Análisis de Datos Multivariado
Preprocesamiento y visualización de datos multivariantes. -
Análisis de Componentes Principales
Análisis de individuos. Análisis de variables. Representación visual de la información. Reducción de dimensionalidad. Información suplementaria. Descomposición en valores singulares. -
Escalamiento Multidimensional
Reducción de la dimensión basada en matrices de similitud o distancia con aplicaciones. -
Análisis de Correspondencias
Reducción de dimensiones de dos variables categóricas y visualización de relaciones entre categorías. -
Análisis de Correspondencias Multiple
El análisis y visualización de relaciones entre categorías de más de dos variables categóricas mediante reducción de dimensión. -
Análisis de Cluster
Dos enfoques para agrupar métodos utilizados para clasificar las observaciones, dentro de un conjunto de datos, en múltiples grupos en función de su semejanza. -
Métodos de profiling
Los métodos de profiling ayudan a entender las características comunes de los clusters -
Distribución normal multivariante
La función de densidad de probabilidad de distribución normal multivariada y pruebas de hipótesis de media para datos multivariados. -
Análisis Discriminante
Clasificación de observaciones en grupos dados mediante el uso de análisis discriminante lineal, análisis discriminante cuadrático y métodos Naive Bayes. -
Reglas de asociación
Encontrar patrones, asociaciones, correlaciones o estructuras causales frecuentes entre conjuntos de elementos u objetos en bases de datos de transacciones, bases de datos relacionales y otros repositorios de información.
Actividades
Actividad Acto evaluativo
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.5h
Sessión de Dudas
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Tarea 2
En esta tarea el alumno tiene que aplicar los métodos de clasificación sobre un caso de estudio e interpretar los resultados. Esta tarea se realiza en grupos de tres alumnos.Objetivos: 4 5 3
Semana: 13 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Examen Final
Al examen final el alumnado será responsable de todos los métodos que haya visto a lo largo del semestre. Habrá preguntas tanto teóricas como de interpretación basadas en resultados R al examen.Objetivos: 2 4 5 1 3
Semana: 15 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Proyecto Final
El proyecto final incluye la aplicación e interpretación de los métodos de análisis de datos multivariantes sobre un conjunto de datos reales que se podrían seleccionar en función de los intereses de los estudiantes. Se tiene que hacer en grupos de tres alumnos.Objetivos: 2 4 5 1 3
Semana: 14 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Metodología docente
Esta asignatura pretende dar una explicación teórica de diferentes métodos para el análisis de datos multivariantes y sus aplicaciones en conjuntos de datos reales. En las clases de teoría se explicarán los cimientos y la estructura teórica de los métodos mientras que a las sesiones de laboratorio se hará la aplicación de métodos considerados sobre diferentes conjuntos de datos a R. Los proyectos y los deberes de la asignatura se harán en grupos que permitan a los estudiantes colaborar para construir un trabajo en equipo.Método de evaluación
Durante el curso los estudiantes tendrán que librar dos deberes (tareas) y un trabajo final que se tendrá que realizar en grupos de tres estudiantes. Los primeros deberes se centran en la aplicación de métodos de reducción de dimensión mientras que los según se centran en métodos de clasificación.En el proyecto final de la asignatura los estudiantes tendrán que trabajar en un conjunto de datos reales que descargan o rastrean webs y aplicar los métodos vistos durante el curso en los conjuntos de datos escogidos. Los resultados se tienen que presentar en un informe escrito en formato pdf.La nota global de los estudiantes será del 15% por la primera tarea, del 15% por la segunda, del %40 por el proyecto final y del 30% por el examen final.
Bibliografía
Básico
-
Applied multivariate statistical analysis
- Johnson, Richard A.; Wichern, Dean W,
Pearson Education Limited,
[2014].
ISBN: 9781292024943
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=5174865 -
Exploratory multivariate analysis by example using R
- Husson, F.; Lê, S.; Pagès, J,
CRC Press, Taylor & Francis Group,
2017.
ISBN: 9781315301860
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=4856173 -
Multivariate statistical methods : a primer
- Manly, Bryan F. J,
CRC Press, Taylor & Francis Group,
[2017].
ISBN: 9781498728966
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004178359706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementario
-
Análisis de datos multivariantes
- Peña, Daniel,
McGraw-Hill/Interamericana de España, S.L,
[2010].
ISBN: 9788448136109
https://www-ingebook-com.recursos.biblioteca.upc.edu/ib/NPcd/IB_BooksVis?cod_primaria=1000187&codigo_libro=4203
Web links
- Homepage of R https://cran.r-project.org/
- R for Data Science (2e) https://r4ds.hadley.nz/
- R Cookbook https://rc2e.com/
- Rstudio homepage https://rstudio.com/
Capacidades previas
La asignatura supone haber efectuado previamente un curso básico de estadística, programación y matemáticas, en particular tener adquiridos los conceptos:-Análisis estadístico descriptivo
-Concepto de prueba de hipòtesis.
-Operaciones de algebra matricial, valores y vectores propis.
-Programación de algoritmos.
-Regresión lineal múltiple.