Pasar al contenido principal

Análisis de Datos

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos , pero tiene capacidades previas
Departamento
EIO
El objetivo de la asignatura de Análisis de Datos es proporcionar la filosofía y las principales metodologías para la extracción de la información contenida en los datos. Comprende desde la preparación de los datos, el análisis exploratorio, la visualización de la información, la modelización de los patrones de comportamiento y su implementación en sistemas informáticos.

Profesorado

Responsable

Otros

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Competencias técnicas

  • CE1 - Utilizar con destreza los conceptos y métodos matemáticos que subyacen los problemas de la ciencia y la ingeniería de los datos.
  • CE2 - Ser capaz de programar soluciones a problemas de ingeniería: Diseñar soluciones algorítmicas eficientes a un problema computacional dado, implementarlas en forma de Programa robusto, estructurado y mantenible, y comprobar la validez de la solución.
  • CE3 - Analizar fenómenos complejos mediante la probabilidad y estadística, y plantear modelos de estos tipos en situaciones concretas. Formular y resolver problemas de optimización matemática.
  • CE4 - Utilizar los sistemas de computación actuales, incluidos sistemas de alto rendimiento, para el proceso de grandes volúmenes de datos desde el conocimiento de su estructura, funcionamiento y particularidades.
  • CE8 - Capacidad de elegir y emplear técnicas de modelización estadística y análisis de datos, evaluando la calidad de los modelos, validándolos e interpretándolos.
  • Transversales

  • CT3 - Comunicación eficaz oral y escrita. Comunicarse de forma oral y escrita con otras personas sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones; participar en debates sobre temas de la propia especialidad.
  • CT4 - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
  • CT5 [Avaluable] - Uso solvente de los recursos de información. Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información en el ámbito de especialidad y valorar de forma crítica los resultados de dicha gestión.
  • CT6 - Aprendizaje autónomo. Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar dicho conocimiento.
  • CT7 [Avaluable] - Tercera lengua. Conocer una tercera lengua, preferentemente el inglés, con un nivel adecuado oral y escrito y en consonancia con las necesidades que tendrán los titulados y tituladas.
  • Básicas

  • CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • Genéricas

  • CG1 - Concebir sistemas computacionales que integren datos de procedencias y formas muy diversas, creen con ellos modelos matemáticos, razonen sobre dichos modelos y actúen en consecuencia, aprendiendo de la experiencia.
  • CG2 - Elegir y aplicar los métodos y técnicas más adecuados a un problema definido por datos que representen un reto por su volumen, velocidad, variedad o heterogeneidad, incluidos métodos informáticos, matemáticos, estadísticos y de procesado de la señal.
  • CG3 - Trabajar en equipos y proyectos multidisciplinares relacionados con el procesado y explotación de datos complejos, interactuando fluidamente con ingenieros y profesionales de otras disciplinas.
  • CG4 - Identificar oportunidades para aplicaciones innovadoras orientadas a datos en entornos tecnológicos en continua evolución.
  • Objetivos

    1. Exploración Multivariante de Datos
      Competencias relacionadas: CE1, CE2, CE3, CE4, CE8, CT3, CT5, CT6, CT7, CG1, CG3, CG4, CB2, CB4,
      Subcompetences
      • Clustering. Profiling.
      • Preproceso de los datos. Outliers, datos faltantes. Transformaciones
      • ACP, DVS, Análisis Factorial. Escalamiento Multidimensional.
      • Análisis de Correspondencies Simples. Análisis de Correspondencies Multiples.
    2. Anàlisis discriminante paramétrico
      Competencias relacionadas: CE1, CE3, CE8, CT3, CT4, CT5, CT6, CT7, CG2, CG3,
      Subcompetences
      • Análisis Discriminante Lineal, Discriminación de Fisher. Análisi Discriminante Cuadrático.
      • Distribución normal multivariante. Distribuciones muestrales
    3. Modeltzación multivariante
      Competencias relacionadas: CE1, CE3, CE8, CT4, CT6, CT7, CG1, CG2, CG4, CB2,
      Subcompetences
      • Regresión multivariante
      • Análisis Canónico de correlaciones
      • Principal Component Regression, Partial Least Squares Regression
    4. Series Temporales
      Competencias relacionadas: CE1, CE3, CE8, CT6,
      Subcompetences
      • Outliers, efectos de calendario, análisis de Intervención
      • Modelos univariantes de series temporales
      • Aplicaciones del Filtro de Kalman.

    Contenidos

    1. Preproceso de los datos
      Anomalias, datos faltantes y transformaciones
    2. Análisis de componentes principales
      Descripción multivariante de una tabla de variables continuas. Regresión con componentes principales
    3. Análisis factorial
      La descomposición en valores singulares, biplots, el análisis factorial
    4. Escalamiento multidimensional (MDS)
      Medidas de distancia. Escalamiento multidimensional métrico. Algoritmos.
    5. Análisis de conglomerados
      Técnicas de agrupación jeráricicas. Métodos de agglomeración. Criterio de Ward. Dendrograma
    6. Análisis de correspondencias
      Tablas de contingencia. Perfiles fila y perfiles columna. Independencia y estadístico chi-cuadraso. Análisis de correspondencias simples. Biplot
    7. Análisis discriminante
      Distribución normal multivariante. Función discriminante lineal de Fisher
    8. Modelos univariantes de series temporales
      Alisado exponencial, modelos ARIMA
    9. Análisis de intervención
      Anomalias, efectos de temporada, análisis de intervención

    Actividades

    Actividad Acto evaluativo


    Preproceso de los datos

    Práctica de preproceso de los datos
    Objetivos: 1
    Contenidos:
    Teoría
    4h
    Problemas
    0h
    Laboratorio
    4h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Análisis de componentes principales

    Análisis de datos con el método de componentes principales
    Objetivos: 1
    Contenidos:
    Teoría
    4h
    Problemas
    0h
    Laboratorio
    4h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    6h

    Análisis factorial

    Análisis de datos con el método
    Objetivos: 1
    Contenidos:
    Teoría
    2h
    Problemas
    0h
    Laboratorio
    3h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Escalamiento multidimensional

    Análisis de matrices de distancias con el método
    Objetivos: 1
    Contenidos:
    Teoría
    2h
    Problemas
    0h
    Laboratorio
    2h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Clustering

    Aplicación del método a datos cuantitativos

    Teoría
    4h
    Problemas
    0h
    Laboratorio
    4h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Análisis de Correspondencias

    Aplicación del método con tablas cruzadas
    Objetivos: 2
    Contenidos:
    Teoría
    2h
    Problemas
    0h
    Laboratorio
    2h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Análisis Discriminante

    Aplicación del método a juegos de datos empíricos
    Objetivos: 2
    Contenidos:
    Teoría
    4h
    Problemas
    0h
    Laboratorio
    4h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Modelos univariados de series temporales

    Ajustar modelos a series temporales con ordenador
    Objetivos: 4
    Contenidos:
    Teoría
    4h
    Problemas
    0h
    Laboratorio
    4h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    6h

    Análisis de intervención

    Aplicación del análisis de intervención con datos reales.
    Objetivos: 4
    Contenidos:
    Teoría
    2h
    Problemas
    0h
    Laboratorio
    3h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    4h

    Práctica sobre el análisis exploratorio de datos

    Los estudiants realizan un análisis exploratoria, y entregan un informe con los resultados
    Objetivos: 1 2 3 4
    Semana: 8 (Fuera de horario lectivo)
    Teoría
    0h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    0h

    Proyecto

    Los estudiantes realizan, en grupos de dos, un estudio completo de unos datos, utilizando las técnicas estudiadas en este curso, y entregan un informe con los resultados
    Objetivos: 1 2 3 4
    Semana: 15 (Fuera de horario lectivo)
    Teoría
    0h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    0h

    Examen de conceptos

    Hay dos examenes sobre los conceptos básicos relacionados con las técnicas estudiadas al largo de la assignatura.
    Objetivos: 1 2 3 4
    Semana: 14
    Teoría
    0h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    0h

    Metodología docente

    El aprendizaje se concreta mediante una combinación de la exposición teórica (classe magistral) y su aplicación a casos reales. Durante las classes de teoría se desarrolla el conocimiento científico teórico.

    En las classes de laboratorio, y las entregas semanales, se verà la aplicación de la teoría para la resolución de problemas. En el laboratoria y con el proyecto se trabajan las competencias transversales vinculadas al trabajo en equipo y presentación de resultados. Tanto los laboratorios como el proyecto sirven para integrar los diferentes conocimientos de la assignatura.

    Para adquirir habilidad de análisis con ordinador se utilia el entorno estadístico R.

    Método de evaluación

    La avaluación de la assignatura se basa en una ponderación de distintos elementos: las notas obtenidas para los ejercicios que se entregan cada semana (25%), la nota del examen parcial para la primera mitad de la assignatura (25%), la nota del examen final que cubre la segunda mitad de la assignatura (25%) y la nota obtenida del proyecto (25%).

    Cada ejercicio semanal comporta resolver un cuestionario. Estos ejercicios tienen el objetivo de consolidar el conocimiento de las técnicas expuestas durante las classes de teoria. Los ejercicios implican cálculos con datos en el entorno estadístico R.

    El proyecto de la assignatura se realiza en equipos de dos estudiantes, y cada equipo demostrará su capacidad para resolver un problema real con las técnicas aprendidas durante la assignatura. Los resultados del proyecto se presentan mediante un informe escrito.

    Los dos examenes se harán dentro los horarios marcados por la facultad, y avaluan el conocimiento obtenido de los conceptos básicos de la materia.

    Para la re-avaluación, el estudiante puede re-examinarse para el examen parcial de la primera mitad (25%), o bien re-examinarse para el examen parcial de la segunda mitad (25%), o bien para ambos examenes parciales (50%). Por lo tanto, la reavaluación de la assignatura representa como máximo 50% de la nota final.

    Bibliografía

    Básico

    Complementario

    Capacidades previas

    Conocimiento de conceptos básicos estadísticos, estadística descriptiva, pruebas de hipótesis. Familiaridad con el programa estadístico R.