Modelado Estadístico Avanzado

Usted está aquí

Créditos
6
Tipos
Complementaria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
EIO;DAC
La asignatura hace un recorrido a lo largo de diferentes modelos estadísticos de regresión: regresión lineal simple y múltiple, regresión paramétrica no-lineal, modelo lineal generalizado, regresión no paramétrica, regresión no paramétrica generalizada. Se hace énfasis en la selección y validación de los modelos. Una parte fundamental del curso es el estudio de casos reales, tanto por parte de los profesores como por parte de los estudiantes en las tareas programadas semanalmente.

Profesores

Responsable

  • Josep Anton Sánchez Espigares ( )
  • Pedro Delicado Useros ( )

Horas semanales

Teoría
3
Problemas
0
Laboratorio
0
Aprendizaje dirigido
0
Aprendizaje autónomo
7

Competencias

Competencias Técnicas Genéricas

Genéricas

  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.

Competencias Transversales

Uso solvente de los recursos de información

  • CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.

Actitud frente al trabajo

  • CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.

Razonamiento

  • CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.

Competencias Técnicas de cada especialidad

Específicas comunes

  • CEC2 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.

Objetivos

  1. Al final del curso el estudiante será capaz de proponer y estimar modelos de regresión lineal simples y múltiples. También podrá interpretar los modelos estimados y validarlos.
    Competencias relacionadas: CG3, CEC2, CTR4, CTR6,
  2. Al final del curso el estudiante será capaz de proponer, estimar, interpretar y validar modelos lineales generalizados.
    Competencias relacionadas: CG3, CEC2, CTR4, CTR6,
  3. Al final del curso el estudiante será capaz de proponer, estimar, interpretar y validar versiones no paramétricas de los modelos lineales de regresión y de los modelos lineales generalizados.
    Competencias relacionadas: CG3, CEC2, CTR4, CTR5, CTR6,
  4. Al final del curso el alumno conocerá adecuadamente la forma de elegir los parámetros de suavizado que en modelos de regresión no paramétricos controlan el equilibrio entre buen ajuste a la muestra observada y buena generalización.
    Competencias relacionadas: CG3, CEC2, CTR4, CTR5, CTR6,
  5. Al final de curso el alumno, enfrentado a un problema real de modelización y/o predicción, sabrá elegir el modelo de regresión más adecuado (paramétrico, no paramétrico o semiparamétrico).
    Competencias relacionadas: CG3, CEC2, CTR4, CTR5, CTR6,

Contenidos

  1. Modelos paramétricos
    1. Introducción. Modelos deterministas y modelos estadísticos. Modelos paramétricos, no paramétricos y semiparamétricos. La construcción de modelos estadísticos. Ejemplos. Software.
    2: Modelos lineales normales. Descripción del modelo lineal normal. Estimación por mínimos cuadrados. Tabla ANOVA. Inferencia. Validación del modelo. El uso de variables explicativas categóricas. Selección de modelo. Predicción. Interpretación de la modelo y colinealidad. Regresión robusta y detección de valores atípicos. Modelo no lineal normal.
    3. Modelos lineales generalizados. Descripción de los modelos lineales generalizados. Modelos para la variable de respuesta binaria. Modelos para datos de recuento y las tablas de contingencia. Modelos para datos de respuesta de tiempo de vida. Estimación por máxima verosimilitud y por medio del estadístico Xi^2. Inferencia. Validación del model.
    4. Modelos bayesianos. Inferencia FRECUENTISTA e inferencia basada en la función de verosimilitud. ¿Qué es un modelo bayesiano? Distribución a posteriori. Distribución predictiva a priori distribución predictiva a posteriori. La selección de una distribución a priori. Inferencia bayesiana.
  2. Modelos no paramétricos
    1. Modelo de regresión no paramétrica. Introducción al modelado no paramétrico. Regresión polinómica local. El trade-off entre sesgo y varianza. Núcleos. Suavizadores lineales. Elección del grado del polinomio local. Elección del parámetro de suavizado: validación cruzada, método plug-in, ventanas variables.

    2. Modelo de regresión no paramétrico generalizado. Regresión no paramétrica con respuesta binaria. Modelo de regresión no paramétrico generalizado. Estimación por máxima verosimilitud local.

    3. Inferencia en la regresión no paramétrica. Bandas de variabilidad. Contrastes de ausencia de efectos. Contraste de un modelo paramétrico. Comparación de curvas.

    4. Spline suavizador. Ajuste por mínimos cuadrados penalizados de la regresión no paramétrica. Splines cúbicos e interpolación. Suavizado mediante splines. B-splines y P-splines. Regresión spline. Ajuste de modelos de regresión no paramétricos generalizados mediante splines.

    5. Modelos aditivos generalizados y modelos semiparamétricos. Regresión múltiple no paramétrica. La maldición de la dimensionalidad. Modelos aditivos. Modelos aditivos generalizados. Modelos semiparamétricos.

Actividades

Actividad Acto evaluativo


Desarrollo del Tema 1 (modelos paramétricos de regresión) en clase

Desarrollo del Tema 1 (modelos paramétricos de regresión) en clase
Objetivos: 1 2 5
Contenidos:
Teoría
22.5h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
52.5h

Presentación del Tema 2 (modelos de regresión no paramétrica) en clase

Presentación del Tema 2 (modelos de regresión no paramétrica) en clase
Objetivos: 3 4 5
Contenidos:
Teoría
22.5h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
52.5h

Metodología docente

Hay una sesión semanal de 3 horas. Las 2 primeras horas se dedican a la presentación, por parte del profesor, de los contenidos teóricos de la asignatura. La última hora se dedica a poner en práctica estos contenidos: cada alumno tiene en clase su ordenador portátil y realiza las tareas que el profesor propone. Cada sesión finaliza con la propuesta de una tarea a los alumnos que deben entregar resuelta la siguiente sesión.

Método de evaluación

Se asignará una tarea al final de cada sesión, que será entregada la sesión siguiente. La nota de las tareas valdrá el 50% de la nota final. El otro 50% de la nota final vendrá dado por un examen final:

Nota del curso = 0:5 * Nota Tareas + 0:5 * Nota Examen

Bibliografía

Básica:

  • Applied Smoothing Techniques for Data Analysis - Bowman, A. W. and A. Azzalini, Oxford University Press, 1997.
  • Statistical Models in S - Chambers, J.M. and Hastie, T.J., Wadsworth and Brooks/Cole, 1992.
  • Generalized Additive Models - Hastie, T.J. and Tibshirani, R.J., Chapman and Hall, 1990.
  • The Elements of Statistical Learning. Data Mining, Inference, and Prediction. - Hastie, T.J., Tibshirani, R.J. and Friedman,, Springer Verlag, 2009.
  • Generalized Linear Models - McCullagh, P. and Nelder, J.A., Chapman and Hall., 1989.
  • Semiparametric Regression - Ruppert, D., M. P. Wand and R. J. Carroll, Cambridge University Press, 2003.
  • Modern Applied Statistics with S-Plus - Venables, W.N. and Ripley, B.D., Springer Verlag, 2002.
  • All of Nonparametric Statistics - Wasserman, L., Springer, 2006.
  • Applied Linear Regression - Weisberg, S., Wiley, 2005.
  • Generalized Additive Models: An Introduction with R. - Wood, S.N, Chapman and Hall/CRC, 2006.

Capacidades previas

No especificadas