Modelización Estadística

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Departamento
EIO
Modelización estadística es la segunda de una secuencia de 4 asignaturas del grado dedicadas a la estadística y los datos. Como continuación de la asignatura precedente introductoria en el ámbito de la probabilidad y estadística, esta asignatura aporta formación en los principales modelos estadísticos que permiten extraer conocimiento de los datos. Las técnicas de modelización estadística constituyen uno de los pilares fundamentales del ámbito del apoyo a la toma de decisiones, y el análisis inteligente de datos. En este curso se verán los principales modelos multivariantes predictivos (modelo lineal general), y descriptivos (análisis multivariante y clustering), así como nociones de diseño de experimentos que serán útiles en la configuración de los conjuntos de datos de entrenamiento y validación de los modelos, no sólo por esta asignatura, sino también por las de aprendizaje automático que también se ven en el grado. Se incluye en el programa de la asignatura herramientas de modelización dinámica por datos con carácter temporal. Las herramientas vistas en esta asignatura complementarán las vistas a aprendizaje automático y serán input imprescindible para las asignaturas de la materia análisis inteligente de datos y sistemas intel. ligentes de apoyo a la toma de decisiones.

Profesorado

Responsable

  • Karina Gibert Oliveras ( )
  • Sergi Ramirez Mitjans ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Competencias Transversales

Transversales

  • CT3 [Avaluable] - Comunicación eficaz oral y escrita. Comunicarse de forma oral y escrita con otras personas sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones; participar en debates sobre temas de la propia especialidad.
  • CT4 [Avaluable] - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
  • CT8 [Avaluable] - Perspectiva de género. Conocer y comprender, desde el propio ámbito de la titulación, las desigualdades por razón de sexo y género en la sociedad; integrar las diferentes necesidades y preferencias por razón de sexo y de género en el diseño de soluciones y resolución de problemas.

Básicas

  • CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.

Competencias Técnicas

Específicas

  • CE01 - Resolver los problemas matemáticos que puedan plantearse en el ámbito de la inteligencia artificial. Aplicar los conocimientos sobre: álgebra, cálculo diferencial e integral y métodos numéricos; estadística y optimización.
  • CE09 - Concebir, diseñar e integrar sistemas de análisis inteligente de datos con aplicación en entornos de producción y de servicios.
  • CE20 - Elegir y emplear técnicas de modelización estadística y análisis de datos, evaluando la calidad de los modelos, validándolos e interpretándolos.

Competencias Técnicas Genéricas

Genéricas

  • CG2 - Utilizar los conocimientos fundamentales y metodologías de trabajo sólidas adquiridos durante los estudios para adaptarse a los nuevos escenarios tecnológicos del futuro.
  • CG4 - Razonar, analizando la realidad y diseñando algoritmos y formulaciones que la modelen. Identificar problemas y construir soluciones algorítmicas o matemáticas válidas, eventualmente nuevas, integrando el conocimiento multidisciplinar necesario, valorando distintas alternativas con espíritu crítico, justificando las decisiones tomadas, interpretando y sintetizando los resultados en el contexto del dominio de aplicación y estableciendo generalizaciones metodológicas a partir de aplicaciones concretas.
  • CG8 - Observar un ejercicio ético de la profesión en todas sus facetas, aplicando criterios éticos en el diseño de sistemas,algoritmos, experimentos, utilización de datos, de acuerdo con los sistemas éticos recomendados por los organismos nacionales e internacionales, con especial énfasis en seguridad, robustez, privacidad, transparencia, trazabilidad, prevención de sesgos (de raza, género, religión, territorio, etc.) y respeto a los derechos humanos.

Objetivos

  1. Diseñar juegos de pruebas y entrenamiento solventes y orientados a objetivos
    Competencias relacionadas: CG8, CT8, CB3, CE09,
  2. Identificar qué modelo predictivo es adecuado para un problema concreto y datos concretos
    Competencias relacionadas: CG4, CE01, CE09, CE20,
  3. Construir e interpretar modelos válidos por la evolución temporal de una variable numérica
    Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20,
  4. Identificar clases en un conjunto de datos y saberlos validar e interpretar conceptualmente
    Competencias relacionadas: CG2, CG4, CT3, CT4, CE01, CE09, CE20,
  5. Caracterizar las relaciones multivariantes en un conjunto de datos con técnicas de análisis factorial
    Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20,
  6. Poder realizar el análisis básico no supervisado de una base de datos textual con técnicas básicas de topic modelling y análisis multivariante por datos textuales
    Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20,
  7. Saber construir y validar el modelo adecuado para una nueva situación real
    Competencias relacionadas: CG2, CG4, CT3, CT4, CE01, CE09, CE20,
  8. Saber integrar los contenidos de los distintos temas de este curso y los previos en una solución global por un problema complejo
    Competencias relacionadas: CG2, CE01, CE09, CE20,
  9. Saber planificar a largo plazo la modelización de un problema real complejo y resolverlo a lo largo del curso en equipo
    Competencias relacionadas: CT3, CT4, CB4,

Contenidos

  1. Modelos lineales generalizados
    Introducción a los conceptos de modelos lineales generalizados. Modelos logísticos
  2. Diseño de experimentos
    Diseños 2k completos y fraccionales. Análisis de sensibilidad y explicabilidad de los modelos. Identificación de principales efectos e interacciones. Diseño de conjuntos de datos de entrenamiento por aprendizaje automático. Diseño de juegos de test por validación de modelos de datos
  3. Series temporales
    Introducción a los procesos estocásticos. Serie cronológica vs Serie temporal Metodología Box-JenkinsPrincipales modelos de series temporales: MA, AR , ARIMA, SARIMA (concepto y estudio de casos)
  4. Clustering
    Introducción. Principal modelos de clasificación. Distancias.
  5. Profiling
    Descripción de las clasificaciones a partir del estudio de significatividad de variables
  6. Análisis factorial
    Métodos de reducción de dimensionalidad
  7. Textual analysis
    numerización del corpus preprocessing y stopwordterm documento matrixACP sobre esto (clasificación de documentos)

Actividades

Actividad Acto evaluativo


Trabajo en equipo

Los alumnos se organizan en grupos y buscan unos datos reales que cumplen ciertos requisitos marcados por el profesor. Los utilizan para ir aplicando las técnicas y metodologías que se vean a lo largo del curso. Al final presentan un informe con los resultados y realizan una presentación oral con los resultados más relevantes del estudio
Objetivos: 1 2 3 4 5 6 7 8 9
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
27h
Aprendizaje dirigido
0h
Aprendizaje autónomo
41h

Quiz 1

Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorio
Objetivos: 2
Semana: 3
Tipo: examen de teoría
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Quiz 2

Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorio
Objetivos: 2 3
Semana: 8
Tipo: examen de teoría
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Quiz 3

Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorio
Objetivos: 2 3
Semana: 14
Tipo: examen de teoría
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Presentación inicial de la práctica

Presentación inicial de la práctica
Objetivos: 1 2 3 4 5 6 7 8 9
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Presentación final práctica

Presentación final práctica

Semana: 15 (Fuera de horario lectivo)
Tipo: examen de teoría
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Clases de teoría del temario de la asignatura

Clases de teoría del temario de la asignatura
Objetivos: 2 3 4 5 6 7
Contenidos:
Teoría
30h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
30h

Metodología docente

La asignatura consta de dos horas de teoría y dos de laboratorio por semana. En las clases de teoría se practicará siempre que sea posible el esquema de clase invertida. En la web de la asignatura habrá el calendario de la asignatura y los materiales en llevar preparados antes de cada clase. Se recurrirá al esquema de clase magistral puntualmente cuando el profesor necesite aclarar conceptos complejos que no han quedado claros con los materiales previamente distribuidos en la clase. La clase de teoría se dedicará fundamentalmente a la presentación de casos y al desarrollo de actividades interactivas con los estudiantes como la discusión de los casos, el desarrollo de problemas o la realización de cuestionarios cortos puntuales. Los estudiantes realizarán por grupos grandes un trabajo práctico con datos que buscarán ellos mismos y que cumplirán ciertas características fijadas por el profesorado. Con estos datos cada equipo realizará las sesiones de prácticas, cada semana aplicando las técnicas del tema trabajado en la sesión de teoría. El profesor realizará seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio Al final de curso los equipos presentarán sus resultados en una sesión de puesta en común donde se debatirá conjuntamente sobre todos los proyectos

Método de evaluación

(T) Trabajo en equipo realizado a lo largo del curso 20%
(O) Prueba oral de control de conocimientos 10% (discusión con el profesorado en la presentación oral de los trabajos en equipo)
(WT) Calidad y rendimiento del equipo de trabajo (TG). 10%
(C) Comunicación oral y escrita 10%
(E) Ética del equipo de trabajo y del trabajo propiamente dicho 10%
(G) Perspectiva de género del equipo y del trabajo 10%
(A) Asistencia y participación en clases y laboratorios (AP). 10%
(Q) 3 Quiz a lo largo del curso 20%

N=0,2T+0,1*O+0,1*WT+0,1*C+0,1*E+0,1*G+0,1*A+0,2*Q

Q=(Q1+Q2`Q3)/3

Bibliografía

Básica:

Capacidades previas

Introducción a la Estadística
Teoria de la probabilidad
Inferencia estadística
modelos estadisticos simples
visualizacion de datos
programación básica
Conocimientos básicos de R
álgebra