Profesorado
Responsable
- Jordi Cortés Martínez (jordi.cortes-martinez@upc.edu)
Otros
- Dante Conti (dante.conti@upc.edu)
- Karina Gibert Oliveras (karina.gibert@upc.edu)
Horas semanales
Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6
Competencias
Transversales
Básicas
Específicas
Genéricas
Objetivos
-
Diseñar juegos de pruebas y entrenamiento solventes y orientados a objetivos
Competencias relacionadas: CG8, CT8, CB3, CE09, -
Identificar qué modelo predictivo es adecuado para un problema concreto y datos concretos
Competencias relacionadas: CG4, CE01, CE09, CE20, -
Construir e interpretar modelos válidos por la evolución temporal de una variable numérica
Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20, -
Identificar clases en un conjunto de datos y saberlos validar e interpretar conceptualmente
Competencias relacionadas: CG2, CG4, CT3, CT4, CE01, CE09, CE20, -
Caracterizar las relaciones multivariantes en un conjunto de datos con técnicas de análisis factorial
Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20, -
Poder realizar el análisis básico no supervisado de una base de datos textual con técnicas básicas de topic modelling y análisis multivariante por datos textuales
Competencias relacionadas: CG4, CT3, CT4, CE01, CE09, CE20, -
Saber construir y validar el modelo adecuado para una nueva situación real
Competencias relacionadas: CG2, CG4, CT3, CT4, CE01, CE09, CE20, -
Saber integrar los contenidos de los distintos temas de este curso y los previos en una solución global por un problema complejo
Competencias relacionadas: CG2, CE01, CE09, CE20, -
Saber planificar a largo plazo la modelización de un problema real complejo y resolverlo a lo largo del curso en equipo
Competencias relacionadas: CT3, CT4, CB4,
Contenidos
-
Modelos lineales generalizados
Introducción a los conceptos de modelos lineales generalizados. Modelos logísticos -
Series temporales
Introducción a los procesos estocásticos. Serie cronológica vs Serie temporal Metodología Box-JenkinsPrincipales modelos de series temporales: MA, AR , ARIMA, SARIMA (concepto y estudio de casos) -
Análisis factorial
Métodos de reducción de dimensionalidad -
Clustering
Introducción. Principal modelos de clasificación. Distancias. -
Profiling
Descripción de las clasificaciones a partir del estudio de significatividad de variables -
Diseño de experimentos
Diseños 2k completos y fraccionales. Análisis de sensibilidad y explicabilidad de los modelos. Identificación de principales efectos e interacciones. Diseño de conjuntos de datos de entrenamiento por aprendizaje automático. Diseño de juegos de test por validación de modelos de datos
Actividades
Actividad Acto evaluativo
Trabajo en equipo
Los alumnos se organizan en grupos y buscan unos datos reales que cumplen ciertos requisitos marcados por el profesor. Los utilizan para ir aplicando las técnicas y metodologías que se vean a lo largo del curso. Al final presentan un informe con los resultados y realizan una presentación oral con los resultados más relevantes del estudioObjetivos: 1 2 3 4 5 6 7 8 9
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
11h
Aprendizaje dirigido
0h
Aprendizaje autónomo
27.5h
Aplicación práctica temario asignatura
Ejecución de scripts prácticos en R sobre los conceptos vistos en teoría.
Teoría
0h
Problemas
0h
Laboratorio
12.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Quiz 1
Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorioObjetivos: 2
Semana: 4
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Quiz 4
Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorioObjetivos: 4
Semana: 11
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Quiz 5
Durante el curso se realizarán pruebas de respuesta corta para fijar prendas de aprendizaje. Se realizará al final de ciertas clases de laboratorioObjetivos: 1
Semana: 13
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Metodología docente
La asignatura consta de dos horas de teoría y dos de laboratorio por semanaEn la web de la asignatura estará el calendario de la asignatura y los materiales para preparar cada clase. La clase de teoría se dedicará fundamentalmente a explicar conceptos y la presentación de casos y al desarrollo de actividades interactivas con los estudiantes como la discusión de los casos, el desarrollo de problemas.
Los estudiantes realizarán por grupos de 4 personas un trabajo práctico con datos que buscarán ellos mismos y que cumplirán ciertas características fijadas por el profesorado. Con estos datos cada equipo realizará las sesiones de prácticas, cada semana, aplicando las técnicas del tema trabajado en la sesión de teoría. El profesor realizará seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio.
A mediados y finales de curso los equipos presentarán sus resultados en una sesión de puesta en común donde se debatirá conjuntamente sobre todos los proyectos.
Método de evaluación
Evaluación Ordinaria:---------------------
(Q) Cuestionarios. 20%
(P) Proyecto. 30%
(EF) Examen Final. 50%
Nota Final Ordinaria = 0,2 * Q + 0,3 * P + 0,5 * EF
P. Consta de 5 preguntas individuales y presenciales con el mismo peso sobre la nota final. Estos cuestionarios se realizarán presencialmente y no se podrán recuperar en otro día distinto a la fecha programada ni por causa justificada.
Q = (Q1 + Q2 + Q3 + Q4 + Q5)/5
P. Proyecto en grupo donde se valorarán las siguientes competencias: (P1) Recolección de datos, análisis e interpretación de resultados y Transmisión de resultados (80%); (P2) Comunicación oral y escrita (20%)
P = 0,8 * P1 + 0,2 * P2
Deberá obtener una nota mínima de un 3,5 en las pruebas individuales y presenciales, es decir,
2/7 * Q + 5/7 * EF > 3,5 para aprobar la asignatura. Por otra parte, la realización del proyecto será obligatoria para poder aprobar durante la evaluación ordinaria.
Evaluación Extraordinaria:
-----------------------------------
Sólo se podrán presentar a la reevaluación aquellas personas que, habiéndose presentado en el examen final lo hayan suspendido.
(EF) Examen Final Extraordinario
Nota Extraordinaria = Mínimo{7, Máximo{EE, 0,2 * Q + 0,3 * P + 0,5 * EE}}
En esta convocatoria no hi habrá nota mínima para aprobar. La máxima nota en esta convocatoria es un 7.
Bibliografía
Básico
-
Practical statistics for data scientists: 50+ essential concepts using R and Python
- Bruce, Peter; Bruce, Andrew; Gedeck, Peter,
O'Reilly,
[2020].
ISBN: 9781492072942
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data analysis and graphics using R : an example-based approach
- Maindonald, J. H; Braun, John,
Cambridge University,
2010.
ISBN: 9780521762939
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003210549706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Forecasting: principles and practice
- Hyndman, R.J.; Athanasopoulos, G,
O Texts,
2021.
ISBN: 9780987507136
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005164678006711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Practical time series analysis: prediction with statistics and machine learning
- Nielsen, Aileen,
O'Reilly Media, Inc,
2019.
ISBN: 9781492041658
Capacidades previas
Introducción a la EstadísticaTeoria de la probabilidad
Inferencia estadística
modelos estadisticos simples
visualizacion de datos
programación básica
Conocimientos básicos de R
álgebra