Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos
, pero tiene capacidades previas
Departamento
EIO
Esta asignatura sienta bases metodológicas de amplia utilidad en la observación de la realidad y la toma de decisiones informada y prepara también para abordar modelos más complejos que se presentan en asignaturas posteriores.
Los métodos estadísticos juegan un papel nuclear en muchos de los métodos de inteligencia artificial o análisis inteligente de datos que se verán en asignaturas posteriores. Por este motivo esta asignatura sentará bases formales para poder seguir adecuadamente asignaturas posteriores, además de capacitar para la resolución de problemas reales abordables con estadística básica. Así, se introducirán los principios estadísticos básicos desde la perspectiva del apoyo que pueden aportar al análisis de problemas donde interviene la inteligencia artificial.
Esta asignatura aporta herramientas básicas para el tratamiento de datos, criterios de elección de muestras o construcción de experimentos para constatar hipótesis concretas a través de los datos en aplicaciones reales, tests y pruebas de hipótesis asociadas a inferencia estadística sobre datos y necesarias en statistical learning entre otros, modelos estadísticos básicos que se completarán con la asignatura siguiente de modelización estadística y que serán utilizados en análisis inteligente de datos y aprendizaje automático entre otras asignaturas de la carrera.
La asignatura tendrá un carácter eminentemente aplicado y pondrá el foco en la resolución de problemas reales del ámbito de la IA utilizando métodos estadísticos básicos.
Profesorado
Responsable
- Klaus Gerhard Langohr (klaus.langohr@upc.edu)
Otros
- Albert Dorador Chalar (albert.dorador@upc.edu)
- Sergi Martínez Maldonado (sergi.martinez.maldonado@upc.edu)
Horas semanales
Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6
Competencias
Transversales
Específicas
Genéricas
Objetivos
-
Familiarizarse con las herramientas de estadística básica para poder tratar datos de forma correcta e interiorizar la metodología estadística como un esquema básico de extracción de información relevante sobre fenómenos complejos
Competencias relacionadas: CG4, CE01, CE02,
Subcompetences- Interiorizar la metodología estadística
- Tratar datos correctamente
- Aplicar la metodología estadística para extraer conocimiento de fenómenos complejos
-
Seleccionar los datos relevantes para apoyar a una pregunta específica
Competencias relacionadas: CG8, CT8, CE01, -
Diseñar los criterios de elegibilidad de una muestra correctamente para responder a un problema real
Competencias relacionadas: CT8, CE02, -
Diseñar experimentos básicos para estudiar problemas reales
Competencias relacionadas: CT8, CE01, -
Realizar preprocesamiento básico de los datos
Competencias relacionadas: CG4, CE02, -
Seleccionar los métodos de modelización estadística más adecuados al problema, a la vista de la estructura de los datos disponibles, los objetivos del estudio y los usos posteriores de los resultados del modelo
Competencias relacionadas: CG4, CE01, CE02, -
Construir los modelos estadísticos correctamente a partir de los datos, haciendo uso del software necesario, el contexto del problema de referencia y presentarlo públicamente
Competencias relacionadas: CG4, CE01, CE02, -
Aplicar de forma integrada los conocimientos estadísticos obtenidos a clase en el análisis de un juego de datos real (aprovechando las fuentes de *open fecha) dando respuesta a un problema de referencia de cualquier ámbito real relevante por la inteligencia artificial, como salud, medio ambiente, sostenibilidad, *indústria4.0
Competencias relacionadas: CG4, CE01, CE02,
Subcompetences- Aprovechar open data relevantes para un problema
- Analizar juegos de datos reales (salud, medio ambiente, ...)
- Integrar conocimientos estadísticos de diferentes temas de la asignatura para solucionar un problema complejo
-
Desarrollar trabajos prácticos y proyectos con perspectiva de género
Competencias relacionadas: CT8, -
Integrar los mecanismos de trabajo en equipo en la realización de los trabajos prácticos
Competencias relacionadas: CT4, -
Tratar con destreza las herramientas informáticas necesarias para resolver los problemas reales planteados con las técnicas de estadística básica vistas durante el curso.
Competencias relacionadas: CE02, -
Interpretar y contextualizar los modelos estadísticos construidos a partir de datos
Competencias relacionadas: CG4, CT3, CT8, -
Incorporar las recomendaciones éticas de la CE en materia de IA a los trabajos prácticos
Competencias relacionadas: CG8, -
Validar los modelos obtenidos y hacer una interpretación crítica de los resultados desde un punto de vista técnico y contextualizando los resultados en el marco del problema
Competencias relacionadas: CG4, CG8, CE02, -
Realizar un informe automático con la descriptiva de una Base de datos, los modelos validados, y el análisis integrado y crítica de los resultados en el contexto del problema de referencia
Competencias relacionadas: CG4, CG8, CT3, CT4, CT8, -
Presentar públicamente un informe estadístico que incluya descriptiva, modelos y conclusiones, comunicado adecuadamente en audiencias técnicas y/o sin competencias técnicas
Competencias relacionadas: CG8, CT3, CT4, CT8,
Contenidos
-
Análisis descriptivo de los datos
Se trabajará como utilizar herramientas estadísticas numéricas y gráficas para describir un conjunto de datos, así como las herramientas de *reporting automático necesarias para realizar informes automáticos con esta descripción -
Introducción a la teoría de la probabilidad
Se aportarán las nociones básicas de probabilidad para comprender el concepto de incertidumbre y los principales formalismos probabilísticos para modelarla, incluyendo conceptos de probabilidad condicionada y el teorema de Bayes, relevando en asignaturas posteriores -
Variables aleatorias
Definición de variable aleatoria discreta y continua. Variables aleatorias conocidas: Bernoulli, Binomial, Poisson y Normal -
Inferencia estadística
Pruebas de hipótesis, concepto de p-valor, intervalos de confianza. Limitaciones en aplicaciones reales de la inferencia clásica. Inferencia no paramétrica, maceta de permutaciones de *Fisher. Pruebas de hipótesis en statistical learning -
Regresión
Modelo básico (regresión lineal simple, *mean least squares). Medidas de bondad del ajustamiento, validación. Regresión lineal múltple. Modelo lineal general (ANOVA, ANCOVA)
Actividades
Actividad Acto evaluativo
Trabajo en equipo
Los alumnos se organizan en grupos y buscan unos datos reales que cumplen ciertos requisitos marcados por el profesor Las utilizan para ir aplicando las técnicas y metodologías que se vean a lo largo del curso. Al final presentan un informe con los resultados y hacen una presentación oral con los resultados más relevantes del estudioObjetivos: 8 10
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
25h
Aprendizaje dirigido
0h
Aprendizaje autónomo
50h
Teoría
30h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
30h
Metodología docente
La asignatura consta de dos horas de teoría y dos de laboratorio por semanaEn las clases de teoría se practicará siempre que sea posible el esquema de clase invertida.
En el web de la asignatura habrá el calendario de la asignatura y los materiales a llevar preparados antes de cada clase. Se recurrirá al esquema de clase magistral puntualmente cuando el profesor necesite aclarar conceptos complejos que no han quedado claros con los materiales distribuidos previamente a la clase. La clase de teoría se dedicará fundamentalmente a la presentación de casos y al desarrollo de actividades interactivas con los estudiantes como la discusión de los casos, el desarrollo de problemas o la realización de cuestionarios cortos puntuales.
Los estudiantes realizarán por grupos grandes un trabajo práctico con datos que buscarán ellos mismos y que cumplirán ciertas características fijadas por el profesorado. Con estos datos cada equipo realizará las sesiones de prácticas, cada semana aplicando las técnicas del tema trabajado a la sesión de teoría. El profesor hará seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio
Al final de curso los equipos presentarán sus resultados en una sesión de posta en común donde se debatirá conjuntamente sobre todos los proyectos
Método de evaluación
Ítems que forman parte de la nota:(T) Trabajo en equipo realizado a lo largo del curso 20%
(O) Prueba oral de control de conocimientos (discusión con el profesorado en la presentación oral de los trabajos en equipo). 10%
(CT4) Calidad y rendimiento del equipo de trabajo (TG). 5%
(CT3) Comunicación oral y escrita. 5%
(CT8) Perspectiva de género del equipo y del trabajo. 5%
(E) Ética del equipo de trabajo y del trabajo propiamente dicho. 5%
Q) Media de dos pruebas individuales y presenciales hechas a lo largo del curso. 20%
(EF) Examen final presencial. 30%
Nota Proyecto: P= 0.2*T+0.1*O + 0.05*CT4+ 0.05*CT3+ 0.05*CT8+ 0.05*E
Nota final= P+ 0.2*Q + 0.3*EF
Hace falta que 1/3*Q+2/3*EF sea como a mínimo 3.5.
_________________________________________________________________
(EE) Examen Final Extraordinario
Nota reevaluación = mín (7, máx(EE, P+ 0.2*Q + 0.3*EE)). La nota máxima de la reevaluación será un 7.
Per l'examen final extraordinari no hi ha nota mínima. Sólo podrán presentarse a la reevaluación aquellas personas que, habiéndose presentado al examen final, lo hayan suspendido.
Bibliografía
Básico
-
Statistics: the art and science of learning from data
- Agresti, Alan; Franklin, Christine,
Pearson Education,
2017.
ISBN: 9781292164878
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307606711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Practical statistics for data scientists : 50+ essential concepts using R and Python
- Bruce, Peter; Bruce, Andrew; Gedeck, Peter,
O'Reilly Media, Inc,
2020.
ISBN: 9781492072942
-
A modern introduction to probability and statistics: understanding why and how
- Dekking, F.M; Kraaikamp, C.; Lopuhaä, H.P,
Springer,
2005.
ISBN: 9781846281686
-
Data analysis and graphics using R : an example-based approach
- Maindonald, John; Braun, John,
Cambridge University,
2010.
ISBN: 9780521762939
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003210549706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Introduction to the practice of statistics
- Moore, D.S.; McCabe, G.P.; Craig, B.A,
WH Freeman,
2021.
ISBN: 9781319383664
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307806711&context=L&vid=34CSUC_UPC:VU1&lang=ca