Introducción a la Estadística

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
EIO
La estadística es la ciencia de extracción de información a partir de datos más antigua de todas y durante décadas se ha utilizado para comprender la realidad y extraer modelos que permitan conocerla mejor, hacer predicciones y aportar elementos de descripción de la realidad útiles en la toma de decisiones, especialmente aquéllas que hacen referencia a situaciones de altos niveles de complejidad.

Esta asignatura sienta bases metodológicas de amplia utilidad en la observación de la realidad y la toma de decisiones informada y prepara también para abordar modelos más complejos que se presentan en asignaturas posteriores.


Los métodos estadísticos juegan un papel nuclear en muchos de los métodos de inteligencia artificial o análisis inteligente de datos que se verán en asignaturas posteriores. Por este motivo esta asignatura sentará bases formales para poder seguir adecuadamente asignaturas posteriores, además de capacitar para la resolución de problemas reales abordables con estadística básica. Así, se introducirán los principios estadísticos básicos desde la perspectiva del apoyo que pueden aportar al análisis de problemas donde interviene la inteligencia artificial.

Esta asignatura aporta herramientas básicas para el tratamiento de datos, criterios de elección de muestras o construcción de experimentos para constatar hipótesis concretas a través de los datos en aplicaciones reales, tests y pruebas de hipótesis asociadas a inferencia estadística sobre datos y necesarias en statistical learning entre otros, modelos estadísticos básicos que se completarán con la asignatura siguiente de modelización estadística y que serán utilizados en análisis inteligente de datos y aprendizaje automático entre otras asignaturas de la carrera.


La asignatura tendrá un carácter eminentemente aplicado y pondrá el foco en la resolución de problemas reales del ámbito de la IA utilizando métodos estadísticos básicos.

Profesorado

Responsable

  • Karina Gibert Oliveras ( )

Otros

  • Sergi Ramirez Mitjans ( )
  • Xavier Angerri Torredeflot ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Competencias Transversales

Transversales

  • CT3 [Avaluable] - Comunicación eficaz oral y escrita. Comunicarse de forma oral y escrita con otras personas sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones; participar en debates sobre temas de la propia especialidad.
  • CT4 [Avaluable] - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
  • CT8 [Avaluable] - Perspectiva de género. Conocer y comprender, desde el propio ámbito de la titulación, las desigualdades por razón de sexo y género en la sociedad; integrar las diferentes necesidades y preferencias por razón de sexo y de género en el diseño de soluciones y resolución de problemas.

Competencias Técnicas

Específicas

  • CE01 - Resolver los problemas matemáticos que puedan plantearse en el ámbito de la inteligencia artificial. Aplicar los conocimientos sobre: álgebra, cálculo diferencial e integral y métodos numéricos; estadística y optimización.
  • CE02 - Dominar los conceptos básicos de matemática discreta, lógica, algorítmica y complejidad computacional, y su aplicación para el tratamiento automático de la información por medio de sistemas computacionales y su aplicación para la resolución de problemas.

Competencias Técnicas Genéricas

Genéricas

  • CG4 - Razonar, analizando la realidad y diseñando algoritmos y formulaciones que la modelen. Identificar problemas y construir soluciones algorítmicas o matemáticas válidas, eventualmente nuevas, integrando el conocimiento multidisciplinar necesario, valorando distintas alternativas con espíritu crítico, justificando las decisiones tomadas, interpretando y sintetizando los resultados en el contexto del dominio de aplicación y estableciendo generalizaciones metodológicas a partir de aplicaciones concretas.
  • CG8 - Observar un ejercicio ético de la profesión en todas sus facetas, aplicando criterios éticos en el diseño de sistemas,algoritmos, experimentos, utilización de datos, de acuerdo con los sistemas éticos recomendados por los organismos nacionales e internacionales, con especial énfasis en seguridad, robustez, privacidad, transparencia, trazabilidad, prevención de sesgos (de raza, género, religión, territorio, etc.) y respeto a los derechos humanos.

Objetivos

  1. Familiarizarse con las herramientas de estadística básica para poder tratar datos de forma correcta e interiorizar la metodología estadística como un esquema básico de extracción de información relevante sobre fenómenos complejos
    Competencias relacionadas: CG4, CE01, CE02,
    Subcompetences:
    • Interiorizar la metodología estadística
    • Tratar datos correctamente
    • Aplicar la metodología estadística para extraer conocimiento de fenómenos complejos
  2. Seleccionar los datos relevantes para apoyar a una pregunta específica
    Competencias relacionadas: CG8, CT8, CE01,
  3. Diseñar los criterios de elegibilidad de una muestra correctamente para responder a un problema real
    Competencias relacionadas: CT8, CE02,
  4. Diseñar experimentos básicos para estudiar problemas reales
    Competencias relacionadas: CT8, CE01,
  5. Realizar preprocesamiento básico de los datos
    Competencias relacionadas: CG4, CE02,
  6. Seleccionar los métodos de modelización estadística más adecuados al problema, a la vista de la estructura de los datos disponibles, los objetivos del estudio y los usos posteriores de los resultados del modelo
    Competencias relacionadas: CG4, CE01, CE02,
  7. Construir los modelos estadísticos correctamente a partir de los datos, haciendo uso del software necesario, el contexto del problema de referencia y presentarlo públicamente
    Competencias relacionadas: CG4, CE01, CE02,
  8. Aplicar de forma integrada los conocimientos estadísticos obtenidos a clase en el análisis de un juego de datos real (aprovechando las fuentes de *open fecha) dando respuesta a un problema de referencia de cualquier ámbito real relevante por la inteligencia artificial, como salud, medio ambiente, sostenibilidad, *indústria4.0
    Competencias relacionadas: CG4, CE01, CE02,
    Subcompetences:
    • Aprovechar open data relevantes para un problema
    • Analizar juegos de datos reales (salud, medio ambiente, ...)
    • Integrar conocimientos estadísticos de diferentes temas de la asignatura para solucionar un problema complejo
  9. Desarrollar trabajos prácticos y proyectos con perspectiva de género
    Competencias relacionadas: CT8,
  10. Integrar los mecanismos de trabajo en equipo en la realización de los trabajos prácticos
    Competencias relacionadas: CT4,
  11. Tratar con destreza las herramientas informáticas necesarias para resolver los problemas reales planteados con las técnicas de estadística básica vistas durante el curso.
    Competencias relacionadas: CE02,
  12. Interpretar y contextualizar los modelos estadísticos construidos a partir de datos
    Competencias relacionadas: CG4, CT3, CT8,
  13. Incorporar las recomendaciones éticas de la CE en materia de IA a los trabajos prácticos
    Competencias relacionadas: CG8,
  14. Validar los modelos obtenidos y hacer una interpretación crítica de los resultados desde un punto de vista técnico y contextualizando los resultados en el marco del problema
    Competencias relacionadas: CG4, CG8, CE02,
  15. Realizar un informe automático con la descriptiva de una Base de datos, los modelos validados, y el análisis integrado y crítica de los resultados en el contexto del problema de referencia
    Competencias relacionadas: CG4, CG8, CT3, CT4, CT8,
  16. Presentar públicamente un informe estadístico que incluya descriptiva, modelos y conclusiones, comunicado adecuadamente en audiencias técnicas y/o sin competencias técnicas
    Competencias relacionadas: CG8, CT3, CT4, CT8,

Contenidos

  1. Análisis descriptivo de los datos
    Se trabajará como utilizar herramientas estadísticas numéricas y gráficas para describir un conjunto de datos, así como las herramientas de *reporting automático necesarias para realizar informes automáticos con esta descripción
  2. Introducción a la teoría de la probabilidad
    Se aportarán las nociones básicas de probabilidad para comprender el concepto de incertidumbre y los principales formalismos probabilísticos para modelarla, incluyendo conceptos de probabilidad condicionada y el teorema de Bayes, relevando en asignaturas posteriores
  3. Introducción a la teoría del muestreo
    concepto de muestra aleatoria simple, teoría del muestreo, tipo de muestreo
  4. Inferencia estadística
    pruebas de hipótesis, concepto de p-valor, intervalos de confianza. Limitaciones en aplicaciones reales de la inferencia clásica. Inferencia no paramétrica, maceta de permutaciones de *Fisher. Pruebas de hipótesis en statistical learning
  5. Introducción al diseño de experimentos
    diferencias entre estudios muestrales y experimentales. El diseño de experimentos en la validación de software. Sesgos y escalabilidad
  6. Regresión
    Modelo básico (regresión lineal simple, *mean least squares). Medidas de bondad del ajustamiento, validación. Regresión lineal múltple. Modelo lineal general (ANOVA, ANCOVA)

Actividades

Actividad Acto evaluativo


Trabajo en equipo

Los alumnos se organizan en grupos y buscan unos datos reales que cumplen ciertos requisitos marcados por el profesor Las utilizan para ir aplicando las técnicas y metodologías que se vean a lo largo del curso. Al final presentan un informe con los resultados y hacen una presentación oral con los resultados más relevantes del estudio
Objetivos: 8 10
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
27h
Aprendizaje dirigido
0h
Aprendizaje autónomo
50h

quiz 1

Durante el curso se realizarán pruebas de respuesta corta para fijar piezas de aprendizaje. Se hará al final de ciertas clases de laboratorio
Objetivos: 1 11 9 2 6 5 3 4
Semana: 3
Tipo: examen de laboratorio
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Quiz 2

Durante el curso se realizarán pruebas de respuesta corta para fijar piezas de aprendizaje. Se hará al final de ciertas clases de laboratorio
Objetivos: 8 10 12 6 7 14
Semana: 12
Tipo: examen de laboratorio
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Presentación inicial de la práctica

Presentación inicial de la práctica
Objetivos: 9 13 15
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Presentación final de la pràctica

Presentación final de la práctica
Objetivos: 8 10 11 9 13 15 16 12 7 14
Semana: 16 (Fuera de horario lectivo)
Tipo: examen final
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
0h

Clases de teoría del temario de l'asignatura

Clases de teoría del temario de l'asignatura
Objetivos: 1
Contenidos:
Teoría
30h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
30h

Metodología docente

La asignatura consta de dos horas de teoría y dos de laboratorio por semana
En las clases de teoría se practicará siempre que sea posible el esquema de clase invertida.
En el web de la asignatura habrá el calendario de la asignatura y los materiales a llevar preparados antes de cada clase. Se recurrirá al esquema de clase magistral puntualmente cuando el profesor necesite aclarar conceptos complejos que no han quedado claros con los materiales distribuidos previamente a la clase. La clase de teoría se dedicará fundamentalmente a la presentación de casos y al desarrollo de actividades interactivas con los estudiantes como la discusión de los casos, el desarrollo de problemas o la realización de cuestionarios cortos puntuales.
Los estudiantes realizarán por grupos grandes un trabajo práctico con datos que buscarán ellos mismos y que cumplirán ciertas características fijadas por el profesorado. Con estos datos cada equipo realizará las sesiones de prácticas, cada semana aplicando las técnicas del tema trabajado a la sesión de teoría. El profesor hará seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio

Al final de curso los equipos presentarán sus resultados en una sesión de posta en común donde se debatirá conjuntamente sobre todos los proyectos

Método de evaluación

(T) Trabajo en equipo realizado a lo largo del curso 20%
(O) Prueba oral de control de conocimientos 10% (discusión con el profesorado en la presentación oral de los trabajos en equipo)
(CT4) Calidad y rendimiento del equipo de trabajo (TG). 10%
(CT3) Comunicación oral y escrita 10%
(CT8) Perspectiva de género del equipo y del trabajo 10%
(E) Ética del equipo de trabajo y del trabajo propiamente dicho 10%
(A) Asistencia y participación en clases y laboratorios (AP). 10%
(Q) 2 Quiz a lo largo del curso 20%

N= 0,2*T+0,1*O+0,1*CT4+0,1*CT3+0,1*E+0,1*CT8+0,1*A+0,2*Q

Q=0,5*Q1+0,5*Q2

Bibliografía

Básica:

Capacidades previas

Coneixements matemàtics de batxillerat