Aprendizaje Automático I

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
CS;TSC
El objetivo del aprendizaje automático (machine learning en inglés) es el desarrollo de teorías, técnicas y algoritmos que permitan explorar métodos automáticos para inferir modelos a partir de datos (p. ej., para encontrar estructura o regularidades, o hacer predicciones ). Esta inferencia está basada en la observación de datos que representan información incompleta sobre un proceso. El aprendizaje automático es un punto de encuentro de diferentes disciplinas: la estadística multivariante y computacional, la informática, y la optimización, entre otros.

Profesores

Responsable

  • Luis Antonio Belanche Muñoz ( )

Otros

  • Jaume Baixeries Juvillà ( )
  • Jordi Cortadella Fortuny ( )
  • Marta Arias Vicente ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0.333
Aprendizaje autónomo
5

Competencias

Competencias Técnicas

Competencias técnicas

  • CE1 - Utilizar con destreza los conceptos y métodos matemáticos que subyacen los problemas de la ciencia y la ingeniería de los datos.
  • CE3 - Analizar fenómenos complejos mediante la probabilidad y estadística, y plantear modelos de estos tipos en situaciones concretas. Formular y resolver problemas de optimización matemática.
  • CE8 - Capacidad de elegir y emplear técnicas de modelización estadística y análisis de datos, evaluando la calidad de los modelos, validándolos e interpretándolos.
  • CE9 - Capacidad de elegir y emplear una variedad de técnicas de aprendizaje automático y construir sistemas que las utilicen para la toma de decisiones, incluso de forma autónoma.

Competencias Transversales

Transversales

  • CT3 - Comunicación eficaz oral y escrita. Comunicarse de forma oral y escrita con otras personas sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones; participar en debates sobre temas de la propia especialidad.
  • CT7 - Tercera lengua. Conocer una tercera lengua, preferentemente el inglés, con un nivel adecuado oral y escrito y en consonancia con las necesidades que tendrán los titulados y tituladas.

Competencias Técnicas Genéricas

Genéricas

  • CG1 - Concebir sistemas computacionales que integren datos de procedencias y formas muy diversas, creen con ellos modelos matemáticos, razonen sobre dichos modelos y actúen en consecuencia, aprendiendo de la experiencia.
  • CG2 - Elegir y aplicar los métodos y técnicas más adecuados a un problema definido por datos que representen un reto por su volumen, velocidad, variedad o heterogeneidad, incluidos métodos informáticos, matemáticos, estadísticos y de procesado de la señal.

Objetivos

  1. Formular el problema del aprendizaje automático a partir de datos, y conocer los tipos de tareas que se pueden dar.
    Competencias relacionadas: CE1, CE9, CG1, CG2,
  2. Organizar el flujo de resolución de un problema del aprendizaje automático, analizando las posibles opciones y eligiendo las más adecuadas al problema.
    Competencias relacionadas: CE1, CE9, CT7, CG1, CG2,
  3. Decidir, defender y criticar una solución para un problema de aprendizaje automático, argumentando los puntos fuertes y débiles del acercamiento.
    Competencias relacionadas: CE9, CT3, CG2,
  4. Conocer y saber aplicar técnicas lineales para la resolución de problemas de aprendizaje supervisado.
    Competencias relacionadas: CE3, CE8, CG2,
  5. Conocer y saber aplicar técnicas de redes neuronales mono y multicapa para la resolución de problemas de aprendizaje supervisado.
    Competencias relacionadas: CE8, CE9, CG2,
  6. Conocer y saber aplicar técnicas de máquinas de vectores soporte para la resolución de problemas de aprendizaje supervisado.
    Competencias relacionadas: CE8, CE9, CG2,
  7. Conocer y saber aplicar las técnicas básicas para la resolución de problemas de aprendizaje no supervisado, con énfasis en herramientas de agrupamiento de datos.
    Competencias relacionadas: CE8, CE9, CG2,
  8. Conocer y saber aplicar las técnicas básicas para la resolución de problemas de aprendizaje por refuerzo.
    Competencias relacionadas: CE8, CE9, CG2,
  9. Conocer y saber aplicar técnicas de conjunto para la resolución de problemas de aprendizaje supervisado.
    Competencias relacionadas: CE8, CE9, CG2,

Contenidos

  1. Introducción al Aprendizaje Automático
    Información general y conceptos básicos. Descripción y planteamiento de los problemas atacados por el aprendizaje automático. Aprendizaje supervisado (regresión y clasificación), no supervisado (clustering) y semi-supervisado (por refuerzo y transductivo). Ejemplos modernos de aplicación.
  2. Aprendizaje automático no supervisado: clustering
    Definición y planteamiento del aprendizaje automático no supervisado. Introducción al clustering. Algoritmos probabilísticos: K-means y algoritmo Expectation-Maximization (E-M).
  3. Aprendizaje automático supervisado (I): métodos lineales de regresión
    Máxima verosimilitud para regresión. Funciones de error para regresión. Mínimos cuadrados: métodos analíticos (pseudo-inversa y SVD) e iterativos (gradient descent). Noción de regularización. Regresión regularizada L1 y L2: algoritmos ridge regression, LASSO y Elastic Net.
  4. Aprendizaje automático supervisado (II): métodos lineales para clasificación
    Máxima verosimilitud para clasificación. Funciones de error para clasificación. Clasificadores generativos Bayesianos: LDA/ QDA/RDA, Naïve Bayes y k-nearest neighbours.
  5. Métodos jerárquicos: árboles de decisión
    Construcción general de árboles de decisión. Criterios de split: ganancia en entropía y criterio de Gini. Regularización en árboles de decisión. Árboles CART para regresión y clasificación.
  6. Redes neuronales feed-forward shallow
    Redes neuronales feed-forward shallow (de una capa oculta). Funciones de activación. Multilayer perceptron de una capa oculta y RBF (radial basis function network) y sus algoritmos de entrenamiento.
  7. Redes neuronales recurrentes shallow
    Redes neuronales recurrentes shallow: redes de Hopfield y sus algoritmos de entrenamiento. Aplicaciones en memorias asociativas y problemas de optimización combinatoria.
  8. Métodos basados en kernels
    Introducción al aprendizaje con funciones de kernel. Regresión lineal regularizada kernelizada. Funciones de kernel básicas. Complejidad y generalización: dimensión de Vapnik-Chervonenkis. Máquinas de Vectores Soporte.
  9. Métodos de conjunto (ensemble)
    Introducción a los métodos de conjunto (ensemble). Bagging y Random Forests. Boosting. Adaboost y variantes.
  10. Aprendizaje for refuerzo
    Descripción del aprendizaje por refuerzo. Procesos de Markov. Ecuaciones de Bellman. Valores y métodos de diferencias temporales. Aprendizaje Q y algoritmo Sarsa. Aplicaciones.

Actividades

Actividad Acto evaluativo


Desarrollo del tema 1 de la asignatura


Objetivos: 1
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
3.3h

Desarrollo del tema 2 de la asignatura


Objetivos: 1 3 7
Contenidos:
Teoría
4h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6.6h

Desarrollo del tema 3 de la asignatura


Objetivos: 1 4
Contenidos:
Teoría
6h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Desarrollo del tema 4 de la asignatura


Objetivos: 1 2 4
Contenidos:
Teoría
5h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8.3h

Desarrollo del tema 5 de la asignatura


Objetivos: 1 2 5
Contenidos:
Teoría
7h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
11.6h

Desarrollo del tema 7 de la asignatura


Objetivos: 5 1 2
Contenidos:
Teoría
3h
Problemas
0h
Laboratorio
1h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5h

Desarrollo del tema 8 de la asignatura


Objetivos: 1 6
Contenidos:
Teoría
7h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
11.6h

Desarrollo de los temas 5 y 9 de la asignatura


Objetivos: 1 9
Contenidos:
Teoría
8h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
13.3h

Desarrollo del tema 10 de la asignatura


Objetivos: 1 8
Contenidos:
Teoría
3h
Problemas
0h
Laboratorio
1h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5h

Control de la práctica


Objetivos: 1 2 3 4 5 6 7 8 9
Semana: 8 (Fuera de horario lectivo)
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
2h
Aprendizaje autónomo
0h

Entrega de la práctica


Objetivos: 1 2 3 4 5 6 7 8 9
Semana: 15 (Fuera de horario lectivo)
Tipo: entrega
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
3h
Aprendizaje autónomo
0h

Metodología docente

The theory classes introduce all the knowledge, techniques, concepts and results necessary to reach a well-founded and insightful level of maturity. These concepts are put into practice in the laboratory classes. In these labs, R code is provided that allows solving certain aspects of a data analysis problem with the techniques corresponding to the current topic of study. This laboratory also serves as a guide for the corresponding part of the term project, which must be developed by the students throughout the course. Some laboratory hours may be used to solve problems (without a computer) in the theory classroom.

There is a graded practical project which works out a real problem to be chosen by the student and which collects and integrates the knowledge and skills of the entire course. The generic competence of effective written communication is also evaluated by means of this practical work.

Método de evaluación

La asignatura se evalúa mediante un examen parcial, un examen final y un trabajo práctico en el que se ataca un problema real, redactando el correspondiente informe.

La nota final se calcula como:

Nota Asignatura = 0,4 * Trabajo + 0,6 * max (Final, 1/3 * Parcial + 2/3 * Final)

Para los estudiantes que puedan y quieran concurrir a la reevaluación, la nota de examen de reevaluación sustituirá max (Final, 1/3 * Parcial + 2/3 * Final).

Bibliografía

Básica:

Capacidades previas

Nocions mitjanes de probabilitat i estadística.
Nocions mitjanes d'algebra lineal, càlcul matricial i anàlisi real
Bon nivell de programació en llenguatges d'alt nivell