Aprendizaje Automático

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
ESAII
Este curso explora la aplicación de técnicas de aprendizaje profundo a la bioinformática y la bioingeniería, centrándose en los desafíos y oportunidades únicos que presentan los datos biológicos y biomédicos. Basándose en conocimientos previos de aprendizaje automático clásico, los estudiantes profundizarán en arquitecturas avanzadas de redes neuronales, incluyendo perceptrones multicapa, redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y transformadores. El curso abarca dominios clave como el análisis de imágenes biomédicas, el modelado de series temporales y secuencias, el modelado generativo con VAE y GAN, y el uso de modelos de lenguaje tanto para textos biomédicos como para secuencias biológicas.

Profesorado

Responsable

  • Alexandre Perera Lluna ( )

Horas semanales

Teoría
2
Problemas
2
Laboratorio
0
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Resultados de aprendizaje

Resultados de aprendizaje

Conocimientos

  • K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.
  • K3 - Identificar los fundamentos matemáticos, las teorías informáticas, los esquemas algorítmicos y los principios de organización de la información aplicables al modelado de sistemas biológicos y a la resolución eficiente de problemas bioinformáticos mediante el diseño de herramientas computacionales.
  • K4 - Integrar los conceptos ofrecidos por los lenguajes de programación de mayor uso en el ámbito de las Ciencias de la Vida para modelar y optimizar estructuras de datos y construir algoritmos eficientes, relacionándolos entre sí y con sus casos de aplicación.
  • K5 - Identificar la naturaleza de las variables biológicas que es preciso analizar, así como los modelos matemáticos, los algoritmos y las pruebas estadísticas adecuadas para desarrollar y evaluar análisis estadísticos y herramientas computacionales.

Habilidades

  • S2 - Analizar computacionalmente secuencias de ADN, ARN y proteínas, incluyendo análisis comparativos de genomas, usando la computación, las matemáticas y la estadística como herramientas básicas de la bioinformática.
  • S3 - Resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones mediante la aplicación de métodos estadísticos y computacionales y modelos matemáticos.
  • S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.
  • S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.

Competencias

  • C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.
  • C6 - Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar este conocimiento.

Objetivos

  1. Aplicar modelos de aprendizaje profundo a datos biológicos y biomédicos, seleccionando y adaptando arquitecturas como redes convolucionales, recurrentes y transformers para resolver problemas específicos en bioinformática y bioingeniería.
    Competencias relacionadas: C6, K2, K3, S2, S3, S4,
  2. Preprocesar, representar y analizar datos biomédicos heterogéneos (imágenes médicas, secuencias biológicas, señales fisiológicas), empleando herramientas computacionales modernas y buenas prácticas de programación científica.
    Competencias relacionadas: C6, K4, K5, S4, S8, C3,
  3. Interpretar y evaluar el rendimiento de modelos de deep learning en contextos biomédicos, utilizando métricas adecuadas y comprendiendo las limitaciones y riesgos éticos del uso de inteligencia artificial en biomedicina.
    Competencias relacionadas: C3, K4, K5, S4, S8,

Contenidos

  1. Introducción al aprendizaje profundo en bioinformática y bioingeniería
    Introducción al aprendizaje profundo en bioinformática y bioingeniería, tipos de datos biológicos y herramientas de software para flujos de trabajo de aprendizaje efectivos.
  2. Perceptrones multicapa: fundamentos del aprendizaje profundo
    Una introducción a los componentes fundamentales del aprendizaje profundo a través de perceptrones multicapa (MLP), que abarca la arquitectura de red, las funciones de activación, la propagación hacia adelante y hacia atrás y su papel en el modelado de relaciones no lineales complejas en datos biológicos.
  3. Análisis de imágenes biomédicas con CNN
    Este módulo explora las redes neuronales convolucionales (CNN) para analizar imágenes biomédicas, centrándose en tareas de extracción de características, clasificación y segmentación en aplicaciones como patología, radiología y microscopía.
  4. Modelado de series temporales y secuencias biológicas con RNN
    Una mirada en profundidad a las redes neuronales recurrentes (RNN) y sus variantes para modelar datos biológicos secuenciales y temporales, incluidas series de tiempo, señales fisiológicas y secuencias de nucleótidos o proteínas.
  5. Transformadores y mecanismos de atención para secuencias biológicas
    Introducción a los mecanismos de atención y arquitecturas de transformadores, enfatizando su efectividad para capturar dependencias de largo alcance en secuencias biológicas para tareas como predicción de estructuras y anotación funcional.
  6. Arquitecturas de codificador-decodificador
    Diseño y aplicación de modelos codificadores-decodificadores para transformar, anotar y generar secuencias biológicas y datos biomédicos, con énfasis en RNN y variantes de transformadores, integración de atención y tareas de modelado de secuencias del mundo real.
  7. Modelos de lenguaje y PNL en bioinformática y biomedicina
    Este módulo explora cómo se aplican los modelos de lenguaje a textos biomédicos y secuencias biológicas, lo que permite tareas como el reconocimiento de entidades nombradas, la clasificación de documentos y la anotación funcional a través de modelos previamente entrenados como BioBERT, DNABERT y transformadores de secuencias de proteínas.

Actividades

Actividad Acto evaluativo


Clases teóricas


Objetivos: 1 2
Teoría
25h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
45h

Laboratorios


Objetivos: 2 3
Teoría
0h
Problemas
30h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
45h

Parcial.



Semana: 8
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Examen Final



Semana: 15 (Fuera de horario lectivo)
Teoría
3h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Metodología docente

Las clases serán principalmente expositivas. También habrá sesiones prácticas y de práctica con Python.

Método de evaluación

La evaluación del curso es la siguiente:
- 30% corresponde a trabajos prácticos (en parejas),
- 70% consiste en dos exámenes teóricos parciales, uno parcial (35%) y otro final (35%).

Información sobre la recuperación:
Se puede recuperar.
Solo los alumnos que, tras la evaluación, obtengan una calificación igual o superior a 3 podrán realizar el examen de reevaluación. En el examen de reevaluación (R) sólo se reevalúa la parte teórica y la nota de reevaluación en este caso será 70%R más 30% de los trabajos prácticos realizados durante el curso

Bibliografía

Básica:

  • Deep Learning for the Life Sciences - Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande, O'Reilly Media, Inc., ISBN: 9781492039839
  • Bioinformatics with Python Cookbook - Tiago Antão, ISBN: 978-1789344691

Capacidades previas

Python