Aprendizaje Automático

Créditos

Tipos

Obligatoria

Requisitos

Esta asignatura no tiene requisitos , pero tiene capacidades previas

Departamento

ESAII

Este curso explora la aplicación de técnicas de aprendizaje profundo a la bioinformática y la bioingeniería, centrándose en los desafíos y oportunidades únicos que presentan los datos biológicos y biomédicos. Basándose en conocimientos previos de aprendizaje automático clásico, los estudiantes profundizarán en arquitecturas avanzadas de redes neuronales, incluyendo perceptrones multicapa, redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y transformadores. El curso abarca dominios clave como el análisis de imágenes biomédicas, el modelado de series temporales y secuencias, el modelado generativo con VAE y GAN, y el uso de modelos de lenguaje tanto para textos biomédicos como para secuencias biológicas.

Profesorado

Responsable

Alexandre Perera Lluna ( alexandre.perera@upc.edu )

Otros

Joana Gelabert Xirinachs ( joana.gelabert.xirinachs@upc.edu )

Horas semanales

Teoría

Problemas

Laboratorio

Aprendizaje dirigido

Aprendizaje autónomo

Competencias

Resultados de aprendizaje

Conocimientos

K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.

K3 - Identificar los fundamentos matemáticos, las teorías informáticas, los esquemas algorítmicos y los principios de organización de la información aplicables al modelado de sistemas biológicos y a la resolución eficiente de problemas bioinformáticos mediante el diseño de herramientas computacionales.

K4 - Integrar los conceptos ofrecidos por los lenguajes de programación de mayor uso en el ámbito de las Ciencias de la Vida para modelar y optimizar estructuras de datos y construir algoritmos eficientes, relacionándolos entre sí y con sus casos de aplicación.

K5 - Identificar la naturaleza de las variables biológicas que es preciso analizar, así como los modelos matemáticos, los algoritmos y las pruebas estadísticas adecuadas para desarrollar y evaluar análisis estadísticos y herramientas computacionales.

Habilidades

S2 - Analizar computacionalmente secuencias de ADN, ARN y proteínas, incluyendo análisis comparativos de genomas, usando la computación, las matemáticas y la estadística como herramientas básicas de la bioinformática.

S3 - Resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones mediante la aplicación de métodos estadísticos y computacionales y modelos matemáticos.

S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.

S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.

Competencias

C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.

C6 - Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar este conocimiento.

Objetivos

Aplicar modelos de aprendizaje profundo a datos biológicos y biomédicos, seleccionando y adaptando arquitecturas como redes convolucionales, recurrentes y transformers para resolver problemas específicos en bioinformática y bioingeniería.
Competencias relacionadas: C6, K2, K3, S2, S3, S4,
Preprocesar, representar y analizar datos biomédicos heterogéneos (imágenes médicas, secuencias biológicas, señales fisiológicas), empleando herramientas computacionales modernas y buenas prácticas de programación científica.
Competencias relacionadas: C6, K4, K5, S4, C3, S8,
Interpretar y evaluar el rendimiento de modelos de deep learning en contextos biomédicos, utilizando métricas adecuadas y comprendiendo las limitaciones y riesgos éticos del uso de inteligencia artificial en biomedicina.
Competencias relacionadas: K4, K5, S4, C3, S8,

Contenidos

Introducción al aprendizaje profundo en bioinformática y bioingeniería
Introducción al aprendizaje profundo en bioinformática y bioingeniería, tipos de datos biológicos y herramientas de software para flujos de trabajo de aprendizaje efectivos.
Perceptrones multicapa: fundamentos del aprendizaje profundo
Una introducción a los componentes fundamentales del aprendizaje profundo a través de perceptrones multicapa (MLP), que abarca la arquitectura de red, las funciones de activación, la propagación hacia adelante y hacia atrás y su papel en el modelado de relaciones no lineales complejas en datos biológicos.
Análisis de imágenes biomédicas con CNN
Este módulo explora las redes neuronales convolucionales (CNN) para analizar imágenes biomédicas, centrándose en tareas de extracción de características, clasificación y segmentación en aplicaciones como patología, radiología y microscopía.
Modelado de series temporales y secuencias biológicas con RNN
Una mirada en profundidad a las redes neuronales recurrentes (RNN) y sus variantes para modelar datos biológicos secuenciales y temporales, incluidas series de tiempo, señales fisiológicas y secuencias de nucleótidos o proteínas.
Transformadores y mecanismos de atención para secuencias biológicas
Introducción a los mecanismos de atención y arquitecturas de transformadores, enfatizando su efectividad para capturar dependencias de largo alcance en secuencias biológicas para tareas como predicción de estructuras y anotación funcional.
Arquitecturas de codificador-decodificador
Diseño y aplicación de modelos codificadores-decodificadores para transformar, anotar y generar secuencias biológicas y datos biomédicos, con énfasis en RNN y variantes de transformadores, integración de atención y tareas de modelado de secuencias del mundo real.
Modelos de lenguaje y PNL en bioinformática y biomedicina
Este módulo explora cómo se aplican los modelos de lenguaje a textos biomédicos y secuencias biológicas, lo que permite tareas como el reconocimiento de entidades nombradas, la clasificación de documentos y la anotación funcional a través de modelos previamente entrenados como BioBERT, DNABERT y transformadores de secuencias de proteínas.

Actividades

Actividad Acto evaluativo

Clases teóricas

Objetivos: 1 2

Teoría

25h

Problemas

Laboratorio

Aprendizaje dirigido

Aprendizaje autónomo

45h

Laboratorios

Objetivos: 2 3

Teoría

Problemas

30h

Laboratorio

Aprendizaje dirigido

Aprendizaje autónomo

45h

Parcial.

Semana: 8

Teoría

Problemas

Laboratorio

Aprendizaje dirigido

Aprendizaje autónomo

Examen Final

Semana: 15 (Fuera de horario lectivo)

Teoría

Problemas

Laboratorio

Aprendizaje dirigido

Aprendizaje autónomo

Metodología docente

Las clases serán principalmente expositivas. También habrá sesiones prácticas y de práctica con Python.

Método de evaluación

La evaluación del curso es la siguiente:
- 30% corresponde a trabajos prácticos (en parejas),
- 70% consiste en dos exámenes teóricos parciales, uno parcial (35%) y otro final (35%).

Información sobre la recuperación:
Se puede recuperar.
Solo los alumnos que, tras la evaluación, obtengan una calificación igual o superior a 3 podrán realizar el examen de reevaluación. En el examen de reevaluación (R) sólo se reevalúa la parte teórica y la nota de reevaluación en este caso será 70%R más 30% de los trabajos prácticos realizados durante el curso

Bibliografía

Básico

Deep Learning for the Life Sciences - Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande, O'Reilly Media, Inc., ISBN: 9781492039839
Bioinformatics with Python Cookbook - Tiago Antão, ISBN: 978-1789344691

Capacidades previas

Python