Este curso explora la aplicación de técnicas de aprendizaje profundo a la bioinformática y la bioingeniería, centrándose en los desafíos y oportunidades únicos que presentan los datos biológicos y biomédicos. Basándose en conocimientos previos de aprendizaje automático clásico, los estudiantes profundizarán en arquitecturas avanzadas de redes neuronales, incluyendo perceptrones multicapa, redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y transformadores. El curso abarca dominios clave como el análisis de imágenes biomédicas, el modelado de series temporales y secuencias, el modelado generativo con VAE y GAN, y el uso de modelos de lenguaje tanto para textos biomédicos como para secuencias biológicas.
Profesorado
Responsable
-
Alexandre Perera Lluna (
)
Resultados de aprendizaje
Resultados de aprendizaje
Conocimientos
-
K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.
-
K3 - Identificar los fundamentos matemáticos, las teorías informáticas, los esquemas algorítmicos y los principios de organización de la información aplicables al modelado de sistemas biológicos y a la resolución eficiente de problemas bioinformáticos mediante el diseño de herramientas computacionales.
-
K4 - Integrar los conceptos ofrecidos por los lenguajes de programación de mayor uso en el ámbito de las Ciencias de la Vida para modelar y optimizar estructuras de datos y construir algoritmos eficientes, relacionándolos entre sí y con sus casos de aplicación.
-
K5 - Identificar la naturaleza de las variables biológicas que es preciso analizar, así como los modelos matemáticos, los algoritmos y las pruebas estadísticas adecuadas para desarrollar y evaluar análisis estadísticos y herramientas computacionales.
Habilidades
-
S2 - Analizar computacionalmente secuencias de ADN, ARN y proteínas, incluyendo análisis comparativos de genomas, usando la computación, las matemáticas y la estadística como herramientas básicas de la bioinformática.
-
S3 - Resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones mediante la aplicación de métodos estadísticos y computacionales y modelos matemáticos.
-
S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.
-
S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.
Competencias
-
C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.
-
C6 - Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar este conocimiento.
Objetivos
-
Aplicar modelos de aprendizaje profundo a datos biológicos y biomédicos, seleccionando y adaptando arquitecturas como redes convolucionales, recurrentes y transformers para resolver problemas específicos en bioinformática y bioingeniería.
Competencias relacionadas:
C6,
K2,
K3,
S2,
S3,
S4,
-
Preprocesar, representar y analizar datos biomédicos heterogéneos (imágenes médicas, secuencias biológicas, señales fisiológicas), empleando herramientas computacionales modernas y buenas prácticas de programación científica.
Competencias relacionadas:
C6,
K4,
K5,
S4,
S8,
C3,
-
Interpretar y evaluar el rendimiento de modelos de deep learning en contextos biomédicos, utilizando métricas adecuadas y comprendiendo las limitaciones y riesgos éticos del uso de inteligencia artificial en biomedicina.
Competencias relacionadas:
C3,
K4,
K5,
S4,
S8,
Contenidos
-
Introducción al aprendizaje profundo en bioinformática y bioingeniería
Introducción al aprendizaje profundo en bioinformática y bioingeniería, tipos de datos biológicos y herramientas de software para flujos de trabajo de aprendizaje efectivos.
-
Perceptrones multicapa: fundamentos del aprendizaje profundo
Una introducción a los componentes fundamentales del aprendizaje profundo a través de perceptrones multicapa (MLP), que abarca la arquitectura de red, las funciones de activación, la propagación hacia adelante y hacia atrás y su papel en el modelado de relaciones no lineales complejas en datos biológicos.
-
Análisis de imágenes biomédicas con CNN
Este módulo explora las redes neuronales convolucionales (CNN) para analizar imágenes biomédicas, centrándose en tareas de extracción de características, clasificación y segmentación en aplicaciones como patología, radiología y microscopía.
-
Modelado de series temporales y secuencias biológicas con RNN
Una mirada en profundidad a las redes neuronales recurrentes (RNN) y sus variantes para modelar datos biológicos secuenciales y temporales, incluidas series de tiempo, señales fisiológicas y secuencias de nucleótidos o proteínas.
-
Transformadores y mecanismos de atención para secuencias biológicas
Introducción a los mecanismos de atención y arquitecturas de transformadores, enfatizando su efectividad para capturar dependencias de largo alcance en secuencias biológicas para tareas como predicción de estructuras y anotación funcional.
-
Arquitecturas de codificador-decodificador
Diseño y aplicación de modelos codificadores-decodificadores para transformar, anotar y generar secuencias biológicas y datos biomédicos, con énfasis en RNN y variantes de transformadores, integración de atención y tareas de modelado de secuencias del mundo real.
-
Modelos de lenguaje y PNL en bioinformática y biomedicina
Este módulo explora cómo se aplican los modelos de lenguaje a textos biomédicos y secuencias biológicas, lo que permite tareas como el reconocimiento de entidades nombradas, la clasificación de documentos y la anotación funcional a través de modelos previamente entrenados como BioBERT, DNABERT y transformadores de secuencias de proteínas.
Actividades
Actividad
Acto evaluativo
Clases teóricas
Objetivos:
1
2
Laboratorios
Objetivos:
2
3
Examen Final
Semana:
15 (Fuera de horario lectivo)
Metodología docente
Las clases serán principalmente expositivas. También habrá sesiones prácticas y de práctica con Python.
Método de evaluación
La evaluación del curso es la siguiente:
- 30% corresponde a trabajos prácticos (en parejas),
- 70% consiste en dos exámenes teóricos parciales, uno parcial (35%) y otro final (35%).
Información sobre la recuperación:
Se puede recuperar.
Solo los alumnos que, tras la evaluación, obtengan una calificación igual o superior a 3 podrán realizar el examen de reevaluación. En el examen de reevaluación (R) sólo se reevalúa la parte teórica y la nota de reevaluación en este caso será 70%R más 30% de los trabajos prácticos realizados durante el curso
Bibliografía
Básica:
-
Deep Learning for the Life Sciences -
Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande,
O'Reilly Media, Inc., ISBN: 9781492039839
-
Bioinformatics with Python Cookbook -
Tiago Antão,
ISBN: 978-1789344691
Capacidades previas
Python