Pasar al contenido principal

Aprendizaje Automático

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos , pero tiene capacidades previas
Departamento
ESAII
Este curso explora la aplicación de técnicas de aprendizaje profundo a la bioinformática y la bioingeniería, centrándose en los desafíos y oportunidades únicos que presentan los datos biológicos y biomédicos. Basándose en conocimientos previos de aprendizaje automático clásico, los estudiantes profundizarán en arquitecturas avanzadas de redes neuronales, incluyendo perceptrones multicapa, redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y transformadores. El curso abarca dominios clave como el análisis de imágenes biomédicas, el modelado de series temporales y secuencias, el modelado generativo con VAE y GAN, y el uso de modelos de lenguaje tanto para textos biomédicos como para secuencias biológicas.

Profesorado

Responsable

Otros

Horas semanales

Teoría
2
Problemas
2
Laboratorio
0
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Conocimientos

  • K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.
  • K3 - Identificar los fundamentos matemáticos, las teorías informáticas, los esquemas algorítmicos y los principios de organización de la información aplicables al modelado de sistemas biológicos y a la resolución eficiente de problemas bioinformáticos mediante el diseño de herramientas computacionales.
  • K4 - Integrar los conceptos ofrecidos por los lenguajes de programación de mayor uso en el ámbito de las Ciencias de la Vida para modelar y optimizar estructuras de datos y construir algoritmos eficientes, relacionándolos entre sí y con sus casos de aplicación.
  • K5 - Identificar la naturaleza de las variables biológicas que es preciso analizar, así como los modelos matemáticos, los algoritmos y las pruebas estadísticas adecuadas para desarrollar y evaluar análisis estadísticos y herramientas computacionales.
  • Habilidades

  • S2 - Analizar computacionalmente secuencias de ADN, ARN y proteínas, incluyendo análisis comparativos de genomas, usando la computación, las matemáticas y la estadística como herramientas básicas de la bioinformática.
  • S3 - Resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones mediante la aplicación de métodos estadísticos y computacionales y modelos matemáticos.
  • S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.
  • S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.
  • Competencias

  • C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.
  • C6 - Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar este conocimiento.
  • Objetivos

    1. Aplicar modelos de aprendizaje profundo a datos biológicos y biomédicos, seleccionando y adaptando arquitecturas como redes convolucionales, recurrentes y transformers para resolver problemas específicos en bioinformática y bioingeniería.
      Competencias relacionadas: C6, K2, K3, S2, S3, S4,
    2. Preprocesar, representar y analizar datos biomédicos heterogéneos (imágenes médicas, secuencias biológicas, señales fisiológicas), empleando herramientas computacionales modernas y buenas prácticas de programación científica.
      Competencias relacionadas: C6, K4, K5, S4, C3, S8,
    3. Interpretar y evaluar el rendimiento de modelos de deep learning en contextos biomédicos, utilizando métricas adecuadas y comprendiendo las limitaciones y riesgos éticos del uso de inteligencia artificial en biomedicina.
      Competencias relacionadas: K4, K5, S4, C3, S8,

    Contenidos

    1. Introducción al aprendizaje profundo en bioinformática y bioingeniería
      Introducción al aprendizaje profundo en bioinformática y bioingeniería, tipos de datos biológicos y herramientas de software para flujos de trabajo de aprendizaje efectivos.
    2. Perceptrones multicapa: fundamentos del aprendizaje profundo
      Una introducción a los componentes fundamentales del aprendizaje profundo a través de perceptrones multicapa (MLP), que abarca la arquitectura de red, las funciones de activación, la propagación hacia adelante y hacia atrás y su papel en el modelado de relaciones no lineales complejas en datos biológicos.
    3. Análisis de imágenes biomédicas con CNN
      Este módulo explora las redes neuronales convolucionales (CNN) para analizar imágenes biomédicas, centrándose en tareas de extracción de características, clasificación y segmentación en aplicaciones como patología, radiología y microscopía.
    4. Modelado de series temporales y secuencias biológicas con RNN
      Una mirada en profundidad a las redes neuronales recurrentes (RNN) y sus variantes para modelar datos biológicos secuenciales y temporales, incluidas series de tiempo, señales fisiológicas y secuencias de nucleótidos o proteínas.
    5. Transformadores y mecanismos de atención para secuencias biológicas
      Introducción a los mecanismos de atención y arquitecturas de transformadores, enfatizando su efectividad para capturar dependencias de largo alcance en secuencias biológicas para tareas como predicción de estructuras y anotación funcional.
    6. Arquitecturas de codificador-decodificador
      Diseño y aplicación de modelos codificadores-decodificadores para transformar, anotar y generar secuencias biológicas y datos biomédicos, con énfasis en RNN y variantes de transformadores, integración de atención y tareas de modelado de secuencias del mundo real.
    7. Modelos de lenguaje y PNL en bioinformática y biomedicina
      Este módulo explora cómo se aplican los modelos de lenguaje a textos biomédicos y secuencias biológicas, lo que permite tareas como el reconocimiento de entidades nombradas, la clasificación de documentos y la anotación funcional a través de modelos previamente entrenados como BioBERT, DNABERT y transformadores de secuencias de proteínas.

    Actividades

    Actividad Acto evaluativo


    Clases teóricas


    Objetivos: 1 2
    Teoría
    25h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    45h

    Laboratorios


    Objetivos: 2 3
    Teoría
    0h
    Problemas
    30h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    45h

    Parcial.



    Semana: 8
    Teoría
    0h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    0h

    Examen Final



    Semana: 15 (Fuera de horario lectivo)
    Teoría
    0h
    Problemas
    0h
    Laboratorio
    0h
    Aprendizaje dirigido
    0h
    Aprendizaje autónomo
    0h

    Metodología docente

    Las clases serán principalmente expositivas. También habrá sesiones prácticas y de práctica con Python.

    Método de evaluación

    La evaluación del curso es la siguiente:
    - 30% corresponde a trabajos prácticos (en parejas),
    - 70% consiste en dos exámenes teóricos parciales, uno parcial (35%) y otro final (35%).

    Información sobre la recuperación:
    Se puede recuperar.
    Solo los alumnos que, tras la evaluación, obtengan una calificación igual o superior a 3 podrán realizar el examen de reevaluación. En el examen de reevaluación (R) sólo se reevalúa la parte teórica y la nota de reevaluación en este caso será 70%R más 30% de los trabajos prácticos realizados durante el curso

    Bibliografía

    Básico

    • Deep Learning for the Life Sciences - Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande, O'Reilly Media, Inc., ISBN: 9781492039839
    • Bioinformatics with Python Cookbook - Tiago Antão, ISBN: 978-1789344691

    Capacidades previas

    Python