Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos
, pero tiene capacidades previas
Departamento
UPF;UAB
La asignatura se compone de tres bloques principales:
- Programación dinámica y alineación de secuencias: Programación dinámica. Alineación por pares (algoritmos de Needleman-Wunsch y Smith-Waterman). BLAST. Alineación múltiple de secuencias. Otras aplicaciones.
- Análisis de datos genómicos: Tecnologías de secuenciación. Genómica computacional. Principales formatos de archivo para datos de secuencias. Alineadores de coincidencia aproximada de cadenas para lecturas de secuenciación. Algoritmos y estrategias de ensamblaje del genoma.
- Métodos de agrupamiento y algoritmos en genómica: Modelos ocultos de Markov (HMM). Análisis de componentes principales (PCA). Parsimonia. Métodos de máxima verosimilitud. Algoritmos genéticos.
El lenguaje de programación utilizado en este curso es Python, con especial énfasis en la resolución de problemas aplicados a la genómica y al agrupamiento. Siguiendo un enfoque de aprendizaje basado en problemas, los estudiantes escribirán sus propios scripts y/o utilizarán enfoques bioinformáticos preexistentes para diferentes desafíos. Fomentaremos el uso de bibliotecas de Python (para estadísticas y gráficos) y clases.
Profesorado
Responsable
- Arnau Cordomí Montoya ( arnau.cordomi@uab.cat )
Otros
- Donate Weghorn ( dweghorn@crg.eu )
- Emanuele Raineri ( emanuele.raineri@cnag.eu )
- Oscar Lao Grueso ( oscar.lao@ibe.upf-csic.es )
Horas semanales
Teoría
2
Problemas
2
Laboratorio
0
Aprendizaje dirigido
0
Aprendizaje autónomo
6
Competencias
Conocimientos
Habilidades
Competencias
Objetivos
-
Presentar su trabajo frente a sus compañeros
Competencias relacionadas: C3, -
Colaborar con otros estudiantes para realizar una tarea de proyecto.
Competencias relacionadas: C4, -
Desarrollo de modelos matemáticos para trabajar con secuencias biológicas durante las tareas prácticas utilizando el lenguaje de programación Python. Se proporcionarán diversas herramientas para visualizar los resultados.
Competencias relacionadas: K2, K4, K7, S1, S2, S3, S4, S5, S7, S8, -
Desarrollando habilidades de programación óptimas para minimizar el tiempo computacional y la huella del cambio climático global.
Competencias relacionadas: C2, -
Comprender cómo el alineamiento de secuencias y la filogenética se pueden aplicar a la medicina.
Competencias relacionadas: K1,
Contenidos
-
Contenido Teórico
T1. Introducción al alineamiento de secuencias
T2. Funciones de puntuación
T3. Alineamiento por pares global y local (programación dinámica)
T4. Herramienta básica de alineamiento local (BLAST)
T5. Programación dinámica avanzada
T6. Alineamiento múltiple de secuencias
T7. Tecnologías de secuenciación y fundamentos de la genómica computacional
T8. Alineamiento de lecturas cortas e indexación comprimida
T9. Algoritmos de ensamblaje de genomas
T10. Introducción a los árboles filogenéticos y a los algoritmos
T11. Métodos basados en distancias
T12. Métodos basados en caracteres
Actividades
Actividad Acto evaluativo
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Alineadores de coincidencia aproximada de cadenas para lecturas cortas. Fundamentos de la Transformada Burrows-Wheeler. Introducción a la alineación de lecturas largas.
Alineadores de coincidencia aproximada de cadenas para lecturas cortas. Fundamentos de la Transformada Burrows-Wheeler. Introducción a la alineación de lecturas largas.Objetivos: 3
Contenidos:
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Ensamblaje de novo del genoma. Ensamblaje de lecturas cortas: gráfico de De Bruijn y consenso de superposición-layout. Ensamblaje de lecturas largas e híbrido. Andamiaje.
Ensamblaje de novo del genoma. Ensamblaje de lecturas cortas: gráfico de De Bruijn y consenso de superposición-layout. Ensamblaje de lecturas largas e híbrido. Andamiaje.Objetivos: 3
Contenidos:
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Elementos básicos y algoritmos básicos en filogenias.
Elementos básicos y algoritmos básicos en filogenias.Objetivos: 5
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Métodos de filogenia basados en carácteres. Parsimonia, máxima verosimilitud y filogenia bayesiana.
Métodos de filogenia basados en carácteres. Parsimonia, máxima verosimilitud y filogenia bayesiana.Objetivos: 3 4 5
Contenidos:
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Funciones de puntuación
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Alineamiento por pares global y local (programación dinámica)
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Programación dinámica avanzada
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Alineamiento múltiple de secuencias
Teoría
2.3h
Problemas
2.3h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h
Metodología docente
Enfoque de aprendizaje basado en problemas:- Clases teóricas.
- Ejercicios prácticos de programación directamente relacionados con la teoría.
- Proyecto grupal en algoritmos y aplicaciones bioinformáticas.
Método de evaluación
- Evaluación continua (EC) 20%: Cuestionarios y entrega de ejercicios.- Proyecto en grupo (PG) 20%: Evaluado mediante una rúbrica que se publicará en el Moodle de la asignatura.
- Exámenes 60%: Examen parcial (EP) 30%, Examen final (EF) 30%. Las rúbricas de evaluación de los exámenes se publicarán en el Moodle de la asignatura.
- Recuperación: Consta de dos exámenes (E1 y E2), correspondientes a cada uno de los bloques de la asignatura. La nota final tras la recuperación se calculará como: 20% EC + 20% PG + 30% max(EP, E1) + 30% max(EF, E2).
Bibliografía
Básico
-
Biological sequence analysis : probabilistic models of proteins and nucleic acids
- Durbin, Richard... [et al.],
Cambridge University Press,
1998.
ISBN: 0521629713
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=320915 -
Bioinformatics algorithms: an active learning approach
- Compeau, Phillip P; Pevzner, Pavel.,
Active Learning Publishers.,
2015.
ISBN: 9780990374619
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004091329706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Problems and Solutions in Biological Sequence Analysis
- Borodovsky, Mark; Ekisheva, Svetlana,
Cambridge University Press,
2006.
ISBN: 9780521612302
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004123449706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing
- Lemey,P; Salemi, M; Vandamme, A,
Cambridge University Press,
2009.
ISBN: 9786612539510
https://www-cambridge-org.recursos.biblioteca.upc.edu/core/books/phylogenetic-handbook/A9D63A454E76A5EBCCF1119B3C56D766