El curso presenta algunas de las principales técnicas y herramientas utilizadas en genómica y pangenómica, tales como: concordancia de cadenas exacta y aproximada, alineación de secuencias múltiples y por pares, y concordancia de patrones y alineación de cadenas degeneradas.
Profesorado
Responsable
Gabriel Valiente Feruglio (
)
Otros
Santiago Marco Sola (
)
Horas semanales
Teoría
2
Problemas
1
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
8.5
Competencias
Competencias Técnicas de cada especialidad
Dirección y gestión
CDG1 - Capacidad para la integración de tecnologías, aplicaciones, servicios y sistemas propios de la Ingeniería Informática, con carácter generalista, y en contextos más amplios y multidisciplinares.
Específicas
CTE7 - Capacidad para comprender y poder aplicar conocimientos avanzados de computación de altas prestaciones y métodos numéricos o computacionales a problemas de ingeniería.
CTE9 - Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento.
Competencias Técnicas Genéricas
Genéricas
CG4 - Capacidad para el modelado matemático, cálculo y simulación en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación, desarrollo e innovación en todos los ámbitos relacionados con la Ingeniería en Informática.
Competencias Transversales
Uso solvente de los recursos de información
CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.
Básicas
CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
Objetivos
Comprender algoritmos y estructuras de datos de coincidencia de patrones y su implementación en un lenguaje de programación moderno, y aplicarlos para resolver problemas prácticos en bioinformática.
Competencias relacionadas:
CB6,
CTR4,
CDG1,
CTE7,
CTE9,
CG4,
Contenidos
Algoritmos y estructuras de datos eficientes de búsqueda
Se mostrarán los algoritmos más eficientes para buscar patrones en textos en función del alfabeto y la longitud y número de patrones. También se explicarán estructuras de datos que son muy útiles para comparar genomas, como árboles de sufijos, matrices de sufijos y la transformada de Burrows-Wheeler.
Alineación de secuencias
Se explicará la programación dinámica y hablaremos de su aplicación para calcular la distancia de edición entre dos palabras, para la búsqueda aproximada de una palabra en un texto y encontrar la mejor alineación entre dos secuencias. También estudiaremos cómo generalizar la alineación a múltiples secuencias.
Búsquedas en bases de datos: BLAST
Se introducirán los fundamentos computacionales y estadísticos del algoritmo BLAST y su uso para búsquedas aproximadas en bases de datos.
Alineación de cadenas degeneradas
Se explicará la generalización a pangenomas de los problemas de búsqueda de patrones en genomas y se introducirán las extensiones del algoritmo de Boyes-Moore y de la transformada de Burrows-Wheeler para la alineación de cadenas degeneradas.
Actividades
ActividadActo evaluativo
Algoritmos y estructuras de datos eficientes de búsqueda
En las sesiones teóricas, el profesor introducirá algoritmos y estructuras de datos, combinándolos con ejemplos y resolución de problemas. En las sesiones de resolución de problemas, los estudiantes trabajarán su propia resolución de problemas, bajo la supervisión y asistencia del profesor.
Método de evaluación
Habrá un examen final (a mitad de cuatrimestre), en el que los estudiantes explicarán algoritmos y estructuras de datos avanzadas de la literatura de investigación. La nota final será sólo la nota del examen final.