Aquest curs presenta els fonaments de l'anàlisi de seqüències de dades biològiques, des dels algorismes bàsics fins a les seves principals aplicacions.
L'assignatura es compon de tres blocs principals:
Anàlisi de dades genòmiques: Tecnologies de seqüenciació. Genòmica computacional. Principals formats d'arxiu per a dades de seqüències. Alineadors de coincidència aproximada de cadenes per a lectures de seqüenciació. Algorismes i estratègies de muntatge del genoma.
Programació dinàmica i alineació de seqüències: Programació dinàmica. Alineació per parelles (algorismes de Needleman-Wunsch i Smith-Waterman). BLAST. Alineació múltiple de seqüències. Altres aplicacions.
Mètodes d'agrupament i algorismes en genòmica: Models ocults de Markov (HMM). Anàlisi de components principals (PCA). Parsimònia. Mètodes de màxima versemblança. Algorismes genètics.
El llenguatge de programació utilitzat en aquest curs és Python, amb especial èmfasi en la resolució de problemes aplicats a la genòmica i a l'agrupament. Seguint un enfocament d'aprenentatge basat en problemes, els estudiants escriuran els seus propis scripts i/o utilitzaran enfocaments bioinformàtics preexistents per a diferents desafiaments. Fomentarem l'ús de biblioteques de Python (per a estadístiques i gràfics) i classes.
Professorat
Responsable
Arnau Cordomí Montoya (
)
Fernando Cruz Rodríguez (
)
Oscar Lao Grueso (
)
Hores setmanals
Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6
Resultats d'aprenentatge
Resultats d'aprenentatge
Coneixements
K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.
Habilitats
S1 - Integrar dades òmiques i clíniques per a obtenir una major comprensió i una millor anàlisi dels fenòmens biològics
S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.
Competències
C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.
Objectius
Presentar el seu treball davant dels seus companys
Competències relacionades:
C3,
Col·laborar amb altres estudiants per dur a terme una tasca de projecte.
Competències relacionades:
C4,
Desenvolupament de models matemàtics per treballar amb seqüències biològiques durant les pràctiques utilitzant el llenguatge de programació Python. Es proporcionaran diferents eines per visualitzar els resultats.
Competències relacionades:
K2,
K4,
K7,
S1,
S2,
S3,
S4,
S5,
S7,
S8,
Desenvolupant habilitats de programació òptimes per minimitzar el temps computacional i l'empremta del canvi climàtic global.
Competències relacionades:
C2,
Entendre com l'alineació de seqüències i la filogenètica es poden aplicar a la medicina.
Competències relacionades:
K1,
Continguts
Contingut Teoric
T1 = Tecnologies de seqüenciació. Genòmica computacional. Formats de fitxer per a dades de seqüències.
T2 = Alineació de seqüències per parelles
T3 = BLAST i alineació de seqüències múltiples
T4 = Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
T5 = assemblatge del genoma de novo. Muntatge de lectura breu: gràfic de Debruijn i consens de disseny de superposició. Lectura llarga i muntatge híbrid. Bastida.
T6 = Models de Markov ocults per a seqüències.
T7 = Fonaments de Filogenètica. Algorismes bàsics en filogenètica.
T8 = Filogenètica Mètodes basats en la distància.
T9 = Mètodes basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana.
Activitats
ActivitatActe avaluatiu
Introducciò a L'anàlisi de Dades Genòmiques
Tecnologies de seqüenciació. Genòmica computacional. Formats d'arxiu per a dades de seqüències. Objectius:35 Continguts:
Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga. Objectius:3 Continguts:
Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding
Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding Objectius:3 Continguts:
Classes teòriques.
Exercicis pràctics de programació directament relacionats amb la teoria.
Projecte grupal en algorismes i aplicacions bioinformàtiques.
Mètode d'avaluació
Avaluació contínua 20%: Qüestionaris i lliurament d'exercicis
Projecte grupal 20%: La rúbrica d'avaluació es publicarà al Moodle de l'assignatura
Exàmens 60%: La rúbrica d'avaluació es publicarà al Moodle de l'assignatura.
Recuperació: La nota de l'examen de recuperació substitueix la nota de l'examen final.
Bioinformatics algorithms. An active learning approach. -
Compeau, Phillip P; Pevzner, Pavel.,
Active Learning Publishers. , 2014. ISBN: 9780990374602
Problems and Solutions in Biological Sequence Analysis -
Borodovsky, Mark; Ekisheva, Svetlana,
Cambridge University Press, 2006. ISBN: 978-0521847544
The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing -
Lemey,P; Salemi, M; Vandamme, A,
Cambridge, 2009. ISBN: 978-0521730716
Web links
Will be provided during the lecture presentations http://None