Algorismes en Biologia

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
UPF
Aquest curs presenta els fonaments de l'anàlisi de seqüències de dades biològiques, des dels algorismes bàsics fins a les seves principals aplicacions.

L'assignatura es compon de tres blocs principals:

Anàlisi de dades genòmiques: Tecnologies de seqüenciació. Genòmica computacional. Principals formats d'arxiu per a dades de seqüències. Alineadors de coincidència aproximada de cadenes per a lectures de seqüenciació. Algorismes i estratègies de muntatge del genoma.
Programació dinàmica i alineació de seqüències: Programació dinàmica. Alineació per parelles (algorismes de Needleman-Wunsch i Smith-Waterman). BLAST. Alineació múltiple de seqüències. Altres aplicacions.
Mètodes d'agrupament i algorismes en genòmica: Models ocults de Markov (HMM). Anàlisi de components principals (PCA). Parsimònia. Mètodes de màxima versemblança. Algorismes genètics.

El llenguatge de programació utilitzat en aquest curs és Python, amb especial èmfasi en la resolució de problemes aplicats a la genòmica i a l'agrupament. Seguint un enfocament d'aprenentatge basat en problemes, els estudiants escriuran els seus propis scripts i/o utilitzaran enfocaments bioinformàtics preexistents per a diferents desafiaments. Fomentarem l'ús de biblioteques de Python (per a estadístiques i gràfics) i classes.

Professorat

Responsable

  • Arnau Cordomí Montoya ( )
  • Fernando Cruz Rodríguez ( )
  • Oscar Lao Grueso ( )

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Resultats d'aprenentatge

Resultats d'aprenentatge

Coneixements

  • K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
  • K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
  • K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
  • K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.

Habilitats

  • S1 - Integrar dades òmiques i clíniques per a obtenir una major comprensió i una millor anàlisi dels fenòmens biològics
  • S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
  • S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
  • S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
  • S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
  • S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
  • S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.

Competències

  • C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
  • C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
  • C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.

Objectius

  1. Presentar el seu treball davant dels seus companys
    Competències relacionades: C3,
  2. Col·laborar amb altres estudiants per dur a terme una tasca de projecte.
    Competències relacionades: C4,
  3. Desenvolupament de models matemàtics per treballar amb seqüències biològiques durant les pràctiques utilitzant el llenguatge de programació Python. Es proporcionaran diferents eines per visualitzar els resultats.
    Competències relacionades: K2, K4, K7, S1, S2, S3, S4, S5, S7, S8,
  4. Desenvolupant habilitats de programació òptimes per minimitzar el temps computacional i l'empremta del canvi climàtic global.
    Competències relacionades: C2,
  5. Entendre com l'alineació de seqüències i la filogenètica es poden aplicar a la medicina.
    Competències relacionades: K1,

Continguts

  1. Contingut Teoric
    T1 = Tecnologies de seqüenciació. Genòmica computacional. Formats de fitxer per a dades de seqüències.
    T2 = Alineació de seqüències per parelles
    T3 = BLAST i alineació de seqüències múltiples
    T4 = Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
    T5 = assemblatge del genoma de novo. Muntatge de lectura breu: gràfic de Debruijn i consens de disseny de superposició. Lectura llarga i muntatge híbrid. Bastida.
    T6 = Models de Markov ocults per a seqüències.
    T7 = Fonaments de Filogenètica. Algorismes bàsics en filogenètica.
    T8 = Filogenètica Mètodes basats en la distància.
    T9 = Mètodes basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana.

Activitats

Activitat Acte avaluatiu


Introducciò a L'anàlisi de Dades Genòmiques

Tecnologies de seqüenciació. Genòmica computacional. Formats d'arxiu per a dades de seqüències.
Objectius: 3 5
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Alineament de seqüències per parelles

Alineament de seqüències per parelles
Objectius: 3
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

BLAST i alineació de seqüències múltiples

BLAST i alineació de seqüències múltiples

Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.

Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
Objectius: 3
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding

Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding
Objectius: 3
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Models de Hidden Markov

Models de Hidden Markov
Objectius: 3 4
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Elements bàsics i algoritmes bàsics en filogènies.

Elements bàsics i algoritmes bàsics en filogènies.
Objectius: 5
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Filogenètica Mètodes basats en la distància.

Filogenètica Mètodes basats en la distància.
Objectius: 3 5
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana

Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana
Objectius: 3 4 5
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Projecte grupal en algorismes i aplicacions bioinformàtiques.

Projecte grupal en algorismes i aplicacions bioinformàtiques.
Objectius: 1 2 4
Continguts:
Teoria
3h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
36h

Metodologia docent

Enfocament d'aprenentatge basat en problemes:

Classes teòriques.
Exercicis pràctics de programació directament relacionats amb la teoria.
Projecte grupal en algorismes i aplicacions bioinformàtiques.

Mètode d'avaluació

Avaluació contínua 20%: Qüestionaris i lliurament d'exercicis
Projecte grupal 20%: La rúbrica d'avaluació es publicarà al Moodle de l'assignatura
Exàmens 60%: La rúbrica d'avaluació es publicarà al Moodle de l'assignatura.

Recuperació: La nota de l'examen de recuperació substitueix la nota de l'examen final.

Bibliografia

Bàsica:

  • Biological sequence analysis [Recurs electrònic] : probabilistic models of proteins and nucleic acids - Durbin, Richard, Cambridge University Press, 1998. ISBN: 9780521620413
    https://discovery.upc.edu/discovery/fulldisplay?docid=alma991000581539706711&context=L&vid=34CSUC_UPC:VU1
  • Bioinformatics algorithms. An active learning approach. - Compeau, Phillip P; Pevzner, Pavel., Active Learning Publishers. , 2014. ISBN: 9780990374602
  • Problems and Solutions in Biological Sequence Analysis - Borodovsky, Mark; Ekisheva, Svetlana, Cambridge University Press, 2006. ISBN: 978-0521847544
  • The Phylogenetic Handbook: A Practical Approach to Phylogenetic Analysis and Hypothesis Testing - Lemey,P; Salemi, M; Vandamme, A, Cambridge, 2009. ISBN: 978-0521730716

Web links

  • Will be provided during the lecture presentations http://None

Capacitats prèvies

Programació Aplicada I, II i III