Algorismes en Biologia

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
UPF;UAB
Aquest curs presenta els fonaments de l'anàlisi de seqüències de dades biològiques, des dels algorismes bàsics fins a les seves principals aplicacions.

L'assignatura es compon de tres blocs principals:
- Programació dinàmica i alineació de seqüències: Programació dinàmica. Alineació per parelles (algorismes de Needleman-Wunsch i Smith-Waterman). BLAST. Alineació múltiple de seqüències. Altres aplicacions.
- Anàlisi de dades genòmiques: Tecnologies de seqüenciació. Genòmica computacional. Principals formats d'arxiu per a dades de seqüències. Alineadors de coincidència aproximada de cadenes per a lectures de seqüenciació. Algorismes i estratègies de muntatge del genoma.
- Mètodes d'agrupament i algorismes en genòmica: Models ocults de Markov (HMM). Anàlisi de components principals (PCA). Parsimònia. Mètodes de màxima versemblança. Algorismes genètics.

El llenguatge de programació utilitzat en aquest curs és Python, amb especial èmfasi en la resolució de problemes aplicats a la genòmica i a l'agrupament. Seguint un enfocament d'aprenentatge basat en problemes, els estudiants escriuran els seus propis scripts i/o utilitzaran enfocaments bioinformàtics preexistents per a diferents desafiaments. Fomentarem l'ús de biblioteques de Python (per a estadístiques i gràfics) i classes.

Professorat

Responsable

  • Arnau Cordomí Montoya ( )

Altres

  • Donate Weghorn ( )
  • Emanuele Raineri ( )
  • Oscar Lao Grueso ( )

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Resultats d'aprenentatge

Resultats d'aprenentatge

Coneixements

  • K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
  • K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
  • K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
  • K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.

Habilitats

  • S1 - Integrar dades òmiques i clíniques per a obtenir una major comprensió i una millor anàlisi dels fenòmens biològics
  • S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
  • S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
  • S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
  • S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
  • S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
  • S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.

Competències

  • C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
  • C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
  • C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.

Objectius

  1. Presentar el seu treball davant dels seus companys
    Competències relacionades: C3,
  2. Col·laborar amb altres estudiants per dur a terme una tasca de projecte.
    Competències relacionades: C4,
  3. Desenvolupament de models matemàtics per treballar amb seqüències biològiques durant les pràctiques utilitzant el llenguatge de programació Python. Es proporcionaran diferents eines per visualitzar els resultats.
    Competències relacionades: K2, K4, K7, S1, S2, S3, S4, S5, S7, S8,
  4. Desenvolupant habilitats de programació òptimes per minimitzar el temps computacional i l'empremta del canvi climàtic global.
    Competències relacionades: C2,
  5. Entendre com l'alineació de seqüències i la filogenètica es poden aplicar a la medicina.
    Competències relacionades: K1,

Continguts

  1. Contingut Teòric
    T1. Introducció a l'alineament de seqüències
    T2. Funcions de puntuació
    T3. Alineament per parelles global i local (programació dinàmica)
    T4. Eina bàsica d'alineament local (BLAST)
    T5. Programació dinàmica avançada
    T6. Alineament múltiple de seqüències
    T7. Tecnologies de seqüenciació i fonaments de la genòmica computacional
    T8. Alineament de lectures curtes i indexació comprimida
    T9. Algorismes d'assemblatge de genomes
    T10. Introducció als arbres filogenètics i als algorismes
    T11. Mètodes basats en distàncies
    T12. Mètodes basats en caràcters

Activitats

Activitat Acte avaluatiu


Introducció a l¿alineament de seqüències


Objectius: 3
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

BLAST



Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.

Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
Objectius: 3
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding

Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding
Objectius: 3
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Tecnologies de seqüenciació i fonaments de la genòmica computacional


Objectius: 3 4
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Elements bàsics i algoritmes bàsics en filogènies.

Elements bàsics i algoritmes bàsics en filogènies.
Objectius: 5
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Filogenètica Mètodes basats en la distància.

Filogenètica Mètodes basats en la distància.
Objectius: 3 5
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana

Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana
Objectius: 3 4 5
Continguts:
Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Projecte grupal en algorismes i aplicacions bioinformàtiques.

Projecte grupal en algorismes i aplicacions bioinformàtiques.
Objectius: 1 2 4
Continguts:
Teoria
2.4h
Problemes
2.4h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
18h

Scoring functions



Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Alineament per parelles global i local (programació dinàmica)



Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Programació dinàmica avançada



Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Alineament múltiple de seqüències



Teoria
2.3h
Problemes
2.3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h

Metodologia docent

Enfocament d'aprenentatge basat en problemes:

- Classes teòriques.
- Exercicis pràctics de programació directament relacionats amb la teoria.
- Projecte grupal en algorismes i aplicacions bioinformàtiques.

Mètode d'avaluació

- Avaluació contínua (AC) 20%: Qüestionaris i lliurament d'exercicis.

- Projecte en grup (PG) 20%: Avaluat mitjançant una rúbrica que es publicarà al Moodle de l'assignatura.

- Exàmens 60%: Examen parcial (EP) 30%, Examen final (EF) 30%. Les rúbriques d'avaluació dels exàmens es publicaran al Moodle de l'assignatura.

- Recuperació: Consta de dos exàmens (E1 i E2), corresponents a cadascun dels blocs de l'assignatura. La nota final després de la recuperació es calcularà com: 20% AC + 20% PG + 30% max(EP, E1) + 30% max(EF, E2).

Bibliografia

Bàsica:

Capacitats prèvies

Programació Aplicada I, II i III