Vés al contingut

Algorismes en Biologia

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits , però té capacitats prèvies
Departament
UPF;UAB
Aquest curs presenta els fonaments de l'anàlisi de seqüències de dades biològiques, des dels algorismes bàsics fins a les seves principals aplicacions.

L'assignatura es compon de tres blocs principals:
- Programació dinàmica i alineació de seqüències: Programació dinàmica. Alineació per parelles (algorismes de Needleman-Wunsch i Smith-Waterman). BLAST. Alineació múltiple de seqüències. Altres aplicacions.
- Anàlisi de dades genòmiques: Tecnologies de seqüenciació. Genòmica computacional. Principals formats d'arxiu per a dades de seqüències. Alineadors de coincidència aproximada de cadenes per a lectures de seqüenciació. Algorismes i estratègies de muntatge del genoma.
- Mètodes d'agrupament i algorismes en genòmica: Models ocults de Markov (HMM). Anàlisi de components principals (PCA). Parsimònia. Mètodes de màxima versemblança. Algorismes genètics.

El llenguatge de programació utilitzat en aquest curs és Python, amb especial èmfasi en la resolució de problemes aplicats a la genòmica i a l'agrupament. Seguint un enfocament d'aprenentatge basat en problemes, els estudiants escriuran els seus propis scripts i/o utilitzaran enfocaments bioinformàtics preexistents per a diferents desafiaments. Fomentarem l'ús de biblioteques de Python (per a estadístiques i gràfics) i classes.

Professorat

Responsable

Altres

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Coneixements

  • K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
  • K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
  • K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
  • K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.
  • Habilitats

  • S1 - Integrar dades òmiques i clíniques per a obtenir una major comprensió i una millor anàlisi dels fenòmens biològics
  • S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
  • S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
  • S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
  • S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
  • S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
  • S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.
  • Competències

  • C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
  • C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
  • C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.
  • Objectius

    1. Presentar el seu treball davant dels seus companys
      Competències relacionades: C3,
    2. Col·laborar amb altres estudiants per dur a terme una tasca de projecte.
      Competències relacionades: C4,
    3. Desenvolupament de models matemàtics per treballar amb seqüències biològiques durant les pràctiques utilitzant el llenguatge de programació Python. Es proporcionaran diferents eines per visualitzar els resultats.
      Competències relacionades: K2, K4, K7, S1, S2, S3, S4, S5, S7, S8,
    4. Desenvolupant habilitats de programació òptimes per minimitzar el temps computacional i l'empremta del canvi climàtic global.
      Competències relacionades: C2,
    5. Entendre com l'alineació de seqüències i la filogenètica es poden aplicar a la medicina.
      Competències relacionades: K1,

    Continguts

    1. Contingut Teòric
      T1. Introducció a l'alineament de seqüències
      T2. Funcions de puntuació
      T3. Alineament per parelles global i local (programació dinàmica)
      T4. Eina bàsica d'alineament local (BLAST)
      T5. Programació dinàmica avançada
      T6. Alineament múltiple de seqüències
      T7. Tecnologies de seqüenciació i fonaments de la genòmica computacional
      T8. Alineament de lectures curtes i indexació comprimida
      T9. Algorismes d'assemblatge de genomes
      T10. Introducció als arbres filogenètics i als algorismes
      T11. Mètodes basats en distàncies
      T12. Mètodes basats en caràcters

    Activitats

    Activitat Acte avaluatiu


    Introducció a l¿alineament de seqüències


    Objectius: 3
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    BLAST



    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.

    Alineadors aproximats de coincidència de cadenes per a lectures curtes. Fonaments de la transformació Burrow-Wheeler. Introducció Alineació de lectura llarga.
    Objectius: 3
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding

    Ensamblatge de genomes de nou. Ensamblatge de fragments curts. Fonamentals de la transformació Burrow-Wheeler. Introducció a l'aliniament de fragments llargs. Scaffolding
    Objectius: 3
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Tecnologies de seqüenciació i fonaments de la genòmica computacional


    Objectius: 3 4
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Elements bàsics i algoritmes bàsics en filogènies.

    Elements bàsics i algoritmes bàsics en filogènies.
    Objectius: 5
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Filogenètica Mètodes basats en la distància.

    Filogenètica Mètodes basats en la distància.
    Objectius: 3 5
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana

    Mètodes de filogènia basats en caràcters. Parsimònia, màxima versemblança i filogenètica bayesiana
    Objectius: 3 4 5
    Continguts:
    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Projecte grupal en algorismes i aplicacions bioinformàtiques.

    Projecte grupal en algorismes i aplicacions bioinformàtiques.
    Objectius: 1 2 4
    Continguts:
    Teoria
    2.4h
    Problemes
    2.4h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    18h

    Scoring functions



    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Alineament per parelles global i local (programació dinàmica)



    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Programació dinàmica avançada



    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Alineament múltiple de seqüències



    Teoria
    2.3h
    Problemes
    2.3h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6h

    Metodologia docent

    Enfocament d'aprenentatge basat en problemes:

    - Classes teòriques.
    - Exercicis pràctics de programació directament relacionats amb la teoria.
    - Projecte grupal en algorismes i aplicacions bioinformàtiques.

    Mètode d'avaluació

    - Avaluació contínua (AC) 20%: Qüestionaris i lliurament d'exercicis.

    - Projecte en grup (PG) 20%: Avaluat mitjançant una rúbrica que es publicarà al Moodle de l'assignatura.

    - Exàmens 60%: Examen parcial (EP) 30%, Examen final (EF) 30%. Les rúbriques d'avaluació dels exàmens es publicaran al Moodle de l'assignatura.

    - Recuperació: Consta de dos exàmens (E1 i E2), corresponents a cadascun dels blocs de l'assignatura. La nota final després de la recuperació es calcularà com: 20% AC + 20% PG + 30% max(EP, E1) + 30% max(EF, E2).

    Bibliografia

    Bàsic

    Capacitats prèvies

    Programació Aplicada I, II i III