Genòmica Computacional

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
UB
Mail
Al curs de Genòmica Computacional, s'utilitzaran diferents aproximacions bioinformàtiques per entendre la Biologia de les seqüències genòmiques a estudiar (a partir, per exemple, de dades de seqüenciació d'ADN, ARN, ChIP, etc). Amb un enfocament eminentment genòmic, la idea principal és la d'emprar mètodes computacionals per analitzar l'estructura i funció de les seqüències, centrant-se en particular en el procés d'anotar elements funcionals a escala genòmica, com els gens i les seves regions reguladors.

Professorat

Responsable

  • Josep Francesc Abril Ferrando ( )

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Objectius

  1. Adquirir coneixements avançats en el camp de la Genòmica Computacional.
    Competències relacionades: K1, K2, K3, K7,
  2. Entendre els protocols computacionals, quins paràmetres afecten els resultats obtinguts amb les eines bioinformàtiques usades en el camp, i com interpretar adequadament els resultats de les anàlisis.
    Competències relacionades: C2, C3, C4, S1, S2, S3, S5, S7, S8,

Continguts

  1. Introducció a la Genòmica Computacional
    Sequences and annotations; basic data formats; sequence ontology; sequence basic stats and biases; sequencing methods (from Sanger to single molecule technologies) and range of applications (DNA-seq, RNA-eq, ChIP-seq, chromatin conformation, ...); sequencing quality and coverage. Sequence repositories (NCBI, EnsEMBL/BioMart, UCSC, others).
  2. Anàlisi de Seqüències
    Alphabets and strings; sequence complexity, entropy, and information content; k-mer analysis; repetitive elements (types, detection, and masking).
  3. Assemblat de Seqüències
    Genomes, transcriptomes, and meta-genomes assemblies; reads, contigs, scaffolds, and chromosomes; assembly algorithms, from prefix-suffix alignment to assembly graphs; de-Bruijn graphs; compression-based string matching: mapping reads over assemblies (DNA aligners); assembly assessment metrics, N50, completeness (CEGMA, BUSCO); accuracy assessment of assembler tools (GAGE, Assemblathon) and DNA aligners (RGASP).
  4. Models de Seqüència
    Consensus sequence. Modeling signals and content: regular expressions, position weight matrices (PWMs), Markov chains, hidden Markov models (HMMs), other models.
  5. Predicció Computacional de Gens
    The genome landscape: signals, exons, genes, regulatory elements, chromatin marks, etc...; comparing gene-finding on prokaryota vs eukaryota; computational gene-finding approaches: ab-initio, similarity-based, homology-based, comparative genomics, NGS; dynamic programming to assemble exons; generalized hidden Markov models (GHMMs); phylogenetic models (phyloHMMs); prediction of non-cannonical features: selenoproteins, pseudogenes, non-coding RNAs, ...; GF accuracy assessment: metrics (sensitivity/specificity, ...), benchmarks (*GASP).
  6. Predicció d'Elements Reguladors
    Regulatory elements: regulatory programs (network complexity, space and time compartimentalization), transcription factors and transcription factor binding sites (TFBSs), promoters, enhancers; pattern matching (TranFac/Jaspar/Oreganno); pattern discovery (PEAKS, MEME); phylogenetic footprinting; NGS-approaches, decyphering epigenetic code with ChIP-seq; annotating chromatin conformation over genomic sequences.
  7. Anotació Funcional
    From sequence to function: genes, transcripts, and proteins; gene ontologies (GO, KO); annotating domains: patterns (PROSITE), profile HMMs (PFAM, RFAM), homology-based approaches: BLAST searches versus NOG models; meta-genomic samples: ecological network functional components, species composition and diversity measures.
  8. Gestió de Dades d'Anotacions
    Annotation pipelines: manual curation procedures (NCBI, VEGA), Maker, Galaxy, EnsEMBL; visualization paradigms: from gff2ps to circos, from command-line tools to graphical interfaces (Apollo, IGV), genome browsers (EnsEMBL, UCSC-Genome browser, GBrowse/JBrowse); distributed annotation systems; database tracks versus custom tracks.

Activitats

Activitat Acte avaluatiu


Prova de Síntesi


Objectius: 1 2
Setmana: 18
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h




Metodologia docent

Els materials conceptuals necessaris per entendre els temes de la Genòmica Computacional s'impartiran en sessions presencials de teoria. Llavors, cada estudiant podrà treballar a les sessions pràctiques amb casos i/o protocols d'exemple per aplicar algunes de les idees exposades a les sessions teòriques; aquests exercicis implicaran treball addicional fora de l'aula per poder completar-los de cara a l'avaluació continuada (tramesa d'exercicis al Campus Virtual).

L'esforç individual per estudiar i completar els treballs pot ser necessari de manera independent, en quantitats variables, depenent de l'aprofitament de les classes i les capacitats de cada estudiant, de cara a assimilar i estendre, si cal, els conceptes essencials proporcionats a l'aula.

Recursos docents:
+ Notes de les sessions: Les diapositives estaran disponibles abans de cada classe al Campus Virtual.
+ Pràctiques: Els materials per dur a terme els exercicis estaran disponibles al Campus Virtual.
+ Els enllaços a materials addicionals també estaran disponibles des del Campus Virtual.

Mètode d'avaluació

L'avaluació del rendiment acadèmic per aquesta assignatura es basarà en els següents dos apartats:

+ Pràctiques (Avaluació Continuada): Els estudiants han de trametre al Campus Virtual una sèrie d'exercicis que s'aniran proposant al llarg de les sessions pràctiques. Els detalls sobre el format i el procediment de les trameses es descriurà en la primera sessió pràctica. Els estudiants disposaran d'una setmana per trametre cada exercici mitjançant l'enllaç proporcionat al Campus Virtual. Aquesta part no inclou cap prova de Re-Avaluació, ja que les notes es basen en les puntuacions dels exercicis que s'han d'entregar al llarg del trimestre.

+ Teoria (Prova de Síntesi): Les classes teòriques s'avaluaran amb un examen o prova de síntesi, que es durà a terme al final del trimestre, a la data assignada en el calendari. Sols els estudiants que suspenguin aquesta prova es podran presentar a la prova de Re-Avaluació, si han tret una nota mínima de 2,5 sobre 10 en la prova de síntesi, en la data que s'hagi assignat al calendari per aquesta activitat. La nota de la prova de Re-Avaluació substituirà la de la Prova de Síntesi

En referència al Codi d'Honor que els estudiants han acordat, qualsevol intent de còpia detectat durant les proves d'avaluació (a la Prova de Síntesi o la de Re-Avaluació) implicarà SUSPENDRE l'assignatura. A més, les tasques s'han de trametre de manera individual, no es poden resoldre en grup, i cada estudiant és responsable de les seves entregues i de pujar-les dins del termini establert per cadascuna.

La nota final s'obtindrà sumant les notes de l'avaluació continuada (60%) i de la prova de síntesi (40%), un cop s'hagin superat la prova de síntesi o la de re-avaluació.
Per superar el curs cal com a mínim una nota de 5 sobre 10, un cop totes les notes s'hagin agregat.

Bibliografia

Bàsica:

  • Introduction to genomics - Lesk, A.M., Oxford University Press, 2012.
  • Introduction to computational genomics: a case studies approach - Cristianini, N.; Hahn, M.W., Cambridge University Press, 2007.
  • Bioinformatics: sequence and genome analysis - Mount, D.W., Cold Spring Harbor Laboratory Press, 2004.
  • An Introduction to Bioinformatics Algorithms - Jones, N.C.; Pevzner, P.A., The MIT Press, 2004.
  • Genómica Computacional - Blanco García, E., UOC, 2013.

Complementaria:

  • Encyclopedia of Bioinformatics and Computational Biology - Ranganathan, S.; Nakai, K.; Schönbach, C.; Gribskov, M. (editors), Elsevier Inc , 2019.
  • Concise Encyclopaedia of Bioinformatics and Computational Biology - Hancock, J.M.; Zvelebil, M.J. (editors), Wiley Blackwell , 2014.
  • Methods for Computational Gene Prediction - Majoros ,W.H., Cambridge University Press , 2007.
  • Handbook of Hidden Markov Models in Bioinformatics - Gollery, M., Chapman & Hall/CRC Press , 2008.
  • Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids - Durbin, R.; Eddy, S.R.; Krogh, A.; Mitchinson, G., Cambridge University Press , 1998.
  • Algorithms on Strings, Trees and Sequences - Gusfield, D., Cambridge University Press , 1997.
  • Bioinformatics: a practical guide to the analysis of genes and proteins - Baxevanis, A.D.; Ouelette, B.F.F. (editors)., Wiley , 2005.
  • Discovering genomics, proteomics, and bioinformatics - Campbell, A.M.; Heyer, L.J., Benjamin Cummings , 2007.
  • Bioinformatics and functional genomics - Pevsner, J. , Wiley-Blackwell , 2009.
  • Developing bioinformatics computer skills - Gibas, C.; Jambeck, P. , O¿Reilly , 2001.
  • Sequence analysis in a nutshell: a guide to tools and databases - Markel, S.; Leon, D., O¿Reilly , 2003.
  • UNIX and Perl to the Rescue! - Bradnam, K.; Korf, I., Cambridge University Press , 2012.

Capacitats prèvies

És recomanable tenir coneixements previs de Unix, Perl/Python, R i MarDown, així com alguns fonaments en Genètica Molecular i Genòmica.