En el curso de Genómica Computacional, se utilizarán diferentes aproximaciones computacionales para entender la Biología de las secuencias genómicas a estudiar (a partir, por ejemplo, de datos de secuenciación de ADN, ARN, ChIP, etc). Con un enfoque eminentemente genómico, la idea es aplicar métodos computacionales para analizar la estructura y función de las secuencias, centrándose en particular en el proceso de anotar elementos funcionales a escala genómica, como los genes y sus regiones reguladoras.
Profesorado
Responsable
-
Josep Francesc Abril Ferrando (
)
Objetivos
-
Adquirir conocimientos avanzados en el campo de la Genómica Computacional.
Competencias relacionadas:
K1,
K2,
K3,
K7,
-
Entender los protocolos computacionales, qué parámetros afectan a los resultados obtenidos con las herramientas bioinformáticas usadas en el campo, y cómo interpretar los resultados de los análisis.
Competencias relacionadas:
C2,
C3,
C4,
S1,
S2,
S3,
S5,
S7,
S8,
Contenidos
-
Introducción a la Genómica Computacional
Sequences and annotations; basic data formats; sequence ontology; sequence basic stats and biases; sequencing methods (from Sanger to single molecule technologies) and range of applications (DNA-seq, RNA-eq, ChIP-seq, chromatin conformation, ...); sequencing quality and coverage. Sequence repositories (NCBI, EnsEMBL/BioMart, UCSC, others).
-
Análisis de Secuencias
Alphabets and strings; sequence complexity, entropy, and information content; k-mer analysis; repetitive elements (types, detection, and masking).
-
Ensamblado de Secuencias
Genomes, transcriptomes, and meta-genomes assemblies; reads, contigs, scaffolds, and chromosomes; assembly algorithms, from prefix-suffix alignment to assembly graphs; de-Bruijn graphs; compression-based string matching: mapping reads over assemblies (DNA aligners); assembly assessment metrics, N50, completeness (CEGMA, BUSCO); accuracy assessment of assembler tools (GAGE, Assemblathon) and DNA aligners (RGASP).
-
Modelos de Secuencia
Consensus sequence. Modeling signals and content: regular expressions, position weight matrices (PWMs), Markov chains, hidden Markov models (HMMs), other models.
-
Predicción Computacional de Genes
The genome landscape: signals, exons, genes, regulatory elements, chromatin marks, etc...; comparing gene-finding on prokaryota vs eukaryota; computational gene-finding approaches: ab-initio, similarity-based, homology-based, comparative genomics, NGS; dynamic programming to assemble exons; generalized hidden Markov models (GHMMs); phylogenetic models (phyloHMMs); prediction of non-cannonical features: selenoproteins, pseudogenes, non-coding RNAs, ...; GF accuracy assessment: metrics (sensitivity/specificity, ...), benchmarks (*GASP).
-
Predicción de Elementos Reguladores
Regulatory elements: regulatory programs (network complexity, space and time compartimentalization), transcription factors and transcription factor binding sites (TFBSs), promoters, enhancers; pattern matching (TranFac/Jaspar/Oreganno); pattern discovery (PEAKS, MEME); phylogenetic footprinting; NGS-approaches, decyphering epigenetic code with ChIP-seq; annotating chromatin conformation over genomic sequences.
-
Anotación Funcional
From sequence to function: genes, transcripts, and proteins; gene ontologies (GO, KO); annotating domains: patterns (PROSITE), profile HMMs (PFAM, RFAM), homology-based approaches: BLAST searches versus NOG models; meta-genomic samples: ecological network functional components, species composition and diversity measures.
-
Gestión de Datos de Anotaciones
Annotation pipelines: manual curation procedures (NCBI, VEGA), Maker, Galaxy, EnsEMBL; visualization paradigms: from gff2ps to circos, from command-line tools to graphical interfaces (Apollo, IGV), genome browsers (EnsEMBL, UCSC-Genome browser, GBrowse/JBrowse); distributed annotation systems; database tracks versus custom tracks.
Actividades
Actividad
Acto evaluativo
Prueba de Síntesis
Objetivos:
1
2
Semana:
18
Clases de Teoría
Contenidos:
Sesiones de Prácticas
Contenidos:
Ejercicios de Prácticas
Contenidos:
Metodología docente
Los materiales conceptuales necesarios para entender los temas de la Genómica Computacional se impartirán en sesiones presenciales de teoría. Después, cada estudiante podrá trabajar en las sesiones prácticas con casos y/o protocolos de ejemplo para aplicar algunas de las ideas expuestas en las sesiones de teoría; estos ejercicios implicarán trabajo adicional fuera del aula para poder completarlos de cara a la evaluación continuada (subida de ejercicios al Campus Virtual).
El esfuerzo individual para estudiar y completar los trabajos puede ser necesario de manera independiente, en cantidades variables, en función del aprovechamiento de las clases y de las capacidades de cada alumno, de cara a asimilar y extender, si hace falta, los conceptos esenciales proporcionados en el aula.
Recursos docentes:
+ Notas de las sesiones: Las diapositivas estarán disponibles antes de cada clase en el Campus Virtual.
+ Prácticas: Los materiales necesarios para llevar a cabo los ejercicios estarán disponibles en el Campus Virtual.
+ Los enlaces a materiales adicionales también estarán disponibles desde el Campus Virtual.
Método de evaluación
La evaluación del rendimiento académico para esta asignatura se basará en los siguientes dos apartados:
+ Prácticas (Evaluación Continuada): Los estudiantes deberán subir al Campus Virtual una serie de ejercicios que se irán proponiendo a lo largo de las sesiones prácticas. Los detalles sobre el formato y el procedimiento de las entregas se describirá en la primera sesión práctica. Los estudiantes dispondrán de una semana para subir cada ejercicio a través del enlace que se facilitará a través del Campus Virtual. Esta parte no incluye ninguna prueba de Re-Evaluación, ya que las notas se basan en las puntuaciones de los ejercicios que se han de entregar a lo largo del trimestre.
+ Teoría (Prueba de Síntesis): Las clases teóricas se evaluarán mediante un examen o prueba de síntesis, que se realizará al final del trimestre, según la fecha asignada en el calendario. Solo los estudiantes que suspendan esta prueba de síntesis podrán presentarse a la prueba de Re-Evaluación, si han obtenido una nota mínima de 2'5 sobre 10 en la prueba de síntesis, en la fecha que se haya asignado en el calendario para esta actividad. La nota de la prueba de Re-Evaluación sustituirá la nota de la prueba de síntesis.
En referencia al Código de Honor que los estudiantes han acordado, cualquier intento de copia detectado durante las pruebas de evaluación (en la Prueba de Síntesis o la de Re-Evaluación) implicará SUSPENDER la asignatura. Además, las tareas se deberán subir de manera individual, no se pueden resolver en grupo, y cada estudiante será responsable de sus entregas y de subirlas dentro el plazo establecido.
La nota final se obtendrá sumando las notas de la evaluación continuada (60%) a las de la prueba de síntesis (40%), una vez superada ésta o la prueba de re-evaluación.
Para superar el curso se requiere como mínimo una nota de 5 sobre 10, una vez agregadas todas las notas.
Bibliografía
Básica:
-
Introduction to genomics -
Lesk, A.M.,
Oxford University Press, 2012.
-
Introduction to computational genomics: a case studies approach -
Cristianini, N.; Hahn, M.W.,
Cambridge University Press, 2007.
-
Bioinformatics: sequence and genome analysis -
Mount, D.W.,
Cold Spring Harbor Laboratory Press, 2004.
-
An Introduction to Bioinformatics Algorithms -
Jones, N.C.; Pevzner, P.A.,
The MIT Press, 2004.
-
Genómica Computacional -
Blanco García, E.,
UOC, 2013.
Complementaria:
-
Encyclopedia of Bioinformatics and Computational Biology -
Ranganathan, S.; Nakai, K.; Schönbach, C.; Gribskov, M. (editors), Elsevier Inc ,
2019.
-
Concise Encyclopaedia of Bioinformatics and Computational Biology -
Hancock, J.M.; Zvelebil, M.J. (editors), Wiley Blackwell ,
2014.
-
Methods for Computational Gene Prediction -
Majoros ,W.H., Cambridge University Press ,
2007.
-
Handbook of Hidden Markov Models in Bioinformatics -
Gollery, M., Chapman & Hall/CRC Press ,
2008.
-
Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids -
Durbin, R.; Eddy, S.R.; Krogh, A.; Mitchinson, G., Cambridge University Press ,
1998.
-
Algorithms on Strings, Trees and Sequences -
Gusfield, D., Cambridge University Press ,
1997.
-
Bioinformatics: a practical guide to the analysis of genes and proteins -
Baxevanis, A.D.; Ouelette, B.F.F. (editors)., Wiley ,
2005.
-
Discovering genomics, proteomics, and bioinformatics -
Campbell, A.M.; Heyer, L.J., Benjamin Cummings ,
2007.
-
Bioinformatics and functional genomics -
Pevsner, J. , Wiley-Blackwell ,
2009.
-
Developing bioinformatics computer skills -
Gibas, C.; Jambeck, P. , O¿Reilly ,
2001.
-
Sequence analysis in a nutshell: a guide to tools and databases -
Markel, S.; Leon, D., O¿Reilly ,
2003.
-
UNIX and Perl to the Rescue! -
Bradnam, K.; Korf, I., Cambridge University Press ,
2012.
Capacidades previas
Es recomendable tener conocimientos prévios de Unix, Perl/Python, R y MarkDown, así como alguns fundamentos en Genética Molecular y Genómica.