Bioinformática y Genética Estadística

Profesorado
Horas semanales
Competencias
Objetivos
Contenidos
Actividades
Metodología docente
Método de evaluación
Bibliografía
Capacidades previas

Créditos

6

Tipos

MIRI: Complementaria de especialidad (Ciencia de los Datos)
MDS: Optativa

Requisitos

Esta asignatura no tiene requisitos, pero tiene capacidades previas

Departamento

CS;EIO

Bioinformatics and Statistical Genetics

Profesorado

Responsable

Gabriel Valiente Feruglio ( )

Otros

Marta Janira Castellano Palomino ( )

Horas semanales

Teoría

1

Problemas

0

Laboratorio

2

Aprendizaje dirigido

0

Aprendizaje autónomo

7

Competencias

Competencias Transversales

Uso solvente de los recursos de información

CT4 - Gestionar la adquisicion, la estructuracion, el analisis y la visualizacion de datos e informacion en el ambito de la especialidad y valorar de forma critica los resultados de esta gestion.

Lengua extranjera

CT5 - Conocer una tercera lengua, preferentemente el inglés, con un nivel adecuado oral y escrito y en consonancia con las necesidades que tendrán los titulados y tituladas.

Básicas

CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
CB10 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.

Competencias Técnicas Genéricas

Genéricas

CG4 - Diseñar y poner en marcha proyectos de ciencia de datos en dominios específicos de forma innovadora

Competencias Técnicas

Específicas

CE1 - Desarrollar algoritmos eficientes basados en el conocimiento y comprensión de la teoría de la complejidad computacional y las principales estructuras de datos dentro del ámbito de ciencia de datos
CE2 - Aplicar los fundamentos de la gestión y procesamiento de datos en un problema de ciencia de datos
CE5 - Modelar, diseñar e implementar sistemas complejos de datos, incluyendo la visualización de datos
CE6 - Diseñar el proceso de Ciencia de Datos y aplicar metodologías científicas para obtener conclusiones sobre poblaciones y tomar decisiones en consecuencia, a partir de datos estructurados o no estructurados y potencialmente almacenados en formatos heterogéneos.
CE9 - Aplicar métodos adecuados para el análisis de otro tipo de formatos, tales como procesos y grafos, dentro del ámbito de ciencia de datos

Objetivos

Introduce the student to the algorithmic, computational, and statistical problems that arise in the analysis of biological data.
Competencias relacionadas: CB10, CB6, CB7, CT4, CT5, CE5, CE6, CE9, CG4,
Reinforce the knowledge of discrete structures, algorithmic techniques, and statistical techniques that the student may have from previous courses.
Competencias relacionadas: CT5, CE1, CE2, CE9,

Contenidos

Introduction to bioinformatics
Combinatorial introduction to molecular biology.
ILP and SAT in bioinformatics
Brief Introduction to ILP. Solving an integer linear program. AMPL. Brief introduction to SAT. Solving a SAT formulation. PySAT.
Longest common substring and subsequence
Longest common substring. ILP and SAT models. Longest common subsequence. RNA folding. ILP and SAT models.
Shortest common superstring and supersequence
Shortest common superstring. Genome assembly. ILP and SAT models. Shortest common supersequence. ILP and SAT models.
Sequence alignment and multiple sequence alignment
Sequence alignment. Edit distance. ILP and SAT models. Multiple sequence alignment. ILP and SAT models.
Other string selection problems
Closest string. ILP and SAT models. Closest substring. ILP and SAT models.
Introduction to statistical genetics
Basic genetic terminology. Population-based and family-based studies. Traits, markers and polymorphisms. Single nucleotide polymorphisms and microsatellites. R-package genetics.
Hardy-Weinberg equilibrium
Hardy-Weinberg law. Hardy-Weinberg assumptions. Multiple alleles. Statistical tests for Hardy-Weinberg equilibrium: chi-square, exact and likelihood-ratio tests. Graphical representations. Disequilibrium coefficients: the inbreeding coefficient, Weir's D. R-package HardyWeinberg.
Linkage disequilibrium
Definition of linkage disequilibrium (LD). Measures for LD. Estimation of LD by maximum likelihood. Haplotypes. The HapMap project. Graphics for LD. The LD heatmap.
Phase estimation
Phase ambiguity for double heterozygotes. Phase estimation with the EM algorithm. Estimation of haplotype frequencies. R-package haplo.stats.
Population substructure
Definition of population substructure. Population substructure and Hardy-Weinberg equilibrium. Population substructure and LD. Statistical methods for detecting substructure. Multidimensional scaling. Metric and non-metric multidimensional scaling. Euclidean distance matrices. Stress. Graphical representations.
Family relationships and allele sharing
Identity by state (IBS) and Identity by descent (IBD). Kinship coefficients. Allele sharing. Detection of family relationships. Graphical representations.
Genetic association analysis
Disease-marker association studies. Genetic models: dominant, co-dominant and recessive models. Testing models with chi-square tests. The alleles test and the Cochran-Armitage trend test. Genome-wide assocation tests.

Actividades

Actividad Acto evaluativo

Development of syllabus topics

Objetivos: 1 2
Contenidos:

3 . Longest common substring and subsequence
7 . Introduction to statistical genetics
8 . Hardy-Weinberg equilibrium
9 . Linkage disequilibrium
10 . Phase estimation
11 . Population substructure
1 . Introduction to bioinformatics
13 . Genetic association analysis
12 . Family relationships and allele sharing
4 . Shortest common superstring and supersequence
5 . Sequence alignment and multiple sequence alignment
6 . Other string selection problems
2 . ILP and SAT in bioinformatics

Teoría

15h

Problemas

0h

Laboratorio

24h

Aprendizaje dirigido

0h

Aprendizaje autónomo

75h

Final exam Bioinformatics

Objetivos: 1 2
Semana: 9 (Fuera de horario lectivo)

Teoría

0h

Problemas

0h

Laboratorio

3h

Aprendizaje dirigido

0h

Aprendizaje autónomo

15h

Final exam Statistical Genetics

Objetivos: 1 2
Semana: 18 (Fuera de horario lectivo)

Teoría

0h

Problemas

0h

Laboratorio

3h

Aprendizaje dirigido

0h

Aprendizaje autónomo

15h

Metodología docente

All classes consist of a theoretical session (a lecture in which the professor introduces new concepts or techniques and detailed examples illustrating them) followed by a practical session (in which the students work on the examples and exercises proposed in the lecture). On the average, two hours a week are dedicated to theory and one hour a week to practice, and the professor allocates them according to the subject matter. Students are required to take an active part in class and to submit the exercises at the end of each class.

Método de evaluación

For the first half (Bioinformatics), students are evaluated in a mid-term exam, in which they model and solve new string problems in Bioinformatics using ILP and SAT. In the second half (Statistical Genetics), students are evaluated during class, and in a final exam. Every student is required to submit one exercise each week, graded from 0 to 10, and the final grade consists of 50% for the exercises and 50% for the final exam, also graded from 0 to 10.

Bibliografía

Básica:

Integer linear programming in computational and systems biology : an entry-level text and course - Gusfield, Dan, Cambridge University Press, [2019]. ISBN: 9781108421768
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004172889706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Applied Statistical Genetics with R: For Population-based Association Studies - Foulkes, Andrea S, Springer, 2009. ISBN: 9780387895536
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003963689706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
The Fundamentals of modern statistical genetics - Laird, Nan M.; Lange, Christoph, Springer, 2011. ISBN: 9781461427759
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003963669706711&context=L&vid=34CSUC_UPC:VU1&lang=ca

Complementaria:

Optimization Approaches for Solving String Selection Problems [Recurs electrònic] - Pappalardo, Elisa; Pardalos, P. M; Stracquadanio, Giovanni, Springer , 2013. ISBN: 9781461490531
https://ebookcentral-proquest-com.recursos.biblioteca.upc.edu/lib/upcatalunya-ebooks/detail.action?pq-origsite=primo&docID=1538891
Genetic data analysis II: methods for discrete population genetic data - Weir, B.S, Sinauer Associates , 1996. ISBN: 0878939024
http://cataleg.upc.edu/record=b1433568~S1*cat
Statistical Approach to Genetic Epidemiology - Ziegler, Andreas; König, Inke R., Wiley , 2011. ISBN: 9783527633654

Capacidades previas

Basic knowledge of algorithms and data structures.
Basic knowledge of statistics.
Basic knowledge of the Python programming language.
Basic knowledge of the R programming language.

Bioinformática y Genética Estadística

Profesorado

Responsable

Otros

Horas semanales

Competencias

Competencias Transversales

Uso solvente de los recursos de información

Lengua extranjera

Básicas

Competencias Técnicas Genéricas

Genéricas

Competencias Técnicas

Específicas

Objetivos

Contenidos

Actividades

Development of syllabus topics

Final exam Bioinformatics

Final exam Statistical Genetics

Metodología docente

Método de evaluación

Bibliografía

Básica:

Complementaria:

Capacidades previas

Dónde estamos

Contacta con la FIB

Bioinformática y Genética Estadística

Usted está aquí

Profesorado

Responsable

Otros

Horas semanales

Competencias

Competencias Transversales

Uso solvente de los recursos de información

Lengua extranjera

Básicas

Competencias Técnicas Genéricas

Genéricas

Competencias Técnicas

Específicas

Objetivos

Contenidos

Actividades

Development of syllabus topics

Final exam Bioinformatics

Final exam Statistical Genetics

Metodología docente

Método de evaluación

Bibliografía

Básica:

Complementaria:

Capacidades previas

Dónde estamos

Contacta con la FIB