Bioinformática y Genética Estadística

Usted está aquí

Créditos
6
Tipos
Complementaria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
EIO;CS
Bioinformática y Estadística Genética

Profesores

Responsable

  • Gabriel Valiente Feruglio ( )

Otros

  • Jan Graffelman ( )

Horas semanales

Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
0

Competencias

Competencias Técnicas Genéricas

Genéricas

  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.

Competencias Transversales

Razonamiento

  • CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.

Básicas

  • CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB7 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Técnicas de cada especialidad

Específicas comunes

  • CEC1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
  • CEC2 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
  • CEC3 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.

Objetivos

  1. Introduce the student to the algorithmic, computational, and statistical problems that arise in the analysis of biological data.
    Competencias relacionadas: CG3, CB6, CB7, CB9, CEC1, CEC2, CEC3, CTR6,
  2. Reinforce the knowledge of discrete structures, algorithmic techniques, and statistical techniques that the student may have from previous courses.
    Competencias relacionadas: CG3, CB6, CB7, CB9, CEC1, CEC2, CEC3, CTR6,

Contenidos

  1. Introduction to Bioinformatics
    Introduction to the R language. Computational linear algebra. Numerical optimization. Bioinformatics with R.
  2. Linear programming and integer linear programming
    Solving easy and hard feasibility and optimization problems in Bioinformatics. Linear programming and integer linear programming in R.
  3. The longest common substring problem
    The longest common substring problem: Finding consensus among DNA sequences. Integer programming formulations.
  4. The shortest common superstring problem
    The shortest common superstring problem: Assembling short DNA sequence reads. Integer programming formulations.
  5. The closest and the farthest string problems
    The closest and the farthest string problems: Finding patterns that occur, or do not occur, in each string in a given set of DNA sequences. Integer programming formulations.
  6. The closest and the farthest substring problems
    The closest and the farthest substring problems: Finding short strings that are, or are not, enriched in each string in a given set of DNA sequences. Integer programming formulations.
  7. Other string selection problems
    Other string selection problems: The Close to Most and the Far from Most Strings problems. Integer programming formulations.
  8. Introduction to statistical genetics
    Basic genetic terminology. Population-based and family-based studies. Traits, markers and polymorphisms. Single nucleotide polymorphisms and microsatellites. R-package genetics.
  9. Hardy-Weinberg equilibrium
    Hardy-Weinberg law. Hardy-Weinberg assumptions. Multiple alleles. Statistical tests for Hardy-Weinberg equilibrium: chi-square, exact and likelihood-ratio tests. Graphical representations. Disequilibrium coefficients: the inbreeding coefficient, Weir's D. R-package HardyWeinberg.
  10. Linkage disequilibrium
    Definition of linkage disequilibrium (LD). Measures for LD. Estimation of LD by maximum likelihood. Haplotypes. The HapMap project. Graphics for LD. The LD heatmap.
  11. Phase estimation
    Phase ambiguity for double heterozygotes. Phase estimation with the EM algorithm. Estimation of haplotype frequencies. R-package haplo.stats.
  12. Population substructure
    Definition of population substructure. Population substructure and Hardy-Weinberg equilibrium. Population substructure and LD. Statistical methods for detecting substructure. Multidimensional scaling. Metric and non-metric multidimensional scaling. Euclidean distance matrices. Stress. Graphical representations.
  13. Genetic association analysis
    Disease-marker association studies. Genetic models: dominant, co-dominant and recessive models. Testing models with chi-square tests. The alleles test and the Cochran-Armitage trend test. Genome-wide assocation tests.
  14. Family relationships and allele sharing
    Identity by state (IBS) and Identity by descent (IBD). Kinship coefficients. Allele sharing. Detection of family relationships. Graphical representations.

Actividades

Actividad Acto evaluativo


Metodología docente

All classes consist of a theoretical session (a lecture in which the professor introduces new concepts or techniques and detailed examples illustrating them) followed by a practical session (in which the students work on the examples and exercises proposed in the lecture). On the average, two hours a week are dedicated to theory and one hour a week to practice, and the professor allocates them according to the subject matter. Students are required to take an active part in class and to submit the exercises at the end of each class.

Método de evaluación

Students are evaluated during class, and in a final exam. Every student is required to submit one exercise each week, graded from 0 to 10, and the final grade consists of 50% for the exercises and 50% for the final exam, also graded from 0 to 10.

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

Basic knowledge of algorithms and data structures.
Basic knowledge of statistics.
Basic knowledge of the R programming language.

Adenda

Contenidos

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT. NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE SYLLABUS.

Metodología docente

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT. NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE SYLLABUS.

Método de evaluación

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT. NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE SYLLABUS.

Plan de contingencia

NO HI HA CANVIS RESPECTE LA INFORMACIÓ PUBLICADA A LA GUIA DOCENT. EN CAS DE SUSPENSIÓ DE L'ACTIVITAT DOCENT PRESENCIAL, ES PREVEU CONTINUAR FENT CLASSES DE FORMA NO PRESENCIAL VIA GOOGLE MEET, TANT DE TEORIA COM DE LABORATORI. NO CHANGES REGARDING THE INFORMATION PUBLISHED IN THE SYLLABUS. IN CASE OF SUSPENSION OF THE FACE-TO-FACE TEACHING ACTIVITY, IT IS PLANNED TO CONTINUE TEACHING ONLINE VIA GOOGLE MEET, BOTH THEORY AND LABORATORY.