Bases de Datos

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
UAB
The subject of Databases is divided into two parts:

The first part of the subject will introduce the different types of data available in the field of health and life sciences, highlighting their specific characteristics, their heterogeneity and integration needs in order to solve scientific questions and clinics in the area. The main knowledge portals and databases for accessing and exploiting this type of data will be presented in practical sessions to give students the experience to use these resources.

The second part introduces the basic concepts of Databases (DB) needed both at the level of the DB designer and the user. Initially, the paradigms and entity-relationship design of databases will be studied and finally the manipulation of data using SQL.

Profesorado

Responsable

  • Oscar Conchillo Sole ( )

Otros

  • Carles Sanchez Ramos ( )
  • Enric Martí Gòdia ( )
  • Irepan Salvador Martínez ( )
  • Xim Cerda Company ( )

Horas semanales

Teoría
2
Problemas
2
Laboratorio
0
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Resultados de aprendizaje

Resultados de aprendizaje

Conocimientos

  • K1 - Reconocer los principios básicos de la biología, desde la escala celular a la de organismo, y cómo estos se relacionan con los conocimientos actuales en los campos de la bioinformática, del análisis de datos y del aprendizaje automático; alcanzando así una visión interdisciplinar con especial énfasis en aplicaciones biomédicas.
  • K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.
  • K7 - Analizar las fuentes de informaciones científicas, válidas y fiables, para fundamentar el estado de la cuestión de un problema bioinformático y poder abordar su resolución.

Habilidades

  • S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.
  • S5 - Divulgar información, ideas, problemas y soluciones provenientes de la bioinformática y la biología computacional a un público general.
  • S7 - Implementar métodos de programación y análisis de datos orientados a partir de la elaboración de hipótesis de trabajo, dentro del área de estudio.
  • S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.
  • S9 - Explotar información biológica y biomédica para transformarla en conocimiento; en particular, extraer y analizar información de bases de datos para resolver nuevos problemas biológicos y biomédicos.

Competencias

  • C2 - Identificar la complejidad de los fenómenos económicos y sociales típicos de la sociedad del bienestar y relacionar el bienestar con la globalización, la sostenibilidad y el cambio climático para utilizar de forma equilibrada y compatible la técnica, la tecnología, la economía y la sostenibilidad.
  • C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.
  • C4 - Trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con el fin de contribuir a desarrollar proyectos (incluso empresariales o de investigación) con pragmatismo y sentido de la responsabilidad y principios éticos, asumiendo compromisos teniendo en cuenta los recursos disponibles.

Objetivos

  1. Adquisición de los conocimientos básicos de los tipos más comunes de información biológica y biomédica y los métodos para almacenarlos y acceder a ellos.
    Competencias relacionadas: K1, K7, S4, S5, S7, S8, S9, C2, C3, C4,
  2. Combinar múltiples tipos de datos, de diferentes fuentes, para resolver problemas biológicos.
    Competencias relacionadas: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4,

  3. Aprender los principios de la teoría de grafos, el análisis de redes y su aplicación a la genómica y la proteómica.
    Competencias relacionadas: K1, K2, S4, S5, S7, S9, C3, C4,
  4. Diseño de bases de datos
    Competencias relacionadas: K2, S4, S5, S7, S8, S9, C3, C4,
  5. Manipulación de bases de datos mediante el lenguaje SQL.
    Competencias relacionadas: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4,

Contenidos

  1. Tema 1 - Introducción y conceptos básicos en Bases de Datos Biológicas
    Presentación del curso e introducción a la asignatura. Organización del conocimiento biológico en bases de datos. Conceptos técnicos y definiciones. Diferentes clasificaciones de bases de datos según el tipo de datos. Organización jerárquica de la vida y niveles de anotación. Herramientas para la búsqueda y adquisición de datos de bases de datos en línea. Formatos para almacenar y presentar datos biológicos.
  2. Tema 2 - Bases de datos públicas de secuencias de péptidos y nucleótidos.
    Uniprot y NCBI como ejemplos de repositorios de secuencias de proteínas y nucleótidos. Búsquedas avanzadas, filtradas y refinadas.
  3. Tema 3 - Estructura de proteínas y bases de datos derivadas.
    Bases de datos de estructuras de proteínas (PDB). Bases de datos de proteínas secundarias, derivadas y especializadas como dominios (PFAM y CATH) y modelos de estructura predicha (AlphaFold DB)
  4. Tema 4. Genes, genomas y genómica funcional
    Recuperación de información genética del NCBI Gene. Exploración de información genómica en Ensembl y el navegador de genomas de la UCSC. Genómica funcional: ENCODE, GTEx. Bases de datos de genómica funcional en EMBL-EBI: ArrayExpress y Expression Atlas.
  5. Tema 5. Expresión unicelular, redes y vías
    Genómica funcional a resolución de una sola celula: Single Cell Expression Atlas. Representación y análisis de redes. Redes de interacción molecular: IntAct y otras bases de datos. Visualización de redes y vías en Cytoscape.
  6. Tema 6. Descubrimiento de fármacos e integración de datos.
    Cronología del descubrimiento de fármacos. Bases de datos: Open Targets e InterMine. Integración de datos: Estándares, ontologías, mapeo de ID y metadatos.
  7. Topic 7 - Paradigma de las bases de datos
    Presentación de la segunda parte del curso. Conceptos básicos e introductoris a las bases de dades, además de la seva arquitectura.
  8. Topic 8 - Diseño de bases de datos
    Proceso de diseño de bases de datos. Modelo de datos entre entidades y relaciones. Esquema de relación entre entidades diseño.
  9. Topic 9 - Modelo relacional i manipulación de datos.
    Modelo de datos relacionales. Reglas de integridad. Consultas SQL.

Actividades

Actividad Acto evaluativo




Cuestionarios de fin de tema


Objetivos: 1 2 3
Semana: 18 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
45h

Modulos de autoavaluación SQL

Consistirá en un autoaprendizaje de consultas SQL usando un módulo de autoevaluación disponible en Caronte. El alumno subirá las consultas a Caronte en un formato específico para evaluar su resultado.
Objetivos: 5
Semana: 18 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
30h

Teoría
15h
Problemas
15h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
15h

Metodología docente

En la primera parte del curso:
Las clases teóricas serán principalmente de tipo expositivo. También habrá sesiones prácticas basadas en problemas.

En la segunda parte del curso:
El objetivo final de la asignatura es que el alumnado sea capaz de diseñar y manipular bases de datos relacionales en el contexto de las aplicaciones informáticas actuales. Por este motivo, las clases presenciales serán altamente prácticas y se centrarán en que el alumnado consolide los conocimientos que son objetivo de aprendizaje de esta asignatura.

La metodología general de la asignatura se puede dividir en tres actividades:

PREPARACIÓN PREVIA. El objetivo es que el alumnado pueda aprender los conceptos que se trabajarán en la siguiente sesión mediante diversas actividades propuestas por el profesorado como puede ser el visionado de vídeos, la lectura de textos, etc. Todo el material necesario (enunciados, scripts de BD, resultados de los problemas) estará disponible en el CV.

CLASE PRESENCIAL. El objetivo es consolidar los conceptos vistos y ponerlos en valor dentro del contexto de la asignatura. El profesorado velará por que el alumnado profundice en estos conceptos mediante ejercicios (más o menos) guiados durante la sesión. Por eso las clases presenciales se harán en 2 sesiones semanales de 2 horas cada una.

TRABAJO AUTÓNOMO. Autoaprendizaje de consultas típicas de SQL. Consistirá en un autoaprendizaje de consultas SQL usando un módulo de autoevaluación disponible en Caronte. El alumno subirá las consultas a Caronte en un formato específico para evaluar su resultado.
Los enunciados de las prácticas están disponibles en la página web en pf y en Caronte (http://caronte.uab.cat).

Método de evaluación

Para la evaluación de la asignatura se tendrán en cuenta la nota del primer examen parcial (E1) (40%), la nota del segundo examen parcial (E2)(40%), la nota media de los Cuestionarios de práctica de final de tema ( Q)(8%) y la participación activa en clase (CP)(2%) por la primera parte del curso, y, módulos de autoaprendizaje prácticos SQL (SL) por la segunda parte del curso (10%)
Siguiendo la siguiente fórmula: E1*0.4+ Q*0.08 + CP*0.02 + E2*0.4 + SL*0.1

Para poder acceder a los exámenes parciales el alumno debe haber participado en el 50% de los cuestionarios de práctica de final de tema (Q) y en los módulos prácticos SQL (SL).

Aquellos alumnos que han suspendido la asignatura pueden hacer el examen de recuperación. Constará de dos partes ER1 y ER2 que contarán un 80% para el cálculo de la nota final de la siguiente forma:

-si E2>=5, la nota será ER1*0.8*0.4+E2*0.4+Q*0.08+CP*0.02+ SL*0.1

-si E1>=5, la nota será E1*0.4+ER2*0.8*0.4+Q*0.08+CP*0.02+ SL*0.1

-si E1<5 y E2<5, la nota será ER1*0.8*0.4+ER2*0.8*0.4+Q*0.08+CP*0.02 + SL*0.1


Un alumno que no pueda asistir a los exámenes parciales E1 y/o E2 por causas justificadas debidamente acreditadas, realizará el examen ER1 y/o ER2, pero éstos contarán un 100% para el cálculo de la nota final de la siguiente manera:
ER1*0.4+ER2*0.4+Q*0.08+CP*0.02 + SL*0.1

Se considerará aprobado aquel alumno que tenga acceso al cálculo de la nota final y ésta sea superior a 5

Bibliografía

Básica:

Web links

  • Web amb cursos lliures i de pagament d'Oracle per web. S'hi poden trobar cursos en format RealPlayer que expliquen un tema en profunditat. http://ilearning.oracle.com/ilearn/en/learner/jsp/login.jsp
  • Special Interest Group in Management of Data. Grup de l'ACM (Association of Computer Machinery) que realitza activitats sobre Base de Dades, organitza congressos i edita revistes sobre el tema. http://www.acm.org/sigmod
  • Pàgina amb informació sobre el llenguatge SQL. http://www.jcc.com/SQLPages/jccs_sql.htm
  • GTEX project overview https://gtexportal.org/home/aboutAdultGtex
  • Live Oracle SQL online https://livesql.oracle.com/apex/f?p=590:1000
  • Cytoscape manual and Basic Analysis Tutorial https://manual.cytoscape.org/en/stable/
  • Web d'Oracle Iniciativa Acadèmica (OAI) amb molta informació d'interès relativa a les facilitats que proporciona la Iniciativa Acadèmica als alumnes de la UAB. https://oai.oracle.com/
  • Getting started with OpenTargets: Identifying evidence implicating drug targets with diseases or phenotypes https://platform-docs.opentargets.org/getting-started
  • Explore the EMBL's European Bioinformatics Institute (EMBL-EBI) resources and tools. https://www.ebi.ac.uk/services
  • Introduction and Quick Guide to the ENCODE project https://www.encodeproject.org/help/getting-started/
  • As a national resource for molecular biology information, NCBI's mission is to develop new information technologies to aid in the understanding of fundamental molecular and genetic processes that control health and disease. More specifically, the NCBI has been charged with creating automated systems for storing and analyzing knowledge about molecular biology, biochemistry, and genetics; facilitating the use of such databases and software by the research and medical community; coordinating efforts to gather biotechnology information both nationally and internationally; and performing research into advanced methods of computer-based information processing for analyzing the structure and function of biologically important molecules. https://www.ncbi.nlm.nih.gov
  • RCSB PDB (RCSB.org) is the US data center for the global Protein Data Bank (PDB) archive of 3D structure data for large biological molecules (proteins, DNA, and RNA) essential for research and education in fundamental biology, health, energy, and biotechnology. https://www.rcsb.org
  • The mission of UniProt is to provide the scientific community with a comprehensive, high-quality and freely accessible resource of protein sequence and functional information. https://www.uniprot.org

Capacidades previas

Se recomienda que el alumno tenga conocimientos y capacidades de:

Haber completado una asignatura de Bioquímica y Biología Molecular en cualquier grado relacionado con ciencias biológicas
Programación en lenguajes de tercera generación (C, Pascal, Basic, etc.)
Estructuras básicas de datos.