Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
UAB
La primera part de l'assignatura introduirà els diferents tipus de dades disponibles en l'àmbit de les ciències de la salut i de la vida, destacant-ne les característiques específiques, la seva heterogeneïtat i necessitats d'integració per tal de resoldre qüestions científiques i clíniques de l'àmbit. Els principals portals de coneixement i bases de dades per accedir i explotar aquest tipus de dades es presentaran en sessions pràctiques per oferir als estudiants l'experiència per utilitzar aquests recursos.
La segona part s'introdueixen els conceptes bàsics de Bases de Dades (BD) necessaris tant a nivell de dissenyador de BD com d'usuari. Inicialment s'estudiaran els paràdigmes i disseny entitat-relació de bases de dades i finalment la manipulació de dades mitjançant SQL.
Professorat
Responsable
- Oscar Conchillo Sole ( oscar.conchillo@uab.cat )
Altres
- Ethan Sánchez Hidalgo ( ethan.sanchez@uab.cat )
- Irepan Salvador Martínez ( irepan.salvador@cnag.eu )
- Xim Cerda Company ( joaquin.cerda@uab.cat )
Hores setmanals
Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Coneixements
Habilitats
Competències
Objectius
-
Adquisició dels coneixements bàsics dels tipus més comuns d'informació biològica i biomèdica i dels mètodes per emmagatzemar-los i accedir-hi.
Competències relacionades: K1, K7, S4, S5, S7, S8, S9, C2, C3, C4, -
Combinar múltiples tipus de dades, de diferents fonts, per resoldre problemes biològics
Competències relacionades: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4, -
Conèixer els principis de la teoria de grafs, l'anàlisi de xarxes i la seva aplicació a la genòmica i la proteòmica
Competències relacionades: K1, K2, S4, S5, S7, S9, C3, C4, -
Disseny de bases de dasdes
Competències relacionades: K2, S4, S5, S7, S8, S9, C3, C4, -
Manipulació de les bases de dades a partir del lleguatge SQL.
Competències relacionades: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4,
Continguts
-
Tema 1 - Introducció i conceptes bàsics en bases de dades biològiques
Presentació del curs i introducció de l'assignatura. Organitzar el coneixement biològic en bases de dades. Conceptes tècnics i definicions. Diferents classificacions de bases de dades segons el tipus de dades. Organització jeràrquica de la vida i nivells d'anotació. Eines per a la cerca i adquisició de dades de bases de dades en línia. Formats per emmagatzemar i presentar dades biològiques. NCBI Nucleotide com exemple. -
Tema 2 - Bases de dades públiques de seqüències de pèptids i nucleòtids.
Uniprot i NCBI com a exemples de dipòsits de seqüències de proteïnes i nucleòtids. Cerques avançades, filtrades i refinades. -
Tema 3 - Estructura de proteïnes i bases de dades derivades.
Bases de dades d'estructures proteiques (PDB). Bases de dades de proteïnes secundàries, derivades i especialitzades com ara dominis (PFAM i CATH) i models d'estructura predits (AlphaFold DB) -
Tema 4. Gens, genomes i genòmica funcional
Recuperació d'informació gènica de NCBI Gene. Navegant per la informació del genoma a Ensembl & al Navegador del genoma de UCSC. Genòmica funcional: ENCODE, GTEx. Bases de dades de genòmica funcional a EMBL-EBI: ArrayExpress i Expression Atlas. -
Tema 5. Expressió cel·lular única, xarxes i vies
Genòmica funcional a resolució d'una sola cel·lula: Single Cell Expression Atlas. Representació i anàlisi de xarxes. Xarxes d'interacció molecular: bases de dades IntAct i altres. Visualització de xarxesi vies a Cytoscape. -
Tema 6. Descobriment de fàrmacs i integració de dades.
Cronologia del descobriment de fàrmacs. Bases de dades: Open Targets i InterMine. Integració de dades: estàndards,
ontologies, mapeig d'ID i metadades. -
Topic 7 - Paradigma de bases de dades
Presentació de la segona part del curs. Conceptes bàsics i introductoris a les bases de dades, així com la seva arquitectura. -
Topic 8 - Disseny de bases de dades
Procés de disseny de bases de dades. Model de dades de relació entitat. Esquema de relació amb l'entitat disseny. -
Topic 9 - Model relacional i manipulació de dades.
Model de dades relacionals. Normes d'integritat. Consultes SQL.
Activitats
Activitat Acte avaluatiu
Clases teóricas
Objectius: 1 4 5
Continguts:
- 1 . Tema 1 - Introducció i conceptes bàsics en bases de dades biològiques
- 2 . Tema 2 - Bases de dades públiques de seqüències de pèptids i nucleòtids.
- 3 . Tema 3 - Estructura de proteïnes i bases de dades derivades.
- 7 . Topic 7 - Paradigma de bases de dades
- 8 . Topic 8 - Disseny de bases de dades
- 9 . Topic 9 - Model relacional i manipulació de dades.
- 4 . Tema 4. Gens, genomes i genòmica funcional
- 5 . Tema 5. Expressió cel·lular única, xarxes i vies
- 6 . Tema 6. Descobriment de fàrmacs i integració de dades.
Teoria
15h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Pràctiques
Objectius: 1 2 4 5 3
Continguts:
- 1 . Tema 1 - Introducció i conceptes bàsics en bases de dades biològiques
- 2 . Tema 2 - Bases de dades públiques de seqüències de pèptids i nucleòtids.
- 3 . Tema 3 - Estructura de proteïnes i bases de dades derivades.
- 8 . Topic 8 - Disseny de bases de dades
- 9 . Topic 9 - Model relacional i manipulació de dades.
- 4 . Tema 4. Gens, genomes i genòmica funcional
- 5 . Tema 5. Expressió cel·lular única, xarxes i vies
- 6 . Tema 6. Descobriment de fàrmacs i integració de dades.
Teoria
0h
Problemes
15h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Moduls Autoavaluació SQL
Consistirà en un autoaprenentatge de consultes SQL usant un mòdul d'autoavaluació disponible a Caronte. L'alumne pujarà les consultes a Caronte en un format específic per a ser avaluat el seu resultat.Objectius: 5
Setmana: 18 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
En la primera part del curs:Les classes teòriques seran principalment de tipus expositiu. També hi haurà sessions pràctiques basades en problemes
En la segona part del curs:
L'objectiu final de l'assignatura és que l'alumnat sigui capaç de dissenyar i manipular bases de dades relacionals en el context de les aplicacions informàtiques actuals. Per aquest motiu, les classes presencials seran altament pràctiques i es centraran en que l'alumnat consolidi els coneixements que són objectiu d'aprenentatge d'aquesta assignatura.
La metodologia general de l'assignatura es pot dividir en tres activitats:
PREPARACIÓ PRÈVIA. L'objectiu és que l'alumnat pugui aprendre els conceptes que es treballaran a la sessió següent mitjançant diverses activitats proposades pel professorat com pot ser el visionat de vídeos, la lectura de textos, etc. Tot el material necessari (enunciats, scripts de BD, resultats dels problemes) estarà disponible al CV.
CLASSE PRESENCIAL. L'objectiu és el de consolidar els conceptes vistos i posar-los en valor dins del context de l'assignatura. El professorat vetllarà perquè l'alumnat aprofundeixi en aquests conceptes mitjançant exercicis (més o menys) guiats durant la sessió. Per això les classes presencials es faran en 2 sessions setmanals de 2 hores cadascuna.
TREBALL AUTÒNOM. Autoaprenentatge de consultes típiques de SQL.Consistirà en un autoaprenentatge de consultes SQL usant un mòdul d'autoavaluació disponible a Caronte. L'alumne pujarà les consultes a Caronte en un format específic per a ser avaluat el seu resultat.
Els enunciats de les pràctiques estan disponibles a la pàgina web en pf i en Caronte (http://caronte.uab.cat).
Mètode d'avaluació
Per l'avaluació de l'assignatura es tindran en compta la nota del primer examen parcial (E1) (40%), la nota del segon examen parcial (E2)(25%), la nota mitja dels Qüestionaris de pràctica de final de tema (Q)(8%) i la participació activa a classe (CP)(2%) per la primera part del curs, i l'examen de SQL (SQL) per la segona part del curs (25%)Seguint la formula següent: E1*0.4+ Q*0.08 + CP*0.02 + E2*0.25 + SQL*0.25
Per a poder accedir al exàmens parcials l'alumne ha d'haver participat en el 50% dels qüestionaris de pràctica de final de tema (Q) i en els mòduls de pràctica SQL (SL).
Aquells alumnes que hagin suspès l'assignatura amb una nota mitja de l'assignatura superior a 3 podran fer l'examen de recuperació. Constarà de dues parts, ER1 i ER2.
-si (E2+SQL)/2>=5, la nota serà ER1*0.4+E2*0.25+Q*0.08+CP*0.02+ SQL*0.25
-si E1>=5, la nota serà E1*0.4+ER2*0.5+Q*0.08+CP*0.02
-si E1<5 i (E2+SQL)/2<5, la nota serà ER1*0.4+ER2*0.5+Q*0.08+CP*0.02
Un alumne que no pugui assistir als exàmens parcials E1, E2 i/o SQL per causes justificades degudament acreditades, realitzarà l'examen ER1 i/o ER2.
Es considerarà aprovat aquell alumne que hagi realitzat tots els exàmens i tingui una nota superior o igual a 5.
Bibliografia
Bàsic
-
Fundamentos de Bases de Datos
- Silberschatz, A.; Korth, H.F.; Sudarshan, S,
McGraw-Hill,
2014.
ISBN: 9788448190330
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004073929706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Database system concepts
- Silberschatz, A.; Korth, H.F.; Sudarshan, S,
McGraw-Hill,
2019.
ISBN: 9781260084504
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005261350406711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Introducción a los sistemas de Bases de Datos
- Date, C.J,
Pearson,
2001.
ISBN: 9684444192
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002302659706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
An introduction to database systems
- Date, C.J,
Addison-Wesley,
1995.
ISBN: 020154329X
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001303489706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Web links
- Web amb cursos lliures i de pagament d'Oracle per web. S'hi poden trobar cursos en format RealPlayer que expliquen un tema en profunditat. http://ilearning.oracle.com/ilearn/en/learner/jsp/login.jsp
- Special Interest Group in Management of Data. Grup de l'ACM (Association of Computer Machinery) que realitza activitats sobre Base de Dades, organitza congressos i edita revistes sobre el tema. http://www.acm.org/sigmod
- Pàgina amb informació sobre el llenguatge SQL. http://www.jcc.com/SQLPages/jccs_sql.htm
- GTEX project overview https://gtexportal.org/home/aboutAdultGtex
- Live Oracle SQL online https://livesql.oracle.com/apex/f?p=590:1000
- Cytoscape manual and Basic Analysis Tutorial https://manual.cytoscape.org/en/stable/
- Web d'Oracle Iniciativa Acadèmica (OAI) amb molta informació d'interès relativa a les facilitats que proporciona la Iniciativa Acadèmica als alumnes de la UAB. https://oai.oracle.com/
- Getting started with OpenTargets: Identifying evidence implicating drug targets with diseases or phenotypes https://platform-docs.opentargets.org/getting-started
- Explore the EMBL's European Bioinformatics Institute (EMBL-EBI) resources and tools. https://www.ebi.ac.uk/services
- Introduction and Quick Guide to the ENCODE project https://www.encodeproject.org/help/getting-started/
- As a national resource for molecular biology information, NCBI's mission is to develop new information technologies to aid in the understanding of fundamental molecular and genetic processes that control health and disease. More specifically, the NCBI has been charged with creating automated systems for storing and analyzing knowledge about molecular biology, biochemistry, and genetics; facilitating the use of such databases and software by the research and medical community; coordinating efforts to gather biotechnology information both nationally and internationally; and performing research into advanced methods of computer-based information processing for analyzing the structure and function of biologically important molecules. https://www.ncbi.nlm.nih.gov
- RCSB PDB (RCSB.org) is the US data center for the global Protein Data Bank (PDB) archive of 3D structure data for large biological molecules (proteins, DNA, and RNA) essential for research and education in fundamental biology, health, energy, and biotechnology. https://www.rcsb.org
- The mission of UniProt is to provide the scientific community with a comprehensive, high-quality and freely accessible resource of protein sequence and functional information. https://www.uniprot.org
Capacitats prèvies
Es recomana que l'alumne tingui coneixements i capacitats de:Haver completat una assignatura de Bioquímica i biologia molecular en qualsevol grau relacionat amb ciències biològiques
Programació en llenguatges de tercera generació (C, Pascal, Basic, etc.)
Estructures bàsiques de dades.