Bases de Dades

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
UAB
L'assignatura de Bases de dades està dividida en dues parts:

La primera part de l'assignatura introduirà els diferents tipus de dades disponibles en l'àmbit de les ciències de la salut i de la vida, destacant-ne les característiques específiques, la seva heterogeneïtat i necessitats d'integració per tal de resoldre qüestions científiques i clíniques de l'àmbit. Els principals portals de coneixement i bases de dades per accedir i explotar aquest tipus de dades es presentaran en sessions pràctiques per oferir als estudiants l'experiència per utilitzar aquests recursos.

La segona part s'introdueixen els conceptes bàsics de Bases de Dades (BD) necessaris tant a nivell de dissenyador de BD com d'usuari. Inicialment s'estudiaran els paràdigmes i disseny entitat-relació de bases de dades i finalment la manipulació de dades mitjançant SQL.

Professorat

Responsable

  • Oscar Conchillo Sole ( )

Altres

  • Carles Sanchez Ramos ( )
  • Irepan Salvador Martínez ( )
  • Xim Cerda Company ( )

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Resultats d'aprenentatge

Resultats d'aprenentatge

Coneixements

  • K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
  • K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
  • K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.

Habilitats

  • S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
  • S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
  • S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
  • S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.
  • S9 - Explotar la informació biològica i biomèdica per a transformar-la en coneixement; en particular, extreure i analitzar informació de bases de dades per a resoldre nous problemes biològics i biomèdics.

Competències

  • C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
  • C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
  • C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.

Objectius

  1. Adquisició dels coneixements bàsics dels tipus més comuns d'informació biològica i biomèdica i dels mètodes per emmagatzemar-los i accedir-hi.
    Competències relacionades: K1, K7, S4, S5, S7, S8, S9, C2, C3, C4,
  2. Combinar múltiples tipus de dades, de diferents fonts, per resoldre problemes biològics
    Competències relacionades: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4,
  3. Conèixer els principis de la teoria de grafs, l'anàlisi de xarxes i la seva aplicació a la genòmica i la proteòmica
    Competències relacionades: K1, K2, S4, S5, S7, S9, C3, C4,
  4. Disseny de bases de dasdes
    Competències relacionades: K2, S4, S5, S7, S8, S9, C3, C4,
  5. Manipulació de les bases de dades a partir del lleguatge SQL.
    Competències relacionades: K1, K2, K7, S4, S5, S7, S8, S9, C3, C4,

Continguts

  1. Tema 1 - Introducció i conceptes bàsics en bases de dades biològiques
    Presentació del curs i introducció de l'assignatura. Organitzar el coneixement biològic en bases de dades. Conceptes tècnics i definicions. Diferents classificacions de bases de dades segons el tipus de dades. Organització jeràrquica de la vida i nivells d'anotació. Eines per a la cerca i adquisició de dades de bases de dades en línia. Formats per emmagatzemar i presentar dades biològiques.
  2. Tema 2 - Bases de dades públiques de seqüències de pèptids i nucleòtids.
    Uniprot i NCBI com a exemples de dipòsits de seqüències de proteïnes i nucleòtids. Cerques avançades, filtrades i refinades.
  3. Tema 3 - Estructura de proteïnes i bases de dades derivades.
    Bases de dades d'estructures proteiques (PDB). Bases de dades de proteïnes secundàries, derivades i especialitzades com ara dominis (PFAM i CATH) i models d'estructura predits (AlphaFold DB)
  4. Tema 4. Gens, genomes i genòmica funcional
    Recuperació d'informació gènica de NCBI Gene. Navegant per la informació del genoma a Ensembl & al Navegador del genoma de UCSC. Genòmica funcional: ENCODE, GTEx. Bases de dades de genòmica funcional a EMBL-EBI: ArrayExpress i Expression Atlas.
  5. Tema 5. Expressió cel·lular única, xarxes i vies
    Genòmica funcional a resolució d'una sola cel·lula: Single Cell Expression Atlas. Representació i anàlisi de xarxes. Xarxes d'interacció molecular: bases de dades IntAct i altres. Visualització de xarxesi vies a Cytoscape.
  6. Tema 6. Descobriment de fàrmacs i integració de dades.
    Cronologia del descobriment de fàrmacs. Bases de dades: Open Targets i InterMine. Integració de dades: estàndards,
    ontologies, mapeig d'ID i metadades.
  7. Topic 7 - Paradigma de bases de dades
    Presentació de la segona part del curs. Conceptes bàsics i introductoris a les bases de dades, així com la seva arquitectura.
  8. Topic 8 - Disseny de bases de dades
    Procés de disseny de bases de dades. Model de dades de relació entitat. Esquema de relació amb l'entitat disseny.
  9. Topic 9 - Model relacional i manipulació de dades.
    Model de dades relacionals. Normes d'integritat. Consultes SQL.

Activitats

Activitat Acte avaluatiu




Qüestionaris de final de tema


Objectius: 1 2 3
Setmana: 18 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
45h

Moduls Autoavaluació SQL

Consistirà en un autoaprenentatge de consultes SQL usant un mòdul d'autoavaluació disponible a Caronte. L'alumne pujarà les consultes a Caronte en un format específic per a ser avaluat el seu resultat.
Objectius: 5
Setmana: 18 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
30h

Teoria
15h
Problemes
15h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
15h

Metodologia docent

En la primera part del curs:
Les classes teòriques seran principalment de tipus expositiu. També hi haurà sessions pràctiques basades en problemes

En la segona part del curs:

L'objectiu final de l'assignatura és que l'alumnat sigui capaç de dissenyar i manipular bases de dades relacionals en el context de les aplicacions informàtiques actuals. Per aquest motiu, les classes presencials seran altament pràctiques i es centraran en que l'alumnat consolidi els coneixements que són objectiu d'aprenentatge d'aquesta assignatura.

La metodologia general de l'assignatura es pot dividir en tres activitats:

PREPARACIÓ PRÈVIA. L'objectiu és que l'alumnat pugui aprendre els conceptes que es treballaran a la sessió següent mitjançant diverses activitats proposades pel professorat com pot ser el visionat de vídeos, la lectura de textos, etc. Tot el material necessari (enunciats, scripts de BD, resultats dels problemes) estarà disponible al CV.

CLASSE PRESENCIAL. L'objectiu és el de consolidar els conceptes vistos i posar-los en valor dins del context de l'assignatura. El professorat vetllarà perquè l'alumnat aprofundeixi en aquests conceptes mitjançant exercicis (més o menys) guiats durant la sessió. Per això les classes presencials es faran en 2 sessions setmanals de 2 hores cadascuna.

TREBALL AUTÒNOM. Autoaprenentatge de consultes típiques de SQL.Consistirà en un autoaprenentatge de consultes SQL usant un mòdul d'autoavaluació disponible a Caronte. L'alumne pujarà les consultes a Caronte en un format específic per a ser avaluat el seu resultat.
Els enunciats de les pràctiques estan disponibles a la pàgina web en pf i en Caronte (http://caronte.uab.cat).

Mètode d'avaluació

Per l'avaluació de l'assignatura es tindran en compta la nota del primer examen parcial (E1) (40%), la nota del segon examen parcial (E2)(40%), la nota mitja dels Qüestionaris de pràctica de final de tema (Q)(8%) i la participació activa a classe (CP)(2%) per la primera part del curs, i, mòduls d'autoaprenentatge pràctics SQL (SL) per la segona part del curs (10%)
Seguint la formula seguent: E1*0.4+ Q*0.08 + CP*0.02 + E2*0.4 + SL*0.1

Per a poder accedir al exàmens parcials l'alumne ha d'haver participat en el 50% dels qüestionaris de pràctica de final de tema (Q) i en els mòduls de pràctica SQL (SL).

Aquells alumnes que hagin suspès l'assignatura podran fer l'examen de recuperació. Constarà de dues parts, ER1 i ER2 que comptaran un 80% per al càlcul de la nota final de la següent manera:

-si E2>=5, la nota serà ER1*0.8*0.4+E2*0.4+Q*0.08+CP*0.02+ SL*0.1

-si E1>=5, la nota serà E1*0.4+ER2*0.8*0.4+Q*0.08+CP*0.02+ SL*0.1

-si E1<5 i E2<5, la nota serà ER1*0.8*0.4+ER2*0.8*0.4+Q*0.08+CP*0.02 + SL*0.1

Un alumne que no pugui assistir als exàmens parcials E1 i/o E2 per causes justificades degudament acreditades, realitzarà l'examen ER1 i/o ER2, però aquests comptaran un 100% per al càlcul de la nota final de la següent manera:
ER1*0.4+ER2*0.4+Q*0.08+CP*0.02 + SL*0.1

Es considerarà aprovat aquell alumne que tingui accés al càlcul de la nota final i aquesta sigui superior a 5.

Bibliografia

Bàsica:

Web links

  • Web amb cursos lliures i de pagament d'Oracle per web. S'hi poden trobar cursos en format RealPlayer que expliquen un tema en profunditat. http://ilearning.oracle.com/ilearn/en/learner/jsp/login.jsp
  • Special Interest Group in Management of Data. Grup de l'ACM (Association of Computer Machinery) que realitza activitats sobre Base de Dades, organitza congressos i edita revistes sobre el tema. http://www.acm.org/sigmod
  • Pàgina amb informació sobre el llenguatge SQL. http://www.jcc.com/SQLPages/jccs_sql.htm
  • GTEX project overview https://gtexportal.org/home/aboutAdultGtex
  • Live Oracle SQL online https://livesql.oracle.com/apex/f?p=590:1000
  • Cytoscape manual and Basic Analysis Tutorial https://manual.cytoscape.org/en/stable/
  • Web d'Oracle Iniciativa Acadèmica (OAI) amb molta informació d'interès relativa a les facilitats que proporciona la Iniciativa Acadèmica als alumnes de la UAB. https://oai.oracle.com/
  • Getting started with OpenTargets: Identifying evidence implicating drug targets with diseases or phenotypes https://platform-docs.opentargets.org/getting-started
  • Explore the EMBL's European Bioinformatics Institute (EMBL-EBI) resources and tools. https://www.ebi.ac.uk/services
  • Introduction and Quick Guide to the ENCODE project https://www.encodeproject.org/help/getting-started/
  • As a national resource for molecular biology information, NCBI's mission is to develop new information technologies to aid in the understanding of fundamental molecular and genetic processes that control health and disease. More specifically, the NCBI has been charged with creating automated systems for storing and analyzing knowledge about molecular biology, biochemistry, and genetics; facilitating the use of such databases and software by the research and medical community; coordinating efforts to gather biotechnology information both nationally and internationally; and performing research into advanced methods of computer-based information processing for analyzing the structure and function of biologically important molecules. https://www.ncbi.nlm.nih.gov
  • RCSB PDB (RCSB.org) is the US data center for the global Protein Data Bank (PDB) archive of 3D structure data for large biological molecules (proteins, DNA, and RNA) essential for research and education in fundamental biology, health, energy, and biotechnology. https://www.rcsb.org
  • The mission of UniProt is to provide the scientific community with a comprehensive, high-quality and freely accessible resource of protein sequence and functional information. https://www.uniprot.org

Capacitats prèvies

Es recomana que l¿alumne tingui coneixements i capacitats de:

Haver completat una assignatura de Bioquímica i biologia molecular en qualsevol grau relacionat amb ciències biològiques
Programació en llenguatges de tercera generació (C, Pascal, Basic, etc.)
Estructures bàsiques de dades.