El curs de Visualització de Dades introdueix conceptes de disseny visual i metàfores de dades essencials per al disseny i ús d'eines bioinformàtiques específiques. El curs es divideix en dues parts principals. La primera part se centra en les eines bàsiques per a la visualització de dades, amb especial èmfasi en bioinformàtica: llibreries i visualitzacions comunes, visualitzacions interactives, etc. El paquet principal utilitzat en aquesta part és ggplot2, que es basa en la Gramàtica dels Gràfics i serà molt rellevant per a tota l'assignatura. La segona part tracta sobre la visualització per explorar dades complexes, la reducció de dimensionalitat i les anàlisis de components principals (PCA, t-SNE i UMAP). Les lliçons són principalment pràctiques i dinàmiques per proporcionar un aprenentatge interactiu de la matèria.
Professorat
Responsable
Marta Coronado Zamora (
)
Altres
Jose Francisco Sanchez Herrero (
)
Hores setmanals
Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6
Resultats d'aprenentatge
Resultats d'aprenentatge
Coneixements
K1 - Reconèixer els principis bàsics de la biologia, des de l'escala cel·lular a la de l'organisme, i com aquests es relacionen amb els coneixements actuals en els camps de la bioinformàtica, de l'anàlisi de dades, i de l'aprenentatge automàtic; assolint així una visió interdisciplinar amb especial èmfasi en aplicaciones biomèdiques.
K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
K7 - Analitzar les fonts d'informacions científiques, vàlides i fiables, per a fonamentar l'estat de la qüestió d'un problema bioinformàtic i poder abordar la seva resolució.
Habilitats
S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
S5 - Divulgar informació, idees, problemes i solucions provinents de la bioinformàtica i la biologia computacional a un públic general.
S7 - Implementar mètodes de programació i anàlisi de dades a partir de l'elaboració d'hipòtesis de treball, dins de l'àrea d'estudi.
S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.
S9 - Explotar la informació biològica i biomèdica per a transformar-la en coneixement; en particular, extreure i analitzar informació de bases de dades per a resoldre nous problemes biològics i biomèdics.
Competències
C2 - Identificar la complexitat dels fenòmens econòmics i socials típics de la societat del benestar i relacionar el benestar amb la globalització, la sostenibilitat i el canvi climàtic per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
C4 - Treballar com a membre d'un equip interdisciplinar, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes (fins i tot empresarials o de recerca) amb pragmatisme i sentit de la responsabilitat i principis ètics, assumint compromisos tenint en compte els recursos disponibles.
Conèixer les tècniques i eines computacionals existents en un camp particular
Competències relacionades:
K7,
S4,
S7,
S9,
Avaluar quina és l'eina tècnica i/o computacional més adequada en cada situació
Competències relacionades:
K2,
K7,
S4,
S5,
S7,
S8,
S9,
C2,
C3,
C4,
Continguts
- Eines bàsiques: Gramàtica dels Gràfics (ggplot2)
Sessions teòriques sobre percepció, il·lusions visuals, la Gramàtica dels Gràfics aplicant ggplot2, així com biblioteques especialitzades i visualitzacions avançades.
- Visualitzacions interactives amb htmlwidgets i Shiny
Aprèn a crear visualitzacions interactives amb els paquets d'htmlwidgets i aplicacions Shiny.
- Anàlisi de components principals (PCA)
Explora tècniques per visualitzar dades complexes i reducció de dimensionalitat (PCA).
- Projeccions no lineals: t-SNE i UMAP
Aplicació dels mètodes t-SNE i UMAP per a la reducció de dades.
Activitats
ActivitatActe avaluatiu
Sessions pràctiques
Omplir document RMarkdown / basat en l'aplicació Objectius:123 Continguts:
Durant les sessions teòriques, el professor presentarà els conceptes de manera dinàmica, utilitzant exemples i resolent cas pràctics a classe. Durant les sessions pràctiques, els estudiants treballaran de manera independent en exercicis pràctics, amb supervisió i assistència del professor segons sigui necessari. Tant les classes teòriques com pràctiques requereixen un ordinador portàtil.
Mètode d'avaluació
L'avaluació del curs s'estructurarà de la següent manera:
1. Participació activa a classe (10%): Avaluació setmanal de la participació en les sessions teòriques i pràctiques, incloent discussions, activitats i breus qüestionaris.
2. "Home assignments" (40%): Entrega de quatre treballs en grup.
3. Examen parcial (20%): Examen curt per avaluar els conceptes adquirits durant el primer bloc de l'assignatura.
4. Examen final (30%): Examen pràctic que cobreix tots els conceptes.
La nota ponderada de l'examen parcial i l'examen final requereix un qualificació mínima de 3.5 sobre 10 per poder tenir en compte les altres parts de l'avaluació. Es requereix una nota final d'almenys 5 sobre 10 per completar el curs. El plagi o altres faltes greus comportaran el suspens de l'assignatura i possibles accions disciplinàries.
Un/a estudiant es considera que ha cursat l'assignatura si es presenta a l'examen final. Si l'estudiant ha cursat l'assignatura però ha suspès, llavors pot presentar-se a l'examen de reavaluació i en aquest cas la nota de l'assignatura serà 40% "home assignments", 10% participació i 50% examen de recuperació.