El curso de Visualización de Datos introduce conceptos de diseño visual y metáforas de datos esenciales para el diseño y uso de herramientas bioinformáticas específicas. El curso se divide en dos partes principales. La primera parte se centra en las herramientas básicas para la visualización de datos, con especial énfasis en bioinformática: bibliotecas y visualizaciones comunes, visualizaciones interactivas, etc. El paquete principal utilizado en esta parte es ggplot2, que se basa en la Gramática de los Gráficos y será muy relevante para toda la asignatura. La segunda parte trata sobre la visualización para explorar datos complejos, la reducción de dimensionalidad y los análisis de componentes principales (PCA, t-SNE y UMAP). Las lecciones son principalmente prácticas y dinámicas para proporcionar un aprendizaje interactivo de la materia.
Profesorado
Responsable
-
Marta Coronado Zamora (
)
Otros
-
Jose Francisco Sanchez Herrero (
)
Resultados de aprendizaje
Resultados de aprendizaje
Conocimientos
-
K1 - Reconocer los principios básicos de la biología, desde la escala celular a la de organismo, y cómo estos se relacionan con los conocimientos actuales en los campos de la bioinformática, del análisis de datos y del aprendizaje automático; alcanzando así una visión interdisciplinar con especial énfasis en aplicaciones biomédicas.
-
K2 - Identificar los métodos estadísticos y computacionales y los modelos matemáticos que permiten resolver problemas en los campos de la biología molecular, la genómica, la investigación médica y la genética de poblaciones.
-
K7 - Analizar las fuentes de informaciones científicas, válidas y fiables, para fundamentar el estado de la cuestión de un problema bioinformático y poder abordar su resolución.
Habilidades
-
S4 - Elaborar herramientas específicas que permitan la resolución de problemas sobre la interpretación de datos biológicos y biomédicos, incluyendo visualizaciones complejas.
-
S5 - Divulgar información, ideas, problemas y soluciones provenientes de la bioinformática y la biología computacional a un público general.
-
S7 - Implementar métodos de programación y análisis de datos orientados a partir de la elaboración de hipótesis de trabajo, dentro del área de estudio.
-
S8 - Enfrentarse a la toma de decisiones, y defenderlas con argumentos, en la resolución de problemas de las áreas de biología, así como, dentro de los ámbitos adecuados, las ciencias de la salud, las ciencias de la computación y las ciencias experimentales.
-
S9 - Explotar información biológica y biomédica para transformarla en conocimiento; en particular, extraer y analizar información de bases de datos para resolver nuevos problemas biológicos y biomédicos.
Competencias
-
C2 - Identificar la complejidad de los fenómenos económicos y sociales típicos de la sociedad del bienestar y relacionar el bienestar con la globalización, la sostenibilidad y el cambio climático para utilizar de forma equilibrada y compatible la técnica, la tecnología, la economía y la sostenibilidad.
-
C3 - Comunicarse de forma oral y escrita con otras personas, en lengua inglesa, sobre los resultados del aprendizaje, de la elaboración del pensamiento y de la toma de decisiones.
-
C4 - Trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con el fin de contribuir a desarrollar proyectos (incluso empresariales o de investigación) con pragmatismo y sentido de la responsabilidad y principios éticos, asumiendo compromisos teniendo en cuenta los recursos disponibles.
Objetivos
-
Visualizar, manipular y extraer datos biológicos
Competencias relacionadas:
K1,
K7,
S4,
S7,
S9,
-
Conocer las técnicas y herramientas computacionales existentes en un campo particular
Competencias relacionadas:
K7,
S4,
S7,
S9,
-
Evaluar cuál es la herramienta técnica y/o computacional más adecuada en cada situación
Competencias relacionadas:
C2,
C3,
C4,
K2,
K7,
S4,
S5,
S7,
S8,
S9,
Contenidos
-
- Herramientas básicas: Gramática de los Gráficos (ggplot2)
Sesiones teóricas sobre percepción, ilusiones visuales, la Gramática de los Gráficos aplicando ggplot2, así como librerías especializadas y visualizaciones avanzadas.
-
- Visualizaciones interactivas con htmlwidgets y Shiny
Aprende a crear visualizaciones interactivas con los paquetes de htmlwidgets y aplicaciones Shiny.
-
- Análisis de componentes principales (PCA)
Explora técnicas para visualizar datos complejos y reducción de dimensionalidad (PCA).
-
- Proyecciones no lineales: t-SNE y UMAP
Aplicación de los métodos t-SNE y UMAP para la reducción de datos.
Actividades
Actividad
Acto evaluativo
Sesiones prácticas
Rellenar documento RMarkdown / basado en la aplicación
Objetivos:
1
2
3
Contenidos:
Home assignments
Conceptual / synthesis-based / application-based
Objetivos:
1
2
3
Contenidos:
Examen parcial
Conceptual / basado en la síntesis / basado en la aplicación
Objetivos:
1
2
3
Semana:
9
Examen final
Conceptual / basado en la síntesis / basado en la aplicación
Objetivos:
1
2
3
Semana:
18
Sesiones teóricas
Conceptual / basado en la síntesis / basado en la aplicación
Objetivos:
1
2
3
Contenidos:
Metodología docente
Durante las sesiones teóricas, el profesor presentará los conceptos de manera dinámica, utilizando ejemplos y resolviendo casos prácticos en clase. Durante las sesiones prácticas, los estudiantes trabajarán de forma independiente en ejercicios prácticos, con supervisión y asistencia del profesor según sea necesario. Tanto las clases teóricas como prácticas requieren un ordenador portátil.
Método de evaluación
La evaluación del curso se estructurará de la siguiente manera:
1. Participación activa en clase (10%): Evaluación semanal de la participación en las sesiones teóricas y prácticas, incluyendo discusiones, actividades y breves cuestionarios.
2. "Home assignments" (40%): entrega de cuatro trabajos grupales.
3. Examen parcial (20%): Examen corto para evaluar los conceptos adquiridos durante el primer bloque de la asignatura.
4. Examen final (30%): Examen práctico que cubre todos los conceptos.
La nota ponderada del examen parcial y el examen final requiere una calificación mínima de 3.5 sobre 10 para poder tener en cuenta las otras partes de la evaluación. Se requiere una nota final de al menos 5 sobre 10 para completar el curso. Plagiarismo u otras faltas graves conllevan el suspenso de la asignatura y posibles acciones disciplinarias.
Un/a estudiante se considera que ha cursado la asignatura si se presenta al examen final. Si el/la estudiante ha cursado la asignatura pero ha suspendido, entonces puede presentarse al examen de reevaluación y en este caso la nota de la asignatura será 40% "home assignments", 10% participación y 50% examen de recuperación.
Bibliografía
Básica:
-
The Visual display of quantitative information -
Tufte, Edward R,
Graphics Press, cop. 1983. ISBN: 9780961392147
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001453439706711&context=L&vid=34CSUC_UPC:VU1
-
The Grammar of graphics -
Wilkinson, Leland; Wills, Graham,
Springer, cop. 2005. ISBN: 0387245448
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003900429706711&context=L&vid=34CSUC_UPC:VU1
-
R graphics cookbook -
Chang, Winston,
O'Reilly, cop. 2013. ISBN: 1449316956
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004078219706711&context=L&vid=34CSUC_UPC:VU1
-
Information is beautiful -
McCandless, David,
William Collins, 2012. ISBN: 9780007492893
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005219279306711&context=L&vid=34CSUC_UPC:VU1
-
Ggplot2 : elegant graphics for data analysis -
Wickham, Hadley,
Springer, 2009. ISBN: 0387981403
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003786949706711&context=L&vid=34CSUC_UPC:VU1
Capacidades previas
Conocimientos básicos en R y familiaridad con RStudio son requisitos previos.