Bases de Datos Avanzadas

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
ESSI
Esta asignatura forma a los estudiantes en las competencias necesarias para diseñar y configurar sistemas de gestión de datos analíticos necesarios para poder ejecutar los algoritmos de Inteligencia Artificial (IA). Se tratan conceptos avanzadas de gestión de datos de gran volumen, de gran variabilidad de modelos, calidad y semántica de datos. De entrada, se presentará el ciclo general de datos por el IA con conceptos de DevOps y DataOps. A continuación se profundizará en tres temas específicos que corresponden a los principales retos de la gestión de datos por el IA. 1) Gestión y procesamiento de datos de gran volumen, 2) Gestión de datos semánticos, y 3) Integración de datos con la gestión de la calidad de datos y arquitecturas de sistemas de datos por el IA.

El estudiante conocerá los conceptos relacionados con el almacenamiento de datos orientado al análisis, así como los procesos de tratamiento masivo de datos. Así mismo, podrá identificar y evaluar sus retos y dificultades. Como resultado, el estudiante será capaz de evaluar las distintas alternativas posibles de almacenamiento, modelización y procesamiento de datos en el contexto de su organización y elegir las más apropiadas.

Profesorado

Responsable

  • Petar Jovanovic ( )

Otros

  • Sergi Nadal Francesch ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Competencias Transversales

Transversales

  • CT4 [Avaluable] - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
  • CT6 [Avaluable] - Aprendizaje autónomo. Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar dicho conocimiento.
  • CT8 - Perspectiva de género. Conocer y comprender, desde el propio ámbito de la titulación, las desigualdades por razón de sexo y género en la sociedad; integrar las diferentes necesidades y preferencias por razón de sexo y de género en el diseño de soluciones y resolución de problemas.

Básicas

  • CB1 - Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.

Competencias Técnicas

Específicas

  • CE04 - Diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados a la resolución de un problema.
  • CE08 - Detectar las características, funcionalidades y componentes de los gestores de datos, que permitan su adecuado uso en flujos de información, y el diseño, análisis e implementación de aplicaciones basadas en ellas.
  • CE09 - Concebir, diseñar e integrar sistemas de análisis inteligente de datos con aplicación en entornos de producción y de servicios.
  • CE10 - Analizar, diseñar, construir y mantener aplicaciones de forma robusta, segura y eficiente, eligiendo el paradigma y los lenguajes de programación más adecuados.
  • CE15 - Adquirir, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación,percepción y actuación en ambientes o entornos inteligentes.

Competencias Técnicas Genéricas

Genéricas

  • CG2 - Utilizar los conocimientos fundamentales y metodologías de trabajo sólidas adquiridos durante los estudios para adaptarse a los nuevos escenarios tecnológicos del futuro.
  • CG3 - Definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas en el ámbito de la inteligencia artificial.
  • CG5 - Trabajar en equipos y proyectos multidisciplinares relacionados con la inteligencia artificial y la robótica, interactuando fluidamente con ingenieros/as y profesionales de otras disciplinas.
  • CG9 - Afrontar nuevos retos con una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Inteligencia Artificial. Desarrollar la actividad aplicando criterios de calidad y mejora continua, y actuar con rigor en el desarrollo profesional. Adaptarse a los cambios organizativos o tecnológicos. Trabajar en situaciones de carencia de información y/o con restricciones temporales y/o de recursos.

Objetivos

  1. Ser capaz de explicar y utilizar los principales mecanismos de procesamiento paralelo de consultas en entornos distribuidos, detectando cuellos de botella.
    Competencias relacionadas: CG3, CG9, CT4, CT6, CB1, CB2, CE08,
  2. Aprender, comprender y aplicar los fundamentos de los sistemas de gestión de datos distribuidos como las bases de datos distribuidas y los sistemas de archivos distribuidos.
    Competencias relacionadas: CG2, CG5, CT4, CT6, CB2, CE04, CE08, CE15,
  3. Ser capaz de justificar y utilizar entornos de procesamiento distribuido de datos de estilo funcional.
    Competencias relacionadas: CG3, CG5, CT4, CT6, CB1, CB2, CE08, CE09, CE10,
  4. Aprender, comprender y aplicar los fundamentos de los grafos de conocimiento.
    Competencias relacionadas: CG2, CG5, CT6, CT8, CB1, CE04, CE08,
  5. Ser capaz de especificar, diseñar, implementar y evaluar sistemas de gestión de datos orientados a la IA, incluidas las bases de datos semánticas para la representación del conocimiento.
    Competencias relacionadas: CG2, CG5, CT4, CT6, CB1, CE04, CE08, CE15,
  6. Ser capaz de aplicar grafos de conocimiento para resolver problemas realistas como la integración de datos, el análisis de datos basado en grafos, etc.
    Competencias relacionadas: CG2, CG5, CG9, CT4, CT6, CT8, CB2, CE04, CE08, CE15,
  7. Ser capaz de evaluar y seleccionar sistemas de gestión de datos en función de un determinado criterio de calidad.
    Competencias relacionadas: CG2, CG3, CT4, CB2, CE04, CE08, CE10,
  8. Ser capaz de resolver problemas de descubrimiento e integración de datos en base a las estrategias, estándares y tecnologías disponibles.
    Competencias relacionadas: CG3, CG9, CT4, CT6, CT8, CB1, CB2, CE08, CE09, CE10,
  9. Ser capaz de realizar el procesamiento de consultas de datos de grafos.
    Competencias relacionadas: CG3, CG9, CT4, CT6, CB1, CB2, CE04, CE09,

Contenidos

  1. Introducción a los sistemas de datos para Inteligencia Artificial.
    El ciclo de vida completo de la IA con DevOps y DataOps. Adquisición, limpieza y preparación de datos. Selección y gestión de modelos. Depuración y servicio de modelos.
  2. Gestión y procesamiento de datos a gran escala.
    Bases de datos distribuidas. Descripción general de la gestión y el procesamiento de datos distribuidos. Sistema de archivos distribuidos. Marcos de procesamiento de datos distribuidos (MapReduce/Spark). Modelos de procesamiento de flujo de datos. Programas de flujo de datos declarativos.
  3. Gestión de datos semánticos
    Fundamentos de la gestión de datos de grafos. Representaciones de grafos de conocimiento con RDF, RDFS, OWL y su relación con lógicas de primer orden. Consultas basadas en patrones y el lenguaje SPARQL. Lenguajes para describir y validar grafos de conocimiento.
  4. Integración de datos
    Descubrimiento de datos. Evaluación de la calidad de los datos. Esquema e integración de datos.
  5. Arquitecturas de datos para sistemas basados en la IA y su gobernanza
    Arquitecturas funcionales centralizadas y distribuidas de sistemas de gestión de datos para IA. Gobernanza de datos.

Actividades

Actividad Acto evaluativo


Introducció als sistemes de dades per a la IA

Introducción del tema, motivación y descripción general del ciclo de vida de los datos para la IA.
Objetivos: 5
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
2h

Estudio de la gestión y tratamiento de datos a gran escala


Objetivos: 1 3 2 5 7
Contenidos:
Teoría
8h
Problemas
0h
Laboratorio
10h
Aprendizaje dirigido
0h
Aprendizaje autónomo
20h

Estudio de la gestión de datos semánticos


Objetivos: 6 9 4 5
Contenidos:
Teoría
8h
Problemas
0h
Laboratorio
10h
Aprendizaje dirigido
0h
Aprendizaje autónomo
16h

Estudio de la integración de datos


Objetivos: 3 6 5 8
Contenidos:
Teoría
4h
Problemas
0h
Laboratorio
6h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Estudio de arquitecturas para sistemas de IA centrados en datos


Objetivos: 2 5 7
Contenidos:
Teoría
4h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Examen parcial


Objetivos: 1 3 2 5
Semana: 9
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
14h

Examen final


Objetivos: 6 9 4 7 8
Semana: 15 (Fuera de horario lectivo)
Teoría
2h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
18h

Metodología docente

El curso tiene clases de teoria y de laboratorio.

Magistrales: El profesor expone el tema. Los estudiantes siguen la lección, toman apuntes y preparan material adicional fuera de clase. También se les puede pedir que lleven a cabo actividades evaluatorias dentro de estas sesiones.

Laboratorio: Principalmente, las sesiones de laboratorio estarán dedicadas a la práctica (con o sin ordenador) de los conceptos introducidos en las sesiones magistrales. Herramientas relevantes para los conceptos introducidos son presentadas y utilizadas en pequeños proyectos en estas sesiones. Se realizarán también mini proyectos, en los que los estudiantes trabajarán en equipos. Por cada mini proyecto habrá una entrega fuera del horario de clase, pero los estudiantes también serán evaluados individualmente en el aula sobre los conocimientos adquiridos durante cada uno de los proyectos.

El curso tiene un componente de aprendizaje autónomo, dado que los estudiantes tendrán que trabajar con diferentes herramientas de gestión y procesamiento de datos. Aparte del material de apoyo, los estudiantes deben ser capaces de resolver dudas o problemas de uso de estas herramientas.

Método de evaluación

La calificación de las competencias técnicas se basa en:

- NPR: Nota de proyecto, como promedio ponderado de los mini proyectos del curso

- NEP: Nota del examen parcial.

- NEF: Nota del examen final.

Calificación final = NPR*0.40+NEP*0.25+NEF*0.35

Para los estudiantes que puedan concurrir a la reevaluación, la nota de examen de reevaluación sustituirá a NEF y NEP. En cualquier caso, la nota final será el máximo entre la nota ordinaria y la nota de reevaluación.

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

Conocimientos fundamentales de modelización de datos relacionales.
Ser capaz de crear, consultar y manipular bases de datos con SQL.
Fundamentos de representación del conocimiento y lógica de primer orden
Programación avanzada en Python.