Procesos de Análisis Inteligente de Datos

Usted está aquí

Créditos
6
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
EIO
Procesos de Análisis Inteligente de Datos es la cuarta asignatura de una secuencia en la que se han adquirido los rudimentos de probabilidad, inferencia estadística y modelización estadística. Esta asignatura culmina la formación para llevar el dato a la toma de decisiones más complejas, con la profundización en el diseño de procesos integrales de incorporen datos y que utilicen diversas formas de inteligencia artificial y modelos avanzados de datos en general para extraer valor estratégico de éstas, al tiempo que se conectan los resultados de los modelos de datos con otros componentes de los sistemas y procesos de decisión. En esta asignatura las técnicas vistas en buena parte de las asignaturas de las materias precedentes como "Probabilidad y Estadística", "Análisis inteligente de datos", "Aprendizaje Automático", "Conocimiento y , Razonamiento Automático" y "Sistemas Basados en el Conocimiento" y "Tratamiento del Lenguaje Humano" se verán como piezas de procesos de análisis más complejos, que van desde la recogida de datos hasta la integración de modelos basados en datos y conocimiento en sistemas integrales de apoyo a la toma de decisión o diferentes esquemas de integrar la IA y los datos en las decisiones.

Profesorado

Responsable

  • Karina Gibert Oliveras ( )

Otros

  • Sergi Ramirez Mitjans ( )
  • Xavier Angerri Torredeflot ( )

Horas semanales

Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6

Competencias

Competencias Transversales

Transversales

  • CT4 [Avaluable] - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
  • CT6 [Avaluable] - Aprendizaje autónomo. Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar dicho conocimiento.
  • CT8 [Avaluable] - Perspectiva de género. Conocer y comprender, desde el propio ámbito de la titulación, las desigualdades por razón de sexo y género en la sociedad; integrar las diferentes necesidades y preferencias por razón de sexo y de género en el diseño de soluciones y resolución de problemas.

Básicas

  • CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía

Competencias Técnicas

Específicas

  • CE09 - Concebir, diseñar e integrar sistemas de análisis inteligente de datos con aplicación en entornos de producción y de servicios.
  • CE17 - Desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona-computadora y persona-robot.
  • CE18 - Adquirir y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
  • CE20 - Elegir y emplear técnicas de modelización estadística y análisis de datos, evaluando la calidad de los modelos, validándolos e interpretándolos.

Competencias Técnicas Genéricas

Genéricas

  • CG1 - Concebir, redactar, organizar, planificar y desarrollar proyectos en el ámbito de la inteligencia artificial.
  • CG2 - Utilizar los conocimientos fundamentales y metodologías de trabajo sólidas adquiridos durante los estudios para adaptarse a los nuevos escenarios tecnológicos del futuro.
  • CG3 - Definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas en el ámbito de la inteligencia artificial.
  • CG4 - Razonar, analizando la realidad y diseñando algoritmos y formulaciones que la modelen. Identificar problemas y construir soluciones algorítmicas o matemáticas válidas, eventualmente nuevas, integrando el conocimiento multidisciplinar necesario, valorando distintas alternativas con espíritu crítico, justificando las decisiones tomadas, interpretando y sintetizando los resultados en el contexto del dominio de aplicación y estableciendo generalizaciones metodológicas a partir de aplicaciones concretas.
  • CG5 - Trabajar en equipos y proyectos multidisciplinares relacionados con la inteligencia artificial y la robótica, interactuando fluidamente con ingenieros/as y profesionales de otras disciplinas.
  • CG7 - Interpretar y aplicar la legislación vigente, así como especificaciones, reglamentos y normas en el ámbito de la inteligencia artificial.
  • CG8 - Observar un ejercicio ético de la profesión en todas sus facetas, aplicando criterios éticos en el diseño de sistemas,algoritmos, experimentos, utilización de datos, de acuerdo con los sistemas éticos recomendados por los organismos nacionales e internacionales, con especial énfasis en seguridad, robustez, privacidad, transparencia, trazabilidad, prevención de sesgos (de raza, género, religión, territorio, etc.) y respeto a los derechos humanos.
  • CG9 - Afrontar nuevos retos con una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Inteligencia Artificial. Desarrollar la actividad aplicando criterios de calidad y mejora continua, y actuar con rigor en el desarrollo profesional. Adaptarse a los cambios organizativos o tecnológicos. Trabajar en situaciones de carencia de información y/o con restricciones temporales y/o de recursos.

Objetivos

  1. Uso solvente de las fuentes de datos abiertas disponibles en combinación con los datos privados
    Competencias relacionadas: CG8, CT6, CT8, CB3,
  2. Identificar qué tipo de preprocesamiento necesitan unos datos reales.
    Competencias relacionadas: CG4, CG8,
  3. Conocer métodos de análisis integrado de datos y conocimiento y poder aplicarlos correctamente a un problema real
    Competencias relacionadas: CG2, CG4, CE18,
  4. Dado un problema, unos datos y unas perspectivas de uso del modelo, saber elegir el mejor modelo a aplicar de entre todos los que se han visto en la asignatura y en las precedentes
    Competencias relacionadas: CG1, CG4, CG8, CT4, CT8, CB5, CE09, CE18, CE20,
  5. Combinar los resultados de los data-driven models con métodos de producción de conocimiento útiles para la toma de decisiones posterior
    Competencias relacionadas: CT4, CB2, CE09, CE17, CE18,
  6. Identificar las herramientas de reporting o visualización de resultados más adecuadas a un problema concreto.
    Competencias relacionadas: CB4,
  7. Integrar las herramientas y modelos que se conocen en el diseño de un proceso de análisis inteligente de datos adecuado a un problema concreto.
    Competencias relacionadas: CG2, CG3, CG4, CG9,
  8. Dominar las tecnologías de puesta en producción de un proceso de análisis inteligente de datos.
    Competencias relacionadas: CG3, CG7, CG9, CE18,
  9. Ser consciente de la huella digital de la IA y poder aplicar estrategias que la reduzcan en un proceso de análisis inteligente de datos.
    Competencias relacionadas: CG2, CG3, CG8, CE09, CE18,
  10. Integrar los procesos de análisis inteligente de datos en arquitecturas de sistemas inteligentes de soporte a la toma de decisiones.
    Competencias relacionadas: CG1, CG3, CG4, CG5, CG8, CG9, CT4, CT6, CT8, CB2, CE09, CE20,
  11. Ser capaz de documentarse sobre nuevos métodos o tecnologías de forma autónoma
    Competencias relacionadas: CT6,
  12. Entender los principios éticos del modelo actual de IA y valorar si podemos implantarla en el debate
    Competencias relacionadas: CG4, CG8, CG9, CT8, CB4,
  13. Ser capaz de documentarse sobre nuevos métodos o tecnologías de forma autónoma y poder autoformarse en el futuro.
    Competencias relacionadas: CG5, CT6,

Contenidos

  1. Introducción. La inserción del dato en los procesos de decisión reales
    Introduction to decision theory and real decision-making support processes
  2. Sistemas inteligentes de soporte a la toma de decisiones
    Sistemas inteligentes de soporte a la toma de decisiones. Arquitectura de propósito general para IDSS
  3. Sistemas inteligentes de soporte a la toma de decisiones
    Sistemas inteligentes de soporte a la toma de decisiones
  4. Diseño de las fuentes de datos relevantes para un proceso de toma de decisiones
    Las fuentes de información relevantes (datos, imágenes, videos, conocimientos); estáticas/dinámicas; on-line/off-line; datos abiertos, muestrales, experimentales. Datos primarios/secundarios
    Vinculación de los datos con los objetivos del estudio. Representatividad de los datos, sesgos y políticas de compensación. Buenas prácticas des del diseño.
  5. Diseño integrado del preprocesamiento
    Construcción de organismos de preprocesamiento de datos para proyectos complejos.
    Papel de los objetivos de estudio y los modelos de datos a entrenar en los procesos de preprocesamiento de los datos
  6. Identificación automática de los métodos de modelización de datos del proceso de soporte en la decisión
    -Integración del DMMCM map en el proceso de selección del método
    -El modelo DMMT de representación de los métodos basados en datos
    -Relación entre los métodos disponibles y los objetivos del estudio
    -Relación entre los métodos disponibles y los datos disponibles
    -Relación entre diferentes métodos data-driven
  7. Criterios de determinación de los modelos de conocimiento
    Criterios para determinar los modelos de representación del conocimiento a integrar en el proceso de decisión (ontolgias, bases del conocimiento, etiquetas linguisticas, etc)
    Relación entre las componentes del conocimiento/razonamiento y los modelos basados en datos en el proceso de soporte a la decisión
  8. Los modelos mixtos de IA basados en datos/conocimiento en los IDSS
    Modelos mixtos de datos y conocimiento. Sistemas híbridos de Inteligencia Artificial
  9. Impacto del diseño de interficies en el IDSS
    Inputs del IDSS, percepción, representación del conocimiento en los inputs del sistema, accesos (roles, autenticación, permisos), brecha digital, modos de interacción con el usuario (voz, formularios, chatbots, etc). Buenas prácticas en el diseño de menús, accesibilidad, sistemas multilingües. Conexiones con datos (lagos, APIS, SQL, scrapping¿).
    Outputs: aplicaciones de la visualización de datos en un IDSS, explicabilidad y argumentación, recomendadores, reporting automático, comunicación de métricas y KPIS, rendición de cuentas (registros), rol del sistema (agencia, asistencia/automatización).
    Validación de un IDSS
  10. Inserción del análisis inteligente de datos en procesos reales
    181 / 5.000
    Sistemas de salud y bienestar
    Negocio (retailing, negociaciones¿)
    Procesos administrativos: administración pública, la administración de hospitales, de grandes corporaciones, etc
    Industria 4.0
    Decisión estratégica (estrategias de negocio o elaboración de políticas públicas=
    Sostenibilidad (biodiversidad, huella de carbono, etc)

Actividades

Actividad Acto evaluativo


Introducción a las prácticas y formación de los equipos de trabajo



Teoría
0h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Introducción. La inserción de los datos en los procesos de decisión reales


Objetivos: 2
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
2h

Generació del Canvas AI d'un cas real

Un cop triat el tema de la prática definir el projecte d'Intel·ligència Artifial que es pot definir utilitzant la metodologia CANVAS-AI
Objetivos: 4
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h

Sistemas inteligentes de apoyo a la toma de decisiones

Dissenyar l'arquitectura del sistema
Objetivos: 2 3 4
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Diseño de las fuentes de datos relevantes para un proceso de toma de decisión


Objetivos: 1 5
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8h

Diseño integrado del preprocesamiento


Objetivos: 6 7 8
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Elección de los métodos de modelización de datos del proceso de apoyo a la decisión


Objetivos: 2 3 4
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
10h

Determinación de los modelos de conocimiento


Objetivos: 2 4 5 6 8
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
1.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8h

Altres components del procés de decisió i integració


Objetivos: 10 11 13
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Presentación intermedia de los trabajos prácticos


Objetivos: 10
Semana: 8 (Fuera de horario lectivo)
Teoría
3h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8h

Model d'usuari i interfícies d'entrada en IDSS


Objetivos: 1 7 8
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Disseny dels outputs del IDSS i explicabilitat dels models


Objetivos: 5 6 7
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Validació global i pla de posta en producció del IDSS


Objetivos: 3 5 7 8
Contenidos:
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8h

Consideraciones éticas y huella de carbono de la IA


Objetivos: 9 12
Teoría
2h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Presentaciones finales de las prácticas



Teoría
3h
Problemas
0h
Laboratorio
4h
Aprendizaje dirigido
0h
Aprendizaje autónomo
8h

Presentació d'apllicacions reals de IDSS



Teoría
0h
Problemas
0h
Laboratorio
3h
Aprendizaje dirigido
0h
Aprendizaje autónomo
2h

Metodología docente

Los 12 temas propuestos se desarrollarán en 12 sesiones de clase teóricas (2 horas semanales) con sus respectivas prácticas o sesión de laboratorio asociada (también 2 horas semanales).

Las 3 sesiones que faltan de las 15 sesiones por semestre establecidas en la FIB, se destinarán a evaluaciones teóricas (quiz o similar) y evaluaciones prácticas (defensa de trabajos prácticos a mitad del semestre y al final del semestre) , recordando también que hay un par de semanas no lectivas por ser semana de exámenes parciales y/o finales, durante las cuales se puede ofrecer asesoramiento, apoyo y orientación a los alumnos como refuerzo o preparación para sus evaluaciones.

En las clases de teoría se practicará el esquema de clases invertidas siempre que sea posible.
Hay una página web para el tema.
En esta(s) plataforma(s) se publicará(n) la distribución temporal de los contenidos de la asignatura y los materiales a llevar preparados antes de cada clase.
El esquema de la clase magistral se utilizará en ocasiones cuando el docente necesite aclarar conceptos complejos que no han quedado claros con los materiales distribuidos previamente en clase.
La clase de teoría se dedicará principalmente a la presentación de casos y al desarrollo de actividades interactivas con los alumnos como la discusión de los casos, o la cumplimentación de breves cuestionarios específicos.
Una de las actividades de las clases teóricas de la asignatura será el planteamiento de casos reales con propuestas de diseño del sistema inteligente de datos para sustentar determinadas decisiones y la discusión abierta en el aula sobre los puntos fuertes y débiles del diseño propuesto. Esta actividad es fundamental para formar al alumno en el diseño de procesos solventes, seguros, viables y con poco riesgo de quiebra cuando hablamos de entornos reales. Del resultado del debate se derivarán cuestiones metodológicas a aclarar por el profesor.

Adicionalmente, los alumnos realizarán en grupo un buen número de trabajos prácticos breves sobre el diseño de procesos inteligentes de análisis de datos en escenarios más o menos maduros desde el punto de vista tecnológico donde habrá que realizar todo el proceso desde la eventual recogida o identificación. de fuentes de datos o conocimiento hasta la comunicación de resultados y recomendaciones con el usuario.
El caso de análisis puede ser propuesto por los propios alumnos en base a unas características marcadas por el profesorado. Cada equipo realizará sesiones prácticas, aplicando cada semana las técnicas vistas en el curso para afrontar el reto. El profesor hará un seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio. La propuesta de diseño incluirá una prueba de concepto en la medida en que los medios del tema lo permitan para la propuesta propuesta.

Dos veces al año los equipos presentarán sus propuestas en una sesión de intercambio donde todos los proyectos serán discutidos juntos.


Los recursos materiales de apoyo incluyen:
* Diapositivas/Transparencias de cada tema en formato pdf o similar.
* Enlaces a artículos, foros, discusiones o casos prácticos en repositorios congruentes y confiables para el tema.
* Vídeos o similares para mostrar casos prácticos o temas complementarios a las clases magistrales.
* Uso de software GNU para la parte práctica. Se sugiere el uso de R, RStudio y plataformas similares.
* Puedes utilizar software especializado desarrollado por grupos de investigación de la UPC como GESCONDA y Klass, Freeling, etc.

Método de evaluación

Se propone el siguiente sistema de evaluación:
- 4 Trabajos en equipo realizados a lo largo del curso 80%.

Por cada trabajo en equipo se evalúa
- Calidad técnica del diseño propuesto e integración de conocimientos que involucra (30%)
- Prueba de concepto (20%)
- Prueba oral de control de conocimientos 10% (discusión con el profesorado en la presentación oral de los trabajos en equipo).
- Calidad y rendimiento del equipo de trabajo. 10%.
- Comunicación oral y escrita 10%.
- Ética del equipo de trabajo y del trabajo propiamente dicho 10%
-Perspectiva de género del equipo y del trabajo 10%.


-Asistencia y participación en clases y laboratorios. 10%

Reevaluation: Only the students that have done the final exam and didn't success have the right to do the reevaluation exams. The maximum qualification at reevaluation phase is 7 points.
- 2 Quiz a lo largo del curso 10% (5% cada uno).

Bibliografía

Básica:

Complementaria:

  • Exploratory multivariate analysis by example using R - Husson, F.; Lê, S.; Pagès, J., CRC Press , 2011. ISBN: 9780367658021

Capacidades previas

En esta asignatura las técnicas vistas en buena parte de las asignaturas de las materias precedentes como "Probabilidad y Estadística", "Análisis inteligente de datos", "Aprendizaje Automático", "Lógica, Razonamiento Automático y "Sistemas Basados en el Conocimiento" y "Tratamiento del lenguaje humano y percepción"