Procesos de Análisis Inteligente de Datos es la cuarta asignatura de una secuencia en la que se han adquirido los rudimentos de probabilidad, inferencia estadística y modelización estadística. Esta asignatura culmina la formación para llevar el dato a la toma de decisiones más complejas, con la profundización en el diseño de procesos integrales de incorporen datos y que utilicen diversas formas de inteligencia artificial y modelos avanzados de datos en general para extraer valor estratégico de éstas, al tiempo que se conectan los resultados de los modelos de datos con otros componentes de los sistemas y procesos de decisión. En esta asignatura las técnicas vistas en buena parte de las asignaturas de las materias precedentes como "Probabilidad y Estadística", "Análisis inteligente de datos", "Aprendizaje Automático", "Conocimiento y , Razonamiento Automático" y "Sistemas Basados en el Conocimiento" y "Tratamiento del Lenguaje Humano" se verán como piezas de procesos de análisis más complejos, que van desde la recogida de datos hasta la integración de modelos basados en datos y conocimiento en sistemas integrales de apoyo a la toma de decisión o diferentes esquemas de integrar la IA y los datos en las decisiones.
Profesorado
Responsable
Karina Gibert Oliveras (
)
Otros
Sergi Ramirez Mitjans (
)
Xavier Angerri Torredeflot (
)
Horas semanales
Teoría
2
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6
Competencias
Competencias Transversales
Transversales
CT4 [Avaluable] - Trabajo en equipo. Ser capaz de trabajar como miembro de un equipo interdisciplinar, ya sea como un miembro más o realizando tareas de dirección, con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
CT6 [Avaluable] - Aprendizaje autónomo. Detectar deficiencias en el propio conocimiento y superarlas mediante la reflexión crítica y la elección de la mejor actuación para ampliar dicho conocimiento.
CT8 [Avaluable] - Perspectiva de género. Conocer y comprender, desde el propio ámbito de la titulación, las desigualdades por razón de sexo y género en la sociedad; integrar las diferentes necesidades y preferencias por razón de sexo y de género en el diseño de soluciones y resolución de problemas.
Básicas
CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía
Competencias Técnicas
Específicas
CE09 - Concebir, diseñar e integrar sistemas de análisis inteligente de datos con aplicación en entornos de producción y de servicios.
CE17 - Desarrollar y evaluar sistemas interactivos y de presentación de información compleja y su aplicación a la resolución de problemas de diseño de interacción persona-computadora y persona-robot.
CE18 - Adquirir y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
CE20 - Elegir y emplear técnicas de modelización estadística y análisis de datos, evaluando la calidad de los modelos, validándolos e interpretándolos.
Competencias Técnicas Genéricas
Genéricas
CG1 - Concebir, redactar, organizar, planificar y desarrollar proyectos en el ámbito de la inteligencia artificial.
CG2 - Utilizar los conocimientos fundamentales y metodologías de trabajo sólidas adquiridos durante los estudios para adaptarse a los nuevos escenarios tecnológicos del futuro.
CG3 - Definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas en el ámbito de la inteligencia artificial.
CG4 - Razonar, analizando la realidad y diseñando algoritmos y formulaciones que la modelen. Identificar problemas y construir soluciones algorítmicas o matemáticas válidas, eventualmente nuevas, integrando el conocimiento multidisciplinar necesario, valorando distintas alternativas con espíritu crítico, justificando las decisiones tomadas, interpretando y sintetizando los resultados en el contexto del dominio de aplicación y estableciendo generalizaciones metodológicas a partir de aplicaciones concretas.
CG5 - Trabajar en equipos y proyectos multidisciplinares relacionados con la inteligencia artificial y la robótica, interactuando fluidamente con ingenieros/as y profesionales de otras disciplinas.
CG7 - Interpretar y aplicar la legislación vigente, así como especificaciones, reglamentos y normas en el ámbito de la inteligencia artificial.
CG8 - Observar un ejercicio ético de la profesión en todas sus facetas, aplicando criterios éticos en el diseño de sistemas,algoritmos, experimentos, utilización de datos, de acuerdo con los sistemas éticos recomendados por los organismos nacionales e internacionales, con especial énfasis en seguridad, robustez, privacidad, transparencia, trazabilidad, prevención de sesgos (de raza, género, religión, territorio, etc.) y respeto a los derechos humanos.
CG9 - Afrontar nuevos retos con una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Inteligencia Artificial. Desarrollar la actividad aplicando criterios de calidad y mejora continua, y actuar con rigor en el desarrollo profesional. Adaptarse a los cambios organizativos o tecnológicos. Trabajar en situaciones de carencia de información y/o con restricciones temporales y/o de recursos.
Objetivos
Uso solvente de las fuentes de datos abiertas disponibles en combinación con los datos privados
Competencias relacionadas:
CG8,
CT6,
CT8,
CB3,
Identificar qué tipo de preprocesamiento necesitan unos datos reales.
Competencias relacionadas:
CG4,
CG8,
Conocer métodos de análisis integrado de datos y conocimiento y poder aplicarlos correctamente a un problema real
Competencias relacionadas:
CG2,
CG4,
CE18,
Dado un problema, unos datos y unas perspectivas de uso del modelo, saber elegir el mejor modelo a aplicar de entre todos los que se han visto en la asignatura y en las precedentes
Competencias relacionadas:
CG1,
CG4,
CG8,
CT4,
CT8,
CB5,
CE09,
CE18,
CE20,
Combinar los resultados de los data-driven models con métodos de producción de conocimiento útiles para la toma de decisiones posterior
Competencias relacionadas:
CT4,
CB2,
CE09,
CE17,
CE18,
Identificar las herramientas de reporting o visualización de resultados más adecuadas a un problema concreto.
Competencias relacionadas:
CB4,
Integrar las herramientas y modelos que se conocen en el diseño de un proceso de análisis inteligente de datos adecuado a un problema concreto.
Competencias relacionadas:
CG2,
CG3,
CG4,
CG9,
Dominar las tecnologías de puesta en producción de un proceso de análisis inteligente de datos.
Competencias relacionadas:
CG3,
CG7,
CG9,
CE18,
Ser consciente de la huella digital de la IA y poder aplicar estrategias que la reduzcan en un proceso de análisis inteligente de datos.
Competencias relacionadas:
CG2,
CG3,
CG8,
CE09,
CE18,
Integrar los procesos de análisis inteligente de datos en arquitecturas de sistemas inteligentes de soporte a la toma de decisiones.
Competencias relacionadas:
CG1,
CG3,
CG4,
CG5,
CG8,
CG9,
CT4,
CT6,
CT8,
CB2,
CE09,
CE20,
Ser capaz de documentarse sobre nuevos métodos o tecnologías de forma autónoma
Competencias relacionadas:
CT6,
Entender los principios éticos del modelo actual de IA y valorar si podemos implantarla en el debate
Competencias relacionadas:
CG4,
CG8,
CG9,
CT8,
CB4,
Ser capaz de documentarse sobre nuevos métodos o tecnologías de forma autónoma y poder autoformarse en el futuro.
Competencias relacionadas:
CG5,
CT6,
Contenidos
Introducción. La inserción del dato en los procesos de decisión reales
Introduction to decision theory and real decision-making support processes
Sistemas inteligentes de soporte a la toma de decisiones
Sistemas inteligentes de soporte a la toma de decisiones. Arquitectura de propósito general para IDSS
Sistemas inteligentes de soporte a la toma de decisiones
Sistemas inteligentes de soporte a la toma de decisiones
Diseño de las fuentes de datos relevantes para un proceso de toma de decisiones
Las fuentes de información relevantes (datos, imágenes, videos, conocimientos); estáticas/dinámicas; on-line/off-line; datos abiertos, muestrales, experimentales. Datos primarios/secundarios
Vinculación de los datos con los objetivos del estudio. Representatividad de los datos, sesgos y políticas de compensación. Buenas prácticas des del diseño.
Diseño integrado del preprocesamiento
Construcción de organismos de preprocesamiento de datos para proyectos complejos.
Papel de los objetivos de estudio y los modelos de datos a entrenar en los procesos de preprocesamiento de los datos
Identificación automática de los métodos de modelización de datos del proceso de soporte en la decisión
-Integración del DMMCM map en el proceso de selección del método
-El modelo DMMT de representación de los métodos basados en datos
-Relación entre los métodos disponibles y los objetivos del estudio
-Relación entre los métodos disponibles y los datos disponibles
-Relación entre diferentes métodos data-driven
Criterios de determinación de los modelos de conocimiento
Criterios para determinar los modelos de representación del conocimiento a integrar en el proceso de decisión (ontolgias, bases del conocimiento, etiquetas linguisticas, etc)
Relación entre las componentes del conocimiento/razonamiento y los modelos basados en datos en el proceso de soporte a la decisión
Los modelos mixtos de IA basados en datos/conocimiento en los IDSS
Modelos mixtos de datos y conocimiento. Sistemas híbridos de Inteligencia Artificial
Impacto del diseño de interficies en el IDSS
Inputs del IDSS, percepción, representación del conocimiento en los inputs del sistema, accesos (roles, autenticación, permisos), brecha digital, modos de interacción con el usuario (voz, formularios, chatbots, etc). Buenas prácticas en el diseño de menús, accesibilidad, sistemas multilingües. Conexiones con datos (lagos, APIS, SQL, scrapping¿).
Outputs: aplicaciones de la visualización de datos en un IDSS, explicabilidad y argumentación, recomendadores, reporting automático, comunicación de métricas y KPIS, rendición de cuentas (registros), rol del sistema (agencia, asistencia/automatización).
Validación de un IDSS
Inserción del análisis inteligente de datos en procesos reales
181 / 5.000
Sistemas de salud y bienestar
Negocio (retailing, negociaciones¿)
Procesos administrativos: administración pública, la administración de hospitales, de grandes corporaciones, etc
Industria 4.0
Decisión estratégica (estrategias de negocio o elaboración de políticas públicas=
Sostenibilidad (biodiversidad, huella de carbono, etc)
Actividades
ActividadActo evaluativo
Introducción a las prácticas y formación de los equipos de trabajo
Teoría
0h
Problemas
0h
Laboratorio
2h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Introducción. La inserción de los datos en los procesos de decisión reales
Un cop triat el tema de la prática definir el projecte d'Intel·ligència Artifial que es pot definir utilitzant la metodologia CANVAS-AI Objetivos:4 Contenidos:
Los 12 temas propuestos se desarrollarán en 12 sesiones de clase teóricas (2 horas semanales) con sus respectivas prácticas o sesión de laboratorio asociada (también 2 horas semanales).
Las 3 sesiones que faltan de las 15 sesiones por semestre establecidas en la FIB, se destinarán a evaluaciones teóricas (quiz o similar) y evaluaciones prácticas (defensa de trabajos prácticos a mitad del semestre y al final del semestre) , recordando también que hay un par de semanas no lectivas por ser semana de exámenes parciales y/o finales, durante las cuales se puede ofrecer asesoramiento, apoyo y orientación a los alumnos como refuerzo o preparación para sus evaluaciones.
En las clases de teoría se practicará el esquema de clases invertidas siempre que sea posible.
Hay una página web para el tema.
En esta(s) plataforma(s) se publicará(n) la distribución temporal de los contenidos de la asignatura y los materiales a llevar preparados antes de cada clase.
El esquema de la clase magistral se utilizará en ocasiones cuando el docente necesite aclarar conceptos complejos que no han quedado claros con los materiales distribuidos previamente en clase.
La clase de teoría se dedicará principalmente a la presentación de casos y al desarrollo de actividades interactivas con los alumnos como la discusión de los casos, o la cumplimentación de breves cuestionarios específicos.
Una de las actividades de las clases teóricas de la asignatura será el planteamiento de casos reales con propuestas de diseño del sistema inteligente de datos para sustentar determinadas decisiones y la discusión abierta en el aula sobre los puntos fuertes y débiles del diseño propuesto. Esta actividad es fundamental para formar al alumno en el diseño de procesos solventes, seguros, viables y con poco riesgo de quiebra cuando hablamos de entornos reales. Del resultado del debate se derivarán cuestiones metodológicas a aclarar por el profesor.
Adicionalmente, los alumnos realizarán en grupo un buen número de trabajos prácticos breves sobre el diseño de procesos inteligentes de análisis de datos en escenarios más o menos maduros desde el punto de vista tecnológico donde habrá que realizar todo el proceso desde la eventual recogida o identificación. de fuentes de datos o conocimiento hasta la comunicación de resultados y recomendaciones con el usuario.
El caso de análisis puede ser propuesto por los propios alumnos en base a unas características marcadas por el profesorado. Cada equipo realizará sesiones prácticas, aplicando cada semana las técnicas vistas en el curso para afrontar el reto. El profesor hará un seguimiento semanal de todos los equipos de trabajo en las sesiones de laboratorio. La propuesta de diseño incluirá una prueba de concepto en la medida en que los medios del tema lo permitan para la propuesta propuesta.
Dos veces al año los equipos presentarán sus propuestas en una sesión de intercambio donde todos los proyectos serán discutidos juntos.
Los recursos materiales de apoyo incluyen:
* Diapositivas/Transparencias de cada tema en formato pdf o similar.
* Enlaces a artículos, foros, discusiones o casos prácticos en repositorios congruentes y confiables para el tema.
* Vídeos o similares para mostrar casos prácticos o temas complementarios a las clases magistrales.
* Uso de software GNU para la parte práctica. Se sugiere el uso de R, RStudio y plataformas similares.
* Puedes utilizar software especializado desarrollado por grupos de investigación de la UPC como GESCONDA y Klass, Freeling, etc.
Método de evaluación
Se propone el siguiente sistema de evaluación:
- 4 Trabajos en equipo realizados a lo largo del curso 80%.
Por cada trabajo en equipo se evalúa
- Calidad técnica del diseño propuesto e integración de conocimientos que involucra (30%)
- Prueba de concepto (20%)
- Prueba oral de control de conocimientos 10% (discusión con el profesorado en la presentación oral de los trabajos en equipo).
- Calidad y rendimiento del equipo de trabajo. 10%.
- Comunicación oral y escrita 10%.
- Ética del equipo de trabajo y del trabajo propiamente dicho 10%
-Perspectiva de género del equipo y del trabajo 10%.
-Asistencia y participación en clases y laboratorios. 10%
Reevaluation: Only the students that have done the final exam and didn't success have the right to do the reevaluation exams. The maximum qualification at reevaluation phase is 7 points.
- 2 Quiz a lo largo del curso 10% (5% cada uno).
A survey on pre-processing techniques: Relevant issues in the context of environmental data -
GIBERT, Karina; SÁNCHEZ-MARRÉ, Miquel; IZQUIERDO, J,
IOS Press, 2016.
Fundamentals of Data Engineering: Designing and Building Scalable Data Systems for Modern Applications -
MURRAY, Brian,
ISBN: 979-8391793649
Complementaria:
Exploratory multivariate analysis by example using R -
Husson, F.; Lê, S.; Pagès, J., CRC Press ,
2011.
ISBN: 9780367658021
Capacidades previas
En esta asignatura las técnicas vistas en buena parte de las asignaturas de las materias precedentes como "Probabilidad y Estadística", "Análisis inteligente de datos", "Aprendizaje Automático", "Lógica, Razonamiento Automático y "Sistemas Basados en el Conocimiento" y "Tratamiento del lenguaje humano y percepción"