Algoritmia para Minería de Datos

Usted está aquí

Créditos
6
Tipos
  • MDS: Optativa
  • MIRI: Complementaria de especialidad (Computación Avanzada)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
CS
La minería de datos es el proceso de extraer y descubrir patrones en conjuntos de datos (generalmente) grandes, empleando métodos que combinan aprendizaje automático, estadística multivariante y sistemas de bases de datos. Actualmente, utiliza estos métodos con principios para conformar un proceso integral, desde un conjunto de datos sin procesar hasta información de alto nivel, expresada en una estructura comprensible para el usuario final.

El objetivo de este curso es presentar y estudiar algunos de los algoritmos más extendidos, útiles y elegantes que combinan estas tres disciplinas, para que los estudiantes sean capaces de identificar y aplicar las herramientas adecuadas para una aplicación determinada. Las clases cubrirán la teoría, los algoritmos y el uso práctico de las técnicas.

Profesorado

Responsable

  • Luis Antonio Belanche Muñoz ( )

Horas semanales

Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6.375

Competencias

Competencias Técnicas de cada especialidad

Advanced computing

  • CEE3.1 - Capacidad para identificar barreras computacionales y analizar la complejidad de problemas computacionales en diversos ámbitos de la ciencia y la tecnología; así como para representar problemas de alta complejidad en estructuras matemáticas que puedan ser tratadas eficientemente con esquemas algorítmicos.
  • CEE3.2 - Capacidad para utilizar un espectro amplio y variado de recursos algorítmicos para resolver problemas de alta dificultad algorítmica.
  • CEE3.3 - Capacidad para entender las necesidades computacionales de problemas de disciplinas distintas de la informática y efectuar contribuciones significativas en equipos multidisciplinares que usen la computación.

Competencias Técnicas Genéricas

Genéricas

  • CG1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
  • CG5 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.

Competencias Transversales

Trabajo en equipo

  • CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.

Uso solvente de los recursos de información

  • CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.

Actitud frente al trabajo

  • CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.

Razonamiento

  • CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.

Básicas

  • CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Objetivos

  1. Te be aware of the theoretical and practical set of problems that constitute Data Mining, and to understand the main models and algorithms to tackle it: both at the conceptual level and at the level of their application through commercial tools, preferably open-source.
    Competencias relacionadas: CB6, CTR4, CTR5, CTR6, CEE3.1, CEE3.2, CEE3.3, CG1, CG3, CG5,
  2. To acquire and demonstrate an ability to put to work the knowledge obtained in the autonomous, team-wise deployment of a practical data mining case, including a public presentation of the work developed.
    Competencias relacionadas: CB6, CB8, CB9, CTR3, CTR4, CTR5, CTR6, CEE3.2, CG3,

Contenidos

  1. Técnicas y algoritmos seleccionados para Minería de Datos
    Algorithms and techniques are representative of the good and the best a data practitioner needs to know, among which:

    backpropagation
    expectation-maximization
    association rules
    pagerank
    GLMs

    Each topic of study is focused in 3 aspects:

    theoretical
    algorithmic
    practical

Actividades

Actividad Acto evaluativo


Theoretical and conceptual study of the main data mining algorithms.

Theoretical and conceptual study of the main data mining algorithms.
Objetivos: 1
Contenidos:
Teoría
18h
Problemas
6h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Deploy of a practical case study

Deploy of a practical case study
Objetivos: 1 2
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
36h
Aprendizaje dirigido
0h
Aprendizaje autónomo
18h

Metodología docente

Clases teóricas, ejercicios y problemas problemas de análisis de datos con o sin componente de programación y desarrollo de casos de estudio.

Método de evaluación

La calificación del curso se basa en cinco componentes:

Proyecto 1 (Sesiones 1-5) 30 % Grupal
Proyecto 2 (Sesiones 6-10) 30 % Grupal
Control 1 10 % Individual
Control 2 10 % Individual
Examen final 20 % Individual

Bibliografía

Básica:

Capacidades previas

Comprensión adecuada de la informática en general, en especial algoritmia; buen nivel de diversos lenguajes de programación (como R, python, Julia) o voluntad de alcanzarlo; capacidad básica a media para formalizar matemáticamente conceptos en informática, estadística, etc.