Algoritmia para Minería de Datos

Usted está aquí

Créditos
6
Tipos
Complementaria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
CS
La Minería de Datos es una disciplina en la que se han desarrollado tecnologías que, oportunamente empleadas, permiten a una organización mejorar su rendimiento a partir del análisis de datos disponibles y de la identificación de patrones en ellos. Sin embargo, a pesar de las diversas "success stories" disponibles, es imprescindible ser consciente de las limitaciones de estas tecnologías: aquí se desarrollará el estudio de los algoritmos más habituales y de sus principales parámetros, de manera que los alumnos sean capaces de identificar la herramienta adecuada para una aplicación. Se explicará la teoría y el uso práctico de clusterizadores, asociadores y clasificadores de forma que el alumno adquiera criterios para fijar los valores de los muchos parámetros libres de cada uno de estos algoritmos.

Profesores

Responsable

  • Jose Luis Balcázar Navarro ( )

Otros

  • Jorge Castro Rabal ( )
  • Jose Carmona Vargas ( )
  • Marta Arias Vicente ( )
  • Ricard Gavaldà Mestre ( )

Horas semanales

Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
0

Competencias

Competencias Técnicas de cada especialidad

Advanced computing

  • CEE3.1 - Capacidad para identificar barreras computacionales y analizar la complejidad de problemas computacionales en diversos ámbitos de la ciencia y la tecnología; así como para representar problemas de alta complejidad en estructuras matemáticas que puedan ser tratadas eficientemente con esquemas algorítmicos.
  • CEE3.2 - Capacidad para utilizar un espectro amplio y variado de recursos algorítmicos para resolver problemas de alta dificultad algorítmica.
  • CEE3.3 - Capacidad para entender las necesidades computacionales de problemas de disciplinas distintas de la informática y efectuar contribuciones significativas en equipos multidisciplinares que usen la computación.

Competencias Técnicas Genéricas

Genéricas

  • CG1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
  • CG5 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.

Competencias Transversales

Trabajo en equipo

  • CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.

Uso solvente de los recursos de información

  • CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.

Actitud frente al trabajo

  • CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.

Razonamiento

  • CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.

Básicas

  • CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Objetivos

  1. Te be aware of the theoretical and practical set of problems that constitute Data Mining, and to understand the main models and algorithms to tackle it: both at the conceptual level and at the level of their application through commercial tools, preferably open-source.
    Competencias relacionadas: CG1, CG3, CEE3.1, CEE3.2, CEE3.3, CB6, CTR4, CTR5, CTR6, CG5,
  2. To acquire and demonstrate an ability to put to work the knowledge obtained in the autonomous, team-wise deployment of a practical data mining case, including a public presentation of the work developed.
    Competencias relacionadas: CG3, CEE3.2, CB6, CB8, CB9, CTR3, CTR4, CTR5, CTR6,

Contenidos

  1. Main models and algorithms for Data Mining

Actividades

Actividad Acto evaluativo


Theoretical and conceptual study of the main data mining algorithms.

Theoretical and conceptual study of the main data mining algorithms.
Objetivos: 1
Contenidos:
Teoría
18h
Problemas
6h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Deploy of a practical case study

Deploy of a practical case study
Objetivos: 1 2
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
36h
Aprendizaje dirigido
0h
Aprendizaje autónomo
18h

Metodología docente

Theory sessions, problem solving sessions with or without a programming component, practical sessions with commercial data mining software, development of a case study.

Método de evaluación

Optional mid-term exam, final exam, presentation of the development of the case study.

The final grade will be the sum of two grades:

Basic understanding mark, between 0 and 7.

Commendable understanding mark, between 0 and 3.

The commendable understanding mark is obtained through specific questions in the final exam, clearly marked as such, and worth 3 points.

The basic understanding mark is the sum of three marks: the mid-term exam, worth 4 points; the presentation of the case study, worth 4 points; and the rest of the final exam, worth 4 points. If this sum is higher than 7, it gets truncated at 7.

Bibliografía

Básica:

  • The Top Ten Algorithms in Data Mining - Xindong Wu (Redactor), Vipin Kumar (Redactor) , Chapman & Hall/CRC Data Mining and Knowledge Discovery Series, ISBN: 978-1420089646

Capacidades previas

Thorough understanding of computing in general; good command of several programming languages; basic ability to formalize mathematically issues in informatics engineering.