La Minería de Datos es una disciplina en la que se han desarrollado tecnologías que, oportunamente empleadas, permiten a una organización mejorar su rendimiento a partir del análisis de datos disponibles y de la identificación de patrones en ellos. Sin embargo, a pesar de las diversas "success stories" disponibles, es imprescindible ser consciente de las limitaciones de estas tecnologías: aquí se desarrollará el estudio de los algoritmos más habituales y de sus principales parámetros, de manera que los alumnos sean capaces de identificar la herramienta adecuada para una aplicación. Se explicará la teoría y el uso práctico de clusterizadores, asociadores y clasificadores de forma que el alumno adquiera criterios para fijar los valores de los muchos parámetros libres de cada uno de estos algoritmos.
Profesorado
Responsable
Jose Luis Balcázar Navarro (
)
Luis Antonio Belanche Muñoz (
)
Otros
Marta Arias Vicente (
)
Horas semanales
Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
0
Competencias
Competencias Técnicas de cada especialidad
Advanced computing
CEE3.1 - Capacidad para identificar barreras computacionales y analizar la complejidad de problemas computacionales en diversos ámbitos de la ciencia y la tecnología; así como para representar problemas de alta complejidad en estructuras matemáticas que puedan ser tratadas eficientemente con esquemas algorítmicos.
CEE3.2 - Capacidad para utilizar un espectro amplio y variado de recursos algorítmicos para resolver problemas de alta dificultad algorítmica.
CEE3.3 - Capacidad para entender las necesidades computacionales de problemas de disciplinas distintas de la informática y efectuar contribuciones significativas en equipos multidisciplinares que usen la computación.
Competencias Técnicas Genéricas
Genéricas
CG1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
CG5 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.
Competencias Transversales
Trabajo en equipo
CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
Uso solvente de los recursos de información
CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.
Actitud frente al trabajo
CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.
Razonamiento
CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.
Básicas
CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Objetivos
Te be aware of the theoretical and practical set of problems that constitute Data Mining, and to understand the main models and algorithms to tackle it: both at the conceptual level and at the level of their application through commercial tools, preferably open-source.
Competencias relacionadas:
CB6,
CTR4,
CTR5,
CTR6,
CEE3.1,
CEE3.2,
CEE3.3,
CG1,
CG3,
CG5,
To acquire and demonstrate an ability to put to work the knowledge obtained in the autonomous, team-wise deployment of a practical data mining case, including a public presentation of the work developed.
Competencias relacionadas:
CB6,
CB8,
CB9,
CTR3,
CTR4,
CTR5,
CTR6,
CEE3.2,
CG3,
Contenidos
Main models and algorithms for Data Mining
Actividades
ActividadActo evaluativo
Theoretical and conceptual study of the main data mining algorithms.
Theoretical and conceptual study of the main data mining algorithms. Objetivos:1 Contenidos:
Theory sessions, problem solving sessions with or without a programming component, practical sessions with commercial data mining software, development of a case study.
Método de evaluación
Evaluation is fully offline and there will be no exams. Each person must contribute 4 written documents on topics related to the course. Coauthorship is allowed but the sets of coauthors in each pair of documents must be disjoint. Final grade will be the average of the grades of the documents.
The topic of each document is to be individually agreed with the lecturer by each student. Many suggestions will be provided along the teaching but individual initiative and open-minded approaches are particularly encouraged. The topics of the documents may be different or, alternatively, several documents may deepen successively on the same or closely related topics.
The only condition is that at least one of the documents focuses on the practical usage of data mining algorithms, preferably as implemented in a standard platform, on a dataset of the student's choice.
In normal times, the last document may be replaced by an oral presentation. In times of remote teaching due to confinement or otherwise, this option will not be available.
Thorough understanding of computing in general; good command of several programming languages; basic ability to formalize mathematically issues in informatics engineering.