La minería de datos es el proceso de extracción y descubrimiento de patrones en conjuntos de datos grandes (generalmente) que implican métodos en la intersección del aprendizaje automático, las estadísticas multivariantes y los sistemas de bases de datos. Actualmente utiliza estos métodos de forma principiada para formar un proceso de extremo a extremo, desde un conjunto de datos en bruto hasta información de alto nivel, expresada en una estructura comprensible para el usuario final.
El objetivo de este curso es presentar y estudiar algunos de los algoritmos más extendidos, útiles y elegantes para que los estudiantes sean capaces de identificar y aplicar las herramientas adecuadas para una aplicación determinada. Las clases magistrales tratarán la teoría, los algoritmos y el uso práctico de las técnicas.
Profesorado
Responsable
Luis Antonio Belanche Muñoz (
)
Horas semanales
Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6.375
Competencias
Competencias Técnicas de cada especialidad
Advanced computing
CEE3.1 - Capacidad para identificar barreras computacionales y analizar la complejidad de problemas computacionales en diversos ámbitos de la ciencia y la tecnología; así como para representar problemas de alta complejidad en estructuras matemáticas que puedan ser tratadas eficientemente con esquemas algorítmicos.
CEE3.2 - Capacidad para utilizar un espectro amplio y variado de recursos algorítmicos para resolver problemas de alta dificultad algorítmica.
CEE3.3 - Capacidad para entender las necesidades computacionales de problemas de disciplinas distintas de la informática y efectuar contribuciones significativas en equipos multidisciplinares que usen la computación.
Competencias Técnicas Genéricas
Genéricas
CG1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
CG5 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.
Competencias Transversales
Trabajo en equipo
CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.
Uso solvente de los recursos de información
CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.
Actitud frente al trabajo
CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.
Razonamiento
CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.
Básicas
CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Objetivos
Te be aware of the theoretical and practical set of problems that constitute Data Mining, and to understand the main models and algorithms to tackle it: both at the conceptual level and at the level of their application through commercial tools, preferably open-source.
Competencias relacionadas:
CB6,
CTR4,
CTR5,
CTR6,
CEE3.1,
CEE3.2,
CEE3.3,
CG1,
CG3,
CG5,
To acquire and demonstrate an ability to put to work the knowledge obtained in the autonomous, team-wise deployment of a practical data mining case, including a public presentation of the work developed.
Competencias relacionadas:
CB6,
CB8,
CB9,
CTR3,
CTR4,
CTR5,
CTR6,
CEE3.2,
CG3,
Contenidos
Técnicas y algoritmos seleccionados para Minería de Datos
Algorithms and techniques are representative of the good and the best a data practitioner needs to know, among which:
backpropagation
expectation-maximization
association rules
pagerank
GLMs
Each topic of study is focused in 3 aspects:
theoretical
algorithmic
practical
Actividades
ActividadActo evaluativo
Theoretical and conceptual study of the main data mining algorithms.
Theoretical and conceptual study of the main data mining algorithms. Objetivos:1 Contenidos:
Clases teóricas, ejercicios y problemas con o sin componente de programación y desarrollo de casos de estudio.
Método de evaluación
La evaluación se realiza totalmente fuera de las aulas y no habrá exámenes. Cada persona debe contribuir con tres (3) casos prácticos, ejercicios resueltos o problemas estudiados (informe escrito y eventualmente código) sobre temas relacionados con la asignatura; cada uno de ellos debe ser elaborado por tres (3) personas, de la siguiente manera:
- 2 personas hacen el ejercicio por se
- 1 persona valora el trabajo realizado
La función de evaluador será asumida por cada miembro exactamente una vez. El orden se dejará a la decisión de los miembros del grupo. El/los profesor/es evalúan tanto el trabajo realizado como la propia evaluación. Se dispondrá de rúbricas que muestren la forma precisa en la que se llevan a cabo todas las evaluaciones, todas ellas disponibles públicamente en todo momento. La información adicional como las fechas de entrega, el formato del documento, etc. se dará en su día.
La nota final se calculará de la siguiente forma. Sea
Ri = evaluación del trabajo 'i' por parte del profesor
SEi = evaluación del trabajo 'i' por parte del estudiante
LEi = evaluación de la evaluación 'i' por parte del profesor
FGi = nota final del trabajo 'i' = 1/2*(Ri + 10 - |SEi - LEi|)
FS = nota final = [3*FG1 + 3*FG2 + 3*FG3 + SS]/10
donde SS es el grado de las habilidades no técnicas o genéricas (véase la guía docente de la asignatura para más información).
El tema de cada trabajo debe acordarse con el/los profesor/es por cada grupo de estudiantes. A lo largo de las clases se harán muchas sugerencias. Dicho esto, se fomenta especialmente la iniciativa individual y los enfoques por propia iniciativa. Los temas de los trabajos pueden ser distintos o, alternativamente, trabajo encadenado puede profundizar sucesivamente sobre los mismos temas o temas íntimamente relacionados.
Comprensión adecuada de la informática en general, en especial algoritmia; buen nivel de diversos lenguajes de programación (como R, python, Julia) o voluntad de alcanzarlo; capacidad básica a media para formalizar matemáticamente conceptos en informática, estadística, etc.