Algoritmia para Minería de Datos

Usted está aquí

Créditos
6
Tipos
  • MIRI: Complementaria de especialidad (Ciencia de los Datos)
  • MDS: Optativa
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
CS
La minería de datos es el proceso de extracción y descubrimiento de patrones en conjuntos de datos grandes (generalmente) que implican métodos en la intersección del aprendizaje automático, las estadísticas multivariantes y los sistemas de bases de datos. Actualmente utiliza estos métodos de forma principiada para formar un proceso de extremo a extremo, desde un conjunto de datos en bruto hasta información de alto nivel, expresada en una estructura comprensible para el usuario final.

El objetivo de este curso es presentar y estudiar algunos de los algoritmos más extendidos, útiles y elegantes para que los estudiantes sean capaces de identificar y aplicar las herramientas adecuadas para una aplicación determinada. Las clases magistrales tratarán la teoría, los algoritmos y el uso práctico de las técnicas.

Profesorado

Responsable

  • Jose Luis Balcázar Navarro ( )
  • Luis Antonio Belanche Muñoz ( )

Otros

  • Marta Arias Vicente ( )

Horas semanales

Teoría
1
Problemas
0
Laboratorio
2
Aprendizaje dirigido
0
Aprendizaje autónomo
6.375

Competencias

Competencias Técnicas de cada especialidad

Advanced computing

  • CEE3.1 - Capacidad para identificar barreras computacionales y analizar la complejidad de problemas computacionales en diversos ámbitos de la ciencia y la tecnología; así como para representar problemas de alta complejidad en estructuras matemáticas que puedan ser tratadas eficientemente con esquemas algorítmicos.
  • CEE3.2 - Capacidad para utilizar un espectro amplio y variado de recursos algorítmicos para resolver problemas de alta dificultad algorítmica.
  • CEE3.3 - Capacidad para entender las necesidades computacionales de problemas de disciplinas distintas de la informática y efectuar contribuciones significativas en equipos multidisciplinares que usen la computación.

Competencias Técnicas Genéricas

Genéricas

  • CG1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
  • CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
  • CG5 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.

Competencias Transversales

Trabajo en equipo

  • CTR3 - Ser capaz de trabajar como miembro de un equipo, ya sea como un miembro más, o realizando tareas de dirección con la finalidad de contribuir a desarrollar proyectos con pragmatismo y sentido de la responsabilidad, asumiendo compromisos teniendo en cuenta los recursos disponibles.

Uso solvente de los recursos de información

  • CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.

Actitud frente al trabajo

  • CTR5 - Tener motivación para la realización profesional y para afrontar nuevos retos, así como una visión amplia de las posibilidades de la carrera profesional en el ámbito de la Ingeniería en Informática. Tener motivación por la calidad y la mejora continua, y actuar con rigor en el desarrollo profesional. Capacidad de adaptación a los cambios organizativos o tecnológicos. Capacidad de trabajar en situaciones de falta de información y/o con restricciones temporales y/o de recursos.

Razonamiento

  • CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.

Básicas

  • CB6 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB9 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Objetivos

  1. Te be aware of the theoretical and practical set of problems that constitute Data Mining, and to understand the main models and algorithms to tackle it: both at the conceptual level and at the level of their application through commercial tools, preferably open-source.
    Competencias relacionadas: CB6, CTR4, CTR5, CTR6, CEE3.1, CEE3.2, CEE3.3, CG1, CG3, CG5,
  2. To acquire and demonstrate an ability to put to work the knowledge obtained in the autonomous, team-wise deployment of a practical data mining case, including a public presentation of the work developed.
    Competencias relacionadas: CB6, CTR3, CTR4, CTR5, CTR6, CEE3.2, CB9, CG3, CB8,

Contenidos

  1. Técnicas y algoritmos seleccionados para Minería de Datos
    Algorithms and techniques are representative of the good and the best a data practitioner needs to know, among which:

    backpropagation
    expectation-maximization
    association rules
    pagerank
    GLMs

    Each topic of study is focused in 3 aspects:

    theoretical
    algorithmic
    practical

Actividades

Actividad Acto evaluativo


Theoretical and conceptual study of the main data mining algorithms.

Theoretical and conceptual study of the main data mining algorithms.
Objetivos: 1
Contenidos:
Teoría
18h
Problemas
6h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6h

Deploy of a practical case study

Deploy of a practical case study
Objetivos: 1 2
Contenidos:
Teoría
0h
Problemas
0h
Laboratorio
36h
Aprendizaje dirigido
0h
Aprendizaje autónomo
18h

Metodología docente

Clases teóricas, ejercicios y problemas con o sin componente de programación y desarrollo de casos de estudio.

Método de evaluación

La evaluación se realiza totalmente fuera de las aulas y no habrá exámenes. Cada persona debe contribuir con tres (3) casos prácticos, ejercicios resueltos o problemas estudiados (informe escrito y eventualmente código) sobre temas relacionados con la asignatura; cada uno de ellos debe ser elaborado por tres (3) personas, de la siguiente manera:

- 2 personas hacen el ejercicio por se
- 1 persona valora el trabajo realizado

La función de evaluador será asumida por cada miembro exactamente una vez. El orden se dejará a la decisión de los miembros del grupo. El/los profesor/es evalúan tanto el trabajo realizado como la propia evaluación. Se dispondrá de rúbricas que muestren la forma precisa en la que se llevan a cabo todas las evaluaciones, todas ellas disponibles públicamente en todo momento. La información adicional como las fechas de entrega, el formato del documento, etc. se dará en su día.

La nota final se calculará de la siguiente forma. Sea

Ri = evaluación del trabajo 'i' por parte del profesor
SEi = evaluación del trabajo 'i' por parte del estudiante
LEi = evaluación de la evaluación 'i' por parte del profesor

FGi = nota final del trabajo 'i' = 1/2*(Ri + 10 - |SEi - LEi|)

FS = nota final = [3*FG1 + 3*FG2 + 3*FG3 + SS]/10

donde SS es el grado de las habilidades no técnicas o genéricas (véase la guía docente de la asignatura para más información).

El tema de cada trabajo debe acordarse con el/los profesor/es por cada grupo de estudiantes. A lo largo de las clases se harán muchas sugerencias. Dicho esto, se fomenta especialmente la iniciativa individual y los enfoques por propia iniciativa. Los temas de los trabajos pueden ser distintos o, alternativamente, trabajo encadenado puede profundizar sucesivamente sobre los mismos temas o temas íntimamente relacionados.

Bibliografía

Básica:

Capacidades previas

Comprensión adecuada de la informática en general, en especial algoritmia; buen nivel de diversos lenguajes de programación (como R, python, Julia) o voluntad de alcanzarlo; capacidad básica a media para formalizar matemáticamente conceptos en informática, estadística, etc.