Complementaria de especialidad (Ciencia de los Datos)
Requisitos
Esta asignatura no tiene requisitos
Departamento
EIO;CS
Kernel based Machine Learning and Multivariate Modeling
Profesorado
Responsable
Luis Antonio Belanche Muñoz (
)
Pedro Delicado Useros (
)
Horas semanales
Teoría
3
Problemas
0
Laboratorio
0
Aprendizaje dirigido
0.2
Aprendizaje autónomo
6
Competencias
Competencias Técnicas Genéricas
Genéricas
CG3 - Capacidad para el modelado matemático, cálculo y diseño experimental en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación e innovación en todos los ámbitos de la Informática.
Competencias Transversales
Uso solvente de los recursos de información
CTR4 - Gestionar la adquisición, la estructuración, el análisis y la visualización de datos e información del ámbito de la ingeniería informática y valorar de forma crítica los resultados de esta gestión.
Razonamiento
CTR6 - Capacidad de razonamiento crítico, lógico y matemático. Capacidad para resolver problemas dentro de su área de estudio. Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales. Capacidad de diseñar y realizar experimentos sencillos, y analizar e interpretar sus resultados. Capacidad de análisis, síntesis y evaluación.
Competencias Técnicas de cada especialidad
Específicas comunes
CEC1 - Capacidad para aplicar el método científico en el estudio y análisis de fenómenos y sistemas en cualquier ámbito de la Informática, así como en la concepción, diseño e implantación de soluciones informáticas innovadoras y originales.
CEC3 - Capacidad para aplicar soluciones innovadoras y realizar avances en el conocimiento que exploten los nuevos paradigmas de la Informática, particularmente en entornos distribuidos.
Objetivos
Understand the foundations of Kernel-Based Learning Methods
Competencias relacionadas:
CG3,
CEC1,
CEC3,
CTR6,
Get acquainted with specific kernel-based methods, such as the Support Vector Machine
Competencias relacionadas:
CG3,
CTR4,
Know methods for kernelizing existing statistical or machine learning algorithms
Competencias relacionadas:
CTR6,
Know the theoretical foundations of kernel functions and kernel methods
Competencias relacionadas:
CG3,
Know the structure of the main unsupervised learning problems.
Competencias relacionadas:
CG3,
CEC1,
CTR4,
CTR6,
Learn different methods for dimensionality reduction when the standard assumptions in classical Multivariate Analysis are not fulfilled
Competencias relacionadas:
CG3,
CEC1,
CEC3,
CTR4,
CTR6,
Learn how to combine dimensionality reduction techniques with prediction algorithms
Competencias relacionadas:
CG3,
CEC1,
CEC3,
CTR4,
CTR6,
Contenidos
Introduction to Kernel-Based Learning
This topic introduces the student the foundations of Kernel-Based Learning focusing on Kernel Linear Regression
The Support Vector Machine (SVM)
This topic develops Support Vector Machine (SVM) for classification, regression and novelty detection
Kernels: properties & design
This topic defines kernel functions, their properties and construction. Introduces specific kernels for different data types, such as real vectors, categorical information, feature subsets, strings, probability distributions and graphs.
Kernelizing ML algorithms
This topic reviews different techniques for kernelizing existent algorithms
Theoretical underpinnings
This topic reviews the basic theoretical underpinnings of kernel-based methods, focusing on statistical learning theory
Introduction to unsupervised learning
Unsupervised versus supervised learning. Main problems in unsupervised learning (density estimation, dimensionality reduction, latent variables, clustering).
Nonlinear dimensionality reduction
a. Principal curves.
b. Local Multidimensional Scaling.
c. ISOMAP.
d. t-Stochastic Neighbor Embedding.
e. Applications: (i) Visualization of high- or infinite-dimensional data. (ii) Exploratory analysis of functional data in Demography.
Dimensionality reduction with sparsity
a. Matrix decompositions, approximations, and completion.
b. Sparse Principal Components and Canonical Correlation.
c. Applications: (i) Recommender systems. (ii) Estimating causal effects.
Prediction after dimensionality reduction.
a. Reduced rank regression and canonical correlation.
b. Principal Component regression.
c. Distance based regression.
Objetivos:1234567 Semana:
15 (Fuera de horario lectivo) Tipo:
examen final
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
12h
Metodología docente
El aprendizaje se realiza a través de una combinación de explicación teórica y su aplicación a ejercicios y casos reales. Las explicaciones desarrollarán los conocimientos científicos necesarios y su aplicación a la resolución de problemas. Estos problemas constituyen las prácticas de la asignatura, que serán desarrollados por los propios estudiantes como parte de su aprendizaje. El software utilizado será principalmente R.
Método de evaluación
La evaluación de la asignatura se realizará a partir de las notas obtenidas en las prácticas realizadas durante el curso, más la nota obtenida en la prueba escrita de evaluación global.
Cada práctica comportará la redacción del correspondiente informe escrito, el cual será evaluado por los profesores. Con el conjunto de prácticas realizadas se obtendrá una nota promedio P.
La prueba escrita se realizará al final del cuatrimestre y evaluará la asimilación de los conceptos básicos del conjunto de la asignatura, dando lugar a una nota T.