Complementària d'especialitat (Ciència de les Dades)
Requisits
Aquesta assignatura no té requisits
Departament
EIO;CS
Kernel based Machine Learning and Multivariate Modeling
Hores setmanals
Teoria
3
Problemes
0
Laboratori
0
Aprenentatge dirigit
0.2
Aprenentatge autònom
6
Competències
Competències Tècniques Generals
Genèriques
CG3 - Capacitat per al modelatge matemàtic, càlcul i disseny experimental en centres tecnològics i d'enginyeria d'empresa, particularment en tasques de recerca i innovació en tots els àmbits de la Informàtica.
Competències Transversals
ús solvent dels recursos d'informació
CTR4 - Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i d'informació de l'àmbit de l'enginyeria informàtica, i valorar de forma crítica els resultats d'aquesta gestió.
Raonament
CTR6 - Capacitat de raonament crític, lògic i matemàtic. Capacitat de resoldre problemes en la seva àrea d'estudi. Capacitat d'abstracció: capacitat de crear i utilitzar models que reflecteixin situacions reals. Capacitat de dissenyar i realitzar experiments senzills, i analitzar-ne i interpretar-ne els resultats. Capacitat d'anàlisi, de síntesi i d'avaluació.
Competències Tècniques de cada especialitat
Específiques comunes
CEC1 - Capacitat per aplicar el mètode científic en l'estudi i anàlisi de fenòmens i sistemes en qualsevol àmbit de la Informàtica, així com en la concepció, disseny i implantació de solucions informàtiques innovadores i originals.
CEC3 - Capacitat per aplicar solucions innovadores i realitzar avanços en el coneixement que explotin els nous paradigmes de la Informàtica, particularment en entorns distribuïts.
Objectius
Understand the foundations of Kernel-Based Learning Methods
Competències relacionades:
CG3,
CEC1,
CEC3,
CTR6,
Get acquainted with specific kernel-based methods, such as the Support Vector Machine
Competències relacionades:
CG3,
CTR4,
Know methods for kernelizing existing statistical or machine learning algorithms
Competències relacionades:
CTR6,
Know the theoretical foundations of kernel functions and kernel methods
Competències relacionades:
CG3,
Know the structure of the main unsupervised learning problems.
Competències relacionades:
CG3,
CEC1,
CTR4,
CTR6,
Learn different methods for dimensionality reduction when the standard assumptions in classical Multivariate Analysis are not fulfilled
Competències relacionades:
CG3,
CEC1,
CEC3,
CTR4,
CTR6,
Learn how to combine dimensionality reduction techniques with prediction algorithms
Competències relacionades:
CG3,
CEC1,
CEC3,
CTR4,
CTR6,
Continguts
Introduction to Kernel-Based Learning
This topic introduces the student the foundations of Kernel-Based Learning focusing on Kernel Linear Regression
The Support Vector Machine (SVM)
This topic develops Support Vector Machine (SVM) for classification, regression and novelty detection
Kernels: properties & design
This topic defines kernel functions, their properties and construction. Introduces specific kernels for different data types, such as real vectors, categorical information, feature subsets, strings, probability distributions and graphs.
Kernelizing ML algorithms
This topic reviews different techniques for kernelizing existent algorithms
Theoretical underpinnings
This topic reviews the basic theoretical underpinnings of kernel-based methods, focusing on statistical learning theory
Introduction to unsupervised learning
Unsupervised versus supervised learning. Main problems in unsupervised learning (density estimation, dimensionality reduction, latent variables, clustering).
Nonlinear dimensionality reduction
a. Principal curves.
b. Local Multidimensional Scaling.
c. ISOMAP.
d. t-Stochastic Neighbor Embedding.
e. Applications: (i) Visualization of high- or infinite-dimensional data. (ii) Exploratory analysis of functional data in Demography.
Dimensionality reduction with sparsity
a. Matrix decompositions, approximations, and completion.
b. Sparse Principal Components and Canonical Correlation.
c. Applications: (i) Recommender systems. (ii) Estimating causal effects.
Prediction after dimensionality reduction.
a. Reduced rank regression and canonical correlation.
b. Principal Component regression.
c. Distance based regression.
L'aprenentatge es realitza a través d'una combinació d'explicacions teòriques i la seva aplicació a exercicis i casos reals. Les explicacions desenvoluparan els coneixements científics necessaris i la seva aplicació a la resolució de problemes. Aquests problemes constitueixen les pràctiques de l'assignatura, que seran desenvolupats pels propis estudiants com a part del seu aprenentatge. El programari utilitzat serà principalment R.
Mètode d'avaluació
L'avaluació de l'assignatura es realitzarà a partir de les notes obtingudes en les pràctiques realitzades durant el curs, més la nota obtinguda en la prova escrita d'avaluació global.
Cada pràctica comportarà la redacció del corresponent informe escrit, el qual serà avaluat pel/s professor/s. Amb el conjunt de pràctiques realitzades s'obtindrà una nota promig P.
La prova escrita es realitzarà al final del quadrimestre i avaluarà l'assimilació dels conceptes bàsics del conjunt de l'assignatura, donant lloc a una nota T.