L'objectiu de l'aprenentatge automàtic (machine learning en anglès) és el desenvolupament de teories, tècniques i algorismes que permetin explorar mètodes automàtics per inferir models a partir de dades (p. ex., per trobar estructura o regularitats, o fer prediccions). Aquesta inferència està basada en l'observació de dades que representen informació incompleta sobre un procés. L'aprenentatge automàtic és un punt de trobada de diferents disciplines: l'estadística multivariant i computacional, la informàtica, i l'optimització matemàtica, entre d'altres.
Professorat
Responsable
Marta Arias Vicente (
)
Altres
Alexis Molina Martinez de los Reyes (
)
Luis Antonio Belanche Muñoz (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Tècniques
Competències tècniques
CE1 - Utilitzar amb destresa els conceptes i mètodes matemàtics subjacents els problemes de la ciència i l'enginyeria de les dades.
CE3 - Analitzar fenòmens complexos mitjançant la probabilitat i l'estadística, i plantejar models d'aquests tipus en situacions concretes. Formular i resoldre problemes d'optimització matemàtica.
CE8 - Capacitat de triar i emprar tècniques de modelització estadística i anàlisi de dades, avaluant la qualitat dels models, validant-los i interpretant-los.
CE9 - Capacitat de triar i emprar una varietat de tècniques d'aprenentatge automàtic i construir sistemes que les utilitzin per a la presa de decisions, fins i tot de forma autònoma.
Competències Transversals
Transversals
CT3 - Comunicació eficaç oral i escrita. Comunicar-se de forma oral i escrita amb altres persones sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions; participar en debats sobre temes de la pròpia especialitat.
CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT7 - Tercera llengua. Conèixer una tercera llengua, preferentment l'anglès, amb un nivell adequat oral i escrit i d'acord amb les necessitats que tindran els titulats i titulades.
Competències Tècniques Generals
Genèriques
CG1 - Concebre sistemes computacionals que integren dades de procedències i formes molt diverses, construeixen amb ells models matemàtics, raonen sobre aquests models i actuen en conseqüència, aprenent de l'experiència.
CG2 - Elegir i aplicar els mètodes i tècniques més adequats a un problema definit per dades que representin un repte pel seu volum, velocitat, varietat o heterogeneïtat, inclosos mètodes informàtics, matemàtics, estadístics i de processament del senyal.
Objectius
Formular el problema de l'aprenentatge automàtic a partir de dades, i conèixer els tipus de tasques que es poden donar.
Competències relacionades:
CE1,
CE9,
CG1,
CG2,
Organitzar el flux de resolució d'un problema de l'aprenentatge automàtic, analitzant les possibles opcions i elegint les més adequades al problema.
Competències relacionades:
CE1,
CE9,
CT4,
CT7,
CG1,
CG2,
Decidir, defensar i criticar una solució per a un problema d'aprenentatge automàtic, argumentant els punts forts i febles de l'apropament.
Competències relacionades:
CE9,
CT3,
CT4,
CG2,
Conèixer i saber aplicar tècniques lineals per la resolució de problemes d'aprenentatge supervisat.
Competències relacionades:
CE3,
CE8,
CG2,
Conèixer i saber aplicar tècniques de xarxes neuronals mono i multicapa per la resolució de problemes d'aprenentatge supervisat.
Competències relacionades:
CE8,
CE9,
CG2,
Conèixer i saber aplicar tècniques de màquines de vectors suport per la resolució de problemes d'aprenentatge supervisat.
Competències relacionades:
CE8,
CE9,
CG2,
Conèixer i saber aplicar les tècniques bàsiques per la resolució de problemes d'aprenentatge no supervisat, amb èmfasi en eines d'agrupament de dades.
Competències relacionades:
CE8,
CE9,
CG2,
Conèixer i saber aplicar les tècniques bàsiques per la resolució de problemes d'aprenentatge per reforç.
Competències relacionades:
CE8,
CE9,
CG2,
Conèixer i saber aplicar tècniques de conjunt per la resolució de problemes d'aprenentatge supervisat.
Competències relacionades:
CE8,
CE9,
CG2,
Continguts
Introducció a l'Aprenentatge Automàtic
Informació general i conceptes bàsics. Descripció i plantejament dels problemes atacats per l'aprenentatge automàtic. Aprenentatge supervisat (regressió i classificació), no supervisat (clustering) i semi-supervisat (per reforç i transductiu). Exemples moderns d'aplicació.
Aprenentatge automàtic no supervisat: clustering
Definició i plantejament de l'aprenentatge automàtic no supervisat. Introducció al clustering. Algorismes probabilístics: algorisme k-means i algorisme Expectation-Maximization (E-M).
Aprenentatge automàtic supervisat (I): mètodes lineals per regressió
Màxima versemblança per regressió. Funcions d'error per regressió. Mínims quadrats: métodes analítics (pseudo-inversa i SVD) i iteratius (gradient descent). Noció de regularització. Regressió regularitzada L1 i L2: algorismes ridge regressión, LASSO i Elastic Net.
Aprenentatge automàtic supervisat (II): mètodes lineals per classificació
Màxima versemblança per classificació. Funcions d'error per classificació. Classificadors generatius Baiesians: LDA/QDA/RDA, Naïve Bayes i k-nearest neighbours.
Mètodes jeràrquics: arbres de decisió
Construcció general d'arbres de decisió. Criteris d'split: guany en entropia i criteri de Gini. Regularització en arbres de decisió. Arbres CART per regressió i classificació.
Mètodes de conjunt (ensemble)
Introducció als mètodes de conjunt (ensemble). Bagging i Random Forests. Boosting. Adaboost i variants.
Mètodes basats en kernels
Introducció a l'aprenentatge amb funcions de kernel. Regresió lineal regularitzada kernelitzada. Funcions de kernel bàsiques. Complexitat i generalització: dimensió de Vapnik-Chervonenkis. Màquines de Vectors Suport.
Les classes de teoria introdueixen tot els coneixements, les tècniques, conceptes i resultats necessaris per assolir un nivell ben fonamentat i entenedor. Aquests conceptes es posen en pràctica en les classes de laboratori. En aquestes es proporciona codi Python que permet resoldre certs aspectes d'un problema d'anàlisi de dades amb les tècniques corresponents al tema en curs. Aquest laboratori també serveix de guia per la part corresponent de la pràctica, que desenvolupen els alumnes al llarg del curs. Algunes de les hores de laboratori es podran usar per resoldre problemes (sense ordinador) a l'aula de teoria.
Hi ha un treball pràctic avaluable, que treballa un problema real a elegir pel propi estudiant i que recull i integra els coneixements i les competències de tot el curs. També s'avalua mitjançant el treball pràctic la competència genèrica de comunicació eficaç escrita.
Mètode d'avaluació
L'assignatura s'avalua mitjançant un examen parcial, un examen final i un treball pràctic en què s'ataca un problema real, redactant el corresponent informe.
La nota final es calcula com:
Nota Assignatura = 0,4*Treball + 0,6*max(Final, 1/3*Parcial + 2/3*Final)
Pel estudiants que puguin i vulguin concórrer a la re-avaluació, la nota de examen de reavaluació substituirà max(Final, 1/3*Parcial + 2/3*Final).
Nocions mitjanes de probabilitat i estadística.
Nocions mitjanes d'algebra lineal, càlcul matricial i anàlisi real
Bon nivell de programació en llenguatges d'alt nivell