Vés al contingut

Aprenentatge Automàtic I

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits , però té capacitats prèvies
Departament
TSC
L'objectiu de l'aprenentatge automàtic (machine learning en anglès) és el desenvolupament de teories, tècniques i algorismes que permetin explorar mètodes automàtics per inferir models a partir de dades (p. ex., per trobar estructura o regularitats, o fer prediccions). Aquesta inferència està basada en l'observació de dades que representen informació incompleta sobre un procés. L'aprenentatge automàtic és un punt de trobada de diferents disciplines: l'estadística multivariant i computacional, la informàtica, i l'optimització matemàtica, entre d'altres.

Professorat

Responsable

  • Josep Vidal Manzano (josep.vidal@upc.edu)

Altres

  • Maria Ysern García (maria.ysern@upc.edu)
  • Sígrid Vila Bagaria (sigrid.vila@upc.edu)

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Competències tècniques

  • CE1 - Utilitzar amb destresa els conceptes i mètodes matemàtics subjacents els problemes de la ciència i l'enginyeria de les dades.
  • CE3 - Analitzar fenòmens complexos mitjançant la probabilitat i l'estadística, i plantejar models d'aquests tipus en situacions concretes. Formular i resoldre problemes d'optimització matemàtica.
  • CE8 - Capacitat de triar i emprar tècniques de modelització estadística i anàlisi de dades, avaluant la qualitat dels models, validant-los i interpretant-los.
  • CE9 - Capacitat de triar i emprar una varietat de tècniques d'aprenentatge automàtic i construir sistemes que les utilitzin per a la presa de decisions, fins i tot de forma autònoma.
  • Transversals

  • CT3 - Comunicació eficaç oral i escrita. Comunicar-se de forma oral i escrita amb altres persones sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions; participar en debats sobre temes de la pròpia especialitat.
  • CT4 [Avaluable] - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
  • CT7 - Tercera llengua. Conèixer una tercera llengua, preferentment l'anglès, amb un nivell adequat oral i escrit i d'acord amb les necessitats que tindran els titulats i titulades.
  • Genèriques

  • CG1 - Concebre sistemes computacionals que integren dades de procedències i formes molt diverses, construeixen amb ells models matemàtics, raonen sobre aquests models i actuen en conseqüència, aprenent de l'experiència.
  • CG2 - Elegir i aplicar els mètodes i tècniques més adequats a un problema definit per dades que representin un repte pel seu volum, velocitat, varietat o heterogeneïtat, inclosos mètodes informàtics, matemàtics, estadístics i de processament del senyal.
  • Objectius

    1. Formular el problema de l'aprenentatge automàtic a partir de dades, i conèixer els tipus de tasques que es poden donar.
      Competències relacionades: CE1, CE9, CG1, CG2,
    2. Organitzar el flux de resolució d'un problema de l'aprenentatge automàtic, analitzant les possibles opcions i elegint les més adequades al problema.
      Competències relacionades: CT4, CT7, CE1, CE9, CG1, CG2,
    3. Decidir, defensar i criticar una solució per a un problema d'aprenentatge automàtic, argumentant els punts forts i febles de l'apropament.
      Competències relacionades: CT3, CT4, CE9, CG2,
    4. Conèixer i saber aplicar tècniques lineals per la resolució de problemes d'aprenentatge supervisat.
      Competències relacionades: CE3, CE8, CG2,
    5. Conèixer i saber aplicar tècniques de xarxes neuronals mono i multicapa per la resolució de problemes d'aprenentatge supervisat.
      Competències relacionades: CE8, CE9, CG2,
    6. Conèixer i saber aplicar tècniques de màquines de vectors suport per la resolució de problemes d'aprenentatge supervisat.
      Competències relacionades: CE8, CE9, CG2,
    7. Conèixer i saber aplicar les tècniques bàsiques per la resolució de problemes d'aprenentatge no supervisat, amb èmfasi en eines d'agrupament de dades.
      Competències relacionades: CE8, CE9, CG2,
    8. Conèixer i saber aplicar les tècniques bàsiques per la resolució de problemes d'aprenentatge per reforç.
      Competències relacionades: CE8, CE9, CG2,
    9. Conèixer i saber aplicar tècniques de conjunt per la resolució de problemes d'aprenentatge supervisat.
      Competències relacionades: CE8, CE9, CG2,

    Continguts

    1. Introducció a l'Aprenentatge Automàtic
      Informació general i conceptes bàsics. Descripció i plantejament dels problemes atacats per l'aprenentatge automàtic. Aprenentatge supervisat (regressió i classificació), no supervisat (clustering) i semi-supervisat (per reforç i transductiu). Exemples moderns d'aplicació.
    2. Aprenentatge automàtic no supervisat: clustering
      Definició i plantejament de l'aprenentatge automàtic no supervisat. Introducció al clustering. Algorismes probabilístics: algorisme k-means i algorisme Expectation-Maximization (E-M).
    3. Aprenentatge automàtic supervisat (I): mètodes lineals per regressió
      Màxima versemblança per regressió. Funcions d'error per regressió. Mínims quadrats: métodes analítics (pseudo-inversa i SVD) i iteratius (gradient descent). Noció de regularització. Regressió regularitzada L1 i L2: algorismes ridge regressión, LASSO i Elastic Net.
    4. Aprenentatge automàtic supervisat (II): mètodes lineals per classificació
      Màxima versemblança per classificació. Funcions d'error per classificació. Classificadors generatius Baiesians: LDA/QDA/RDA, Naïve Bayes i k-nearest neighbours.
    5. Mètodes jeràrquics: arbres de decisió
      Construcció general d'arbres de decisió. Criteris d'split: guany en entropia i criteri de Gini. Regularització en arbres de decisió. Arbres CART per regressió i classificació.
    6. Mètodes de conjunt (ensemble)
      Introducció als mètodes de conjunt (ensemble). Bagging i Random Forests. Boosting. Adaboost i variants.
    7. Mètodes basats en kernels
      Introducció a l'aprenentatge amb funcions de kernel. Regresió lineal regularitzada kernelitzada. Funcions de kernel bàsiques. Complexitat i generalització: dimensió de Vapnik-Chervonenkis. Màquines de Vectors Suport.

    Activitats

    Activitat Acte avaluatiu


    Desenvolupament del tema 1 de l'assignatura


    Objectius: 1
    Continguts:
    Teoria
    2h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    3.3h

    Desenvolupament del tema 2 de l'assignatura


    Objectius: 1 3 7
    Continguts:
    Teoria
    3h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    6.6h

    Desenvolupament del tema 3 de l'assignatura


    Objectius: 1 4
    Continguts:
    Teoria
    8h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    10h

    Desenvolupament del tema 4 de l'assignatura


    Objectius: 1 2 4
    Continguts:
    Teoria
    6h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    8.3h

    Desenvolupament del tema 5 i 6 de l'assignatura


    Objectius: 1 2 5
    Teoria
    5h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    11.6h

    Desenvolupament del tema 7 de l'assignatura


    Objectius: 1 2 5
    Teoria
    6h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    5h

    Control de la pràctica


    Objectius: 1 2 3 4 5 6 7 8 9
    Setmana: 8 (Fora d'horari lectiu)
    Teoria
    0h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    0h

    Lliurament de la pràctica


    Objectius: 1 2 3 4 5 6 7 8 9
    Setmana: 15 (Fora d'horari lectiu)
    Teoria
    0h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    0h


    Metodologia docent

    Les classes de teoria introdueixen tot els coneixements, les tècniques, conceptes i resultats necessaris per assolir un nivell ben fonamentat i entenedor. Aquests conceptes es posen en pràctica en les classes de laboratori. En aquestes es proporciona codi Python que permet resoldre certs aspectes d'un problema d'anàlisi de dades amb les tècniques corresponents al tema en curs. Aquest laboratori també serveix de guia per la part corresponent de la pràctica, que desenvolupen els alumnes al llarg del curs. Algunes de les hores de laboratori es podran usar per resoldre problemes (sense ordinador) a l'aula de teoria.

    Hi ha un treball pràctic avaluable, que treballa un problema real a elegir pel propi estudiant i que recull i integra els coneixements i les competències de tot el curs. També s'avalua mitjançant el treball pràctic la competència genèrica de comunicació eficaç escrita.

    Mètode d'avaluació

    L'assignatura s'avalua mitjançant un examen parcial, un examen final i un treball pràctic en què s'ataca un problema real, redactant el corresponent informe.

    La nota final es calcula com:

    Nota Assignatura = 0,4*Treball + 0,2 * Parcial + 0,4 * Final

    Pel estudiants que puguin i vulguin concórrer a la re-avaluació, la nota de examen de reavaluació substituirà la nota dels parcials i el final.

    Bibliografia

    Bàsic

    Capacitats prèvies

    Nocions mitjanes de probabilitat i estadística.
    Nocions mitjanes d'algebra lineal, càlcul matricial i anàlisi real
    Bon nivell de programació en llenguatges d'alt nivell