Aprenentatge Automàtic

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
ESAII
Aquest curs explora l'aplicació de tècniques d'aprenentatge profund a la bioinformàtica i la bioenginyeria, centrant-se en els reptes i les oportunitats úniques que presenten les dades biològiques i biomèdiques. A partir dels coneixements previs de l'aprenentatge automàtic clàssic, els estudiants aprofundiran en arquitectures de xarxes neuronals avançades, com ara perceptrons multicapa, xarxes neuronals convolucionals (CNN), xarxes neuronals recurrents (RNN) i transformadors. El curs cobreix dominis clau com l'anàlisi d'imatges biomèdiques, la modelització de sèries temporals i seqüències, la modelització generativa amb VAE i GAN, i l'ús de models de llenguatge tant per a textos biomèdics com per a seqüències biològiques.

Professorat

Responsable

  • Alexandre Perera Lluna ( )

Hores setmanals

Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6

Resultats d'aprenentatge

Resultats d'aprenentatge

Coneixements

  • K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
  • K3 - Identificar els fonaments matemàtics, les teories informàtiques, els esquemes algorísmics i els principis d'organització de la informació aplicables al modelat de sistemes biològics i a la resolució eficient de problemes bioinformàtics mitjançant el disseny d'eines computacionals.
  • K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
  • K5 - Identificar la naturalesa de les variables biològiques que cal analitzar, així com els models matemàtics, els algorismes i les proves estadístiques adequades per a desenvolupar i avaluar anàlisis estadístics i eines computacionals.

Habilitats

  • S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
  • S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
  • S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
  • S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.

Competències

  • C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
  • C6 - Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per a ampliar aquest coneixement.

Objectius

  1. Aplicar models d'aprenentatge profund a dades biològiques i biomèdiques, seleccionant i adaptant arquitectures com a xarxes convolucionals, recurrents i transformers per resoldre problemes específics en bioinformàtica i bioenginyeria.
    Competències relacionades: C6, K2, K3, S2, S3, S4,
  2. Preprocessar, representar i analitzar dades biomèdiques heterogènies (imatges mèdiques, seqüències biològiques, senyals fisiològics), emprant eines computacionals modernes i bones pràctiques de programació científica.
    Competències relacionades: C6, K4, K5, S4, S8, C3,
  3. Interpretar i avaluar el rendiment de models de deep learning en contextos biomèdics, utilitzant mètriques adequades i comprenent les limitacions i els riscos ètics de l'ús d'intel·ligència artificial en biomedicina.
    Competències relacionades: C3, K4, K5, S4, S8,

Continguts

  1. Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria
    Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria, tipus de dades biològiques i eines de programari per a fluxos de treball d'aprenentatge eficaços.
  2. Perceptrons multicapa: fonaments de l'aprenentatge profund
    Una introducció als components fonamentals de l'aprenentatge profund mitjançant perceptrons multicapa (MLP), que cobreix l'arquitectura de xarxa, les funcions d'activació, la propagació cap endavant i cap enrere, i el seu paper en la modelització de relacions no lineals complexes en dades biològiques.
  3. Anàlisi d'imatges biomèdiques amb CNN
    Aquest mòdul explora les xarxes neuronals convolucionals (CNN) per a l'anàlisi d'imatges biomèdiques, centrant-se en tasques d'extracció de característiques, classificació i segmentació en aplicacions com la patologia, la radiologia i la microscòpia.
  4. Modelització de sèries temporals i seqüències biològiques amb RNN
    Una anàlisi en profunditat de les xarxes neuronals recurrents (RNN) i les seves variants per modelar dades biològiques seqüencials i temporals, incloent-hi sèries temporals, senyals fisiològics i seqüències de nucleòtids o proteïnes.
  5. Transformadors i mecanismes d'atenció per a seqüències biològiques
    Introducció als mecanismes d'atenció i les arquitectures de transformadors, emfatitzant la seva eficàcia en la captura de dependències a llarg termini en seqüències biològiques per a tasques com la predicció d'estructures i l'anotació funcional.
  6. Arquitectures de codificador-descodificador
    Disseny i aplicació de models de codificador-descodificador per a la transformació, anotar i generar seqüències biològiques i dades biomèdiques, amb èmfasi en RNN i variants de transformador, integració de l'atenció i tasques de modelització de seqüències del món real.
  7. Models de llenguatge i PNL en bioinformàtica i biomedicina
    Aquest mòdul explora com s'apliquen els models de llenguatge a textos biomèdics i seqüències biològiques, permetent tasques com el reconeixement d'entitats amb nom, la classificació de documents i l'anotació funcional mitjançant models preentrenats com BioBERT, DNABERT i transformadors de seqüències de proteïnes.

Activitats

Activitat Acte avaluatiu


Classes de teoria


Objectius: 1 2
Teoria
25h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
45h

Laboratoris


Objectius: 2 3
Teoria
0h
Problemes
30h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
45h

Parcial



Setmana: 8
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Exàmen Final



Setmana: 15 (Fora d'horari lectiu)
Teoria
3h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Metodologia docent

Les classes magistrals seran principalment de tipus expositiu. També hi haurà sessions pràctiques i sessions pràctiques amb Python.

Mètode d'avaluació

L'avaluació del curs és la següent:
- El 30% correspon a treballs pràctics (a fer per parelles),
- El 70% consisteix en 2 exàmens teòrics parcials fets a mig trimestre (35%) i al final del trimestre (35%).

Informació de recuperació
Es pot recuperar.
Només els estudiants que després de l'avaluació tinguin una nota igual o superior a 3 poden fer l'examen de reavaluació. A l'examen de reavaluació (R) només es reavalua la part teòrica i la nota de reavaluació en aquest cas serà 70%R més 30% dels treballs pràctics realitzats durant el curs.

Bibliografia

Bàsica:

  • Deep Learning for the Life Sciences - Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande, O'Reilly Media, Inc., ISBN: 9781492039839
  • Bioinformatics with Python Cookbook - Tiago Antão, ISBN: 978-1789344691

Capacitats prèvies

Python basic