Aquest curs explora l'aplicació de tècniques d'aprenentatge profund a la bioinformàtica i la bioenginyeria, centrant-se en els reptes i les oportunitats úniques que presenten les dades biològiques i biomèdiques. A partir dels coneixements previs de l'aprenentatge automàtic clàssic, els estudiants aprofundiran en arquitectures de xarxes neuronals avançades, com ara perceptrons multicapa, xarxes neuronals convolucionals (CNN), xarxes neuronals recurrents (RNN) i transformadors. El curs cobreix dominis clau com l'anàlisi d'imatges biomèdiques, la modelització de sèries temporals i seqüències, la modelització generativa amb VAE i GAN, i l'ús de models de llenguatge tant per a textos biomèdics com per a seqüències biològiques.
Professorat
Responsable
Alexandre Perera Lluna (
)
Hores setmanals
Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6
Objectius
Aplicar models d'aprenentatge profund a dades biològiques i biomèdiques, seleccionant i adaptant arquitectures com a xarxes convolucionals, recurrents i transformers per resoldre problemes específics en bioinformàtica i bioenginyeria.
Competències relacionades:
K2,
K3,
S2,
S3,
S4,
C6,
Preprocessar, representar i analitzar dades biomèdiques heterogènies (imatges mèdiques, seqüències biològiques, senyals fisiològics), emprant eines computacionals modernes i bones pràctiques de programació científica.
Competències relacionades:
K4,
K5,
S4,
S8,
C3,
C6,
Interpretar i avaluar el rendiment de models de deep learning en contextos biomèdics, utilitzant mètriques adequades i comprenent les limitacions i els riscos ètics de l'ús d'intel·ligència artificial en biomedicina.
Competències relacionades:
K4,
K5,
S4,
S8,
C3,
Continguts
Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria
Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria, tipus de dades biològiques i eines de programari per a fluxos de treball d'aprenentatge eficaços.
Perceptrons multicapa: fonaments de l'aprenentatge profund
Una introducció als components fonamentals de l'aprenentatge profund mitjançant perceptrons multicapa (MLP), que cobreix l'arquitectura de xarxa, les funcions d'activació, la propagació cap endavant i cap enrere, i el seu paper en la modelització de relacions no lineals complexes en dades biològiques.
Anàlisi d'imatges biomèdiques amb CNN
Aquest mòdul explora les xarxes neuronals convolucionals (CNN) per a l'anàlisi d'imatges biomèdiques, centrant-se en tasques d'extracció de característiques, classificació i segmentació en aplicacions com la patologia, la radiologia i la microscòpia.
Modelització de sèries temporals i seqüències biològiques amb RNN
Una anàlisi en profunditat de les xarxes neuronals recurrents (RNN) i les seves variants per modelar dades biològiques seqüencials i temporals, incloent-hi sèries temporals, senyals fisiològics i seqüències de nucleòtids o proteïnes.
Transformadors i mecanismes d'atenció per a seqüències biològiques
Introducció als mecanismes d'atenció i les arquitectures de transformadors, emfatitzant la seva eficàcia en la captura de dependències a llarg termini en seqüències biològiques per a tasques com la predicció d'estructures i l'anotació funcional.
Arquitectures de codificador-descodificador
Disseny i aplicació de models de codificador-descodificador per a la transformació, anotar i generar seqüències biològiques i dades biomèdiques, amb èmfasi en RNN i variants de transformador, integració de l'atenció i tasques de modelització de seqüències del món real.
Models de llenguatge i PNL en bioinformàtica i biomedicina
Aquest mòdul explora com s'apliquen els models de llenguatge a textos biomèdics i seqüències biològiques, permetent tasques com el reconeixement d'entitats amb nom, la classificació de documents i l'anotació funcional mitjançant models preentrenats com BioBERT, DNABERT i transformadors de seqüències de proteïnes.
Les classes magistrals seran principalment de tipus expositiu. També hi haurà sessions pràctiques i sessions pràctiques amb Python.
Mètode d'avaluació
L'avaluació del curs és la següent:
- El 30% correspon a treballs pràctics (a fer per parelles),
- El 70% consisteix en 2 exàmens teòrics parcials fets a mig trimestre (35%) i al final del trimestre (35%).
Informació de recuperació
Es pot recuperar.
Només els estudiants que després de l'avaluació tinguin una nota igual o superior a 3 poden fer l'examen de reavaluació. A l'examen de reavaluació (R) només es reavalua la part teòrica i la nota de reavaluació en aquest cas serà 70%R més 30% dels treballs pràctics realitzats durant el curs.
Bibliografia
Bàsica:
Deep Learning for the Life Sciences -
Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande,
O'Reilly Media, Inc., ISBN: 9781492039839
Bioinformatics with Python Cookbook -
Tiago Antão,
ISBN: 978-1789344691