Aquest curs explora l'aplicació de tècniques d'aprenentatge profund a la bioinformàtica i la bioenginyeria, centrant-se en els reptes i les oportunitats úniques que presenten les dades biològiques i biomèdiques. A partir dels coneixements previs de l'aprenentatge automàtic clàssic, els estudiants aprofundiran en arquitectures de xarxes neuronals avançades, com ara perceptrons multicapa, xarxes neuronals convolucionals (CNN), xarxes neuronals recurrents (RNN) i transformadors. El curs cobreix dominis clau com l'anàlisi d'imatges biomèdiques, la modelització de sèries temporals i seqüències, la modelització generativa amb VAE i GAN, i l'ús de models de llenguatge tant per a textos biomèdics com per a seqüències biològiques.
Professorat
Responsable
Alexandre Perera Lluna (
)
Hores setmanals
Teoria
2
Problemes
2
Laboratori
0
Aprenentatge dirigit
0
Aprenentatge autònom
6
Resultats d'aprenentatge
Resultats d'aprenentatge
Coneixements
K2 - Identificar els mètodes estadístics i computacionals i els models matemàtics que permeten resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions.
K3 - Identificar els fonaments matemàtics, les teories informàtiques, els esquemes algorísmics i els principis d'organització de la informació aplicables al modelat de sistemes biològics i a la resolució eficient de problemes bioinformàtics mitjançant el disseny d'eines computacionals.
K4 - Integrar els conceptes oferts pels llenguatges de programació de major ús en l'àmbit de les Ciències de la Vida per a modelar i optimitzar estructures de dades i construir algorismes eficients, relacionant-los entre sí i amb els seus casos d'aplicació.
K5 - Identificar la naturalesa de les variables biològiques que cal analitzar, així com els models matemàtics, els algorismes i les proves estadístiques adequades per a desenvolupar i avaluar anàlisis estadístics i eines computacionals.
Habilitats
S2 - Analitzar computacionalment seqüències d'ADN, ARN i proteïnes, incloent anàlisis comparatives de genomes, usant la computació, les matemàtiques i l'estadística com a eines bàsiques de la bioinformàtica.
S3 - Resoldre problemes en els camps de la biologia molecular, la genòmica, la investigació mèdica i la genètica de poblacions mitjançant l'aplicació de mètodes estadístics i computacionals i models matemàtics.
S4 - Elaborar eines específiques que permetin la resolució de problemes sobre la interpretació de dades biològiques i biomèdiques, incloent visualitzacions complexes.
S8 - Enfrontar-se a la presa de decisions, i defensar-les amb arguments, en la resolució de problemes de les àrees de biologia, així com, dins dels àmbits adequats, les ciències de la salut, les ciències de la computació i les ciències experimentals.
Competències
C3 - Comunicar-se de forma oral i escrita amb altres persones, en llengua anglesa, sobre els resultats de l'aprenentatge, de l'elaboració del pensament i de la presa de decisions.
C6 - Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per a ampliar aquest coneixement.
Objectius
Aplicar models d'aprenentatge profund a dades biològiques i biomèdiques, seleccionant i adaptant arquitectures com a xarxes convolucionals, recurrents i transformers per resoldre problemes específics en bioinformàtica i bioenginyeria.
Competències relacionades:
C6,
K2,
K3,
S2,
S3,
S4,
Preprocessar, representar i analitzar dades biomèdiques heterogènies (imatges mèdiques, seqüències biològiques, senyals fisiològics), emprant eines computacionals modernes i bones pràctiques de programació científica.
Competències relacionades:
C6,
K4,
K5,
S4,
S8,
C3,
Interpretar i avaluar el rendiment de models de deep learning en contextos biomèdics, utilitzant mètriques adequades i comprenent les limitacions i els riscos ètics de l'ús d'intel·ligència artificial en biomedicina.
Competències relacionades:
C3,
K4,
K5,
S4,
S8,
Continguts
Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria
Introducció a l'aprenentatge profund en bioinformàtica i bioenginyeria, tipus de dades biològiques i eines de programari per a fluxos de treball d'aprenentatge eficaços.
Perceptrons multicapa: fonaments de l'aprenentatge profund
Una introducció als components fonamentals de l'aprenentatge profund mitjançant perceptrons multicapa (MLP), que cobreix l'arquitectura de xarxa, les funcions d'activació, la propagació cap endavant i cap enrere, i el seu paper en la modelització de relacions no lineals complexes en dades biològiques.
Anàlisi d'imatges biomèdiques amb CNN
Aquest mòdul explora les xarxes neuronals convolucionals (CNN) per a l'anàlisi d'imatges biomèdiques, centrant-se en tasques d'extracció de característiques, classificació i segmentació en aplicacions com la patologia, la radiologia i la microscòpia.
Modelització de sèries temporals i seqüències biològiques amb RNN
Una anàlisi en profunditat de les xarxes neuronals recurrents (RNN) i les seves variants per modelar dades biològiques seqüencials i temporals, incloent-hi sèries temporals, senyals fisiològics i seqüències de nucleòtids o proteïnes.
Transformadors i mecanismes d'atenció per a seqüències biològiques
Introducció als mecanismes d'atenció i les arquitectures de transformadors, emfatitzant la seva eficàcia en la captura de dependències a llarg termini en seqüències biològiques per a tasques com la predicció d'estructures i l'anotació funcional.
Arquitectures de codificador-descodificador
Disseny i aplicació de models de codificador-descodificador per a la transformació, anotar i generar seqüències biològiques i dades biomèdiques, amb èmfasi en RNN i variants de transformador, integració de l'atenció i tasques de modelització de seqüències del món real.
Models de llenguatge i PNL en bioinformàtica i biomedicina
Aquest mòdul explora com s'apliquen els models de llenguatge a textos biomèdics i seqüències biològiques, permetent tasques com el reconeixement d'entitats amb nom, la classificació de documents i l'anotació funcional mitjançant models preentrenats com BioBERT, DNABERT i transformadors de seqüències de proteïnes.
Les classes magistrals seran principalment de tipus expositiu. També hi haurà sessions pràctiques i sessions pràctiques amb Python.
Mètode d'avaluació
L'avaluació del curs és la següent:
- El 30% correspon a treballs pràctics (a fer per parelles),
- El 70% consisteix en 2 exàmens teòrics parcials fets a mig trimestre (35%) i al final del trimestre (35%).
Informació de recuperació
Es pot recuperar.
Només els estudiants que després de l'avaluació tinguin una nota igual o superior a 3 poden fer l'examen de reavaluació. A l'examen de reavaluació (R) només es reavalua la part teòrica i la nota de reavaluació en aquest cas serà 70%R més 30% dels treballs pràctics realitzats durant el curs.
Bibliografia
Bàsica:
Deep Learning for the Life Sciences -
Bharath Ramsundar, Peter Eastman, Pat Walters, Vijay Pande,
O'Reilly Media, Inc., ISBN: 9781492039839
Bioinformatics with Python Cookbook -
Tiago Antão,
ISBN: 978-1789344691