Crèdits
6
Tipus
Optativa
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
CS
Més enllà de les capacitats, el curs aborda les limitacions i els riscos dels LLMs, incloent-hi les al·lucinacions, els biaixos, la manca de robustesa, la privacitat i les qüestions de seguretat. També introdueix breument línies de recerca actuals com l'eficiència, el raonament, l'ús d'eines, els sistemes agèntics i les extensions multimodals. Mitjançant una combinació de teoria, estudis de cas, lectures i treball pràctic al laboratori, l'estudiantat desenvolupa la capacitat de raonar sobre quan i com desplegar els LLM de manera efectiva i responsable, així com una comprensió dels reptes oberts i de la recerca en curs en aquest àmbit.
Professorat
Responsable
- Lluís Màrquez Villodre (lluism@cs.upc.edu)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Transversals
Específiques
Genèriques
Objectius
-
Comprensió dels components bàsics dels models massius de llenguatge moderns (LLM), incloent-hi: models i algoritmes d'aprenentatge, processament de dades, i avaluació.
Competències relacionades: CG3, CT4, CE14, CE18, CE20, -
Ser conscient dels principals punts forts i febles dels LLM, sent crític sobre el que es pot esperar d'ells i com treure'n el màxim profit en qualsevol situació.
Competències relacionades: CG2, CG3, CT4, CT5, CE18, -
Conèixer els principals reptes actuals, problemes oberts i direccions de recerca al voltant dels LLM
Competències relacionades: CG2, CG8, CG9, -
Adquirir criteris per saber quin tipus de models/estratègies es poden utilitzar per abordar problemes de processament del llenguatge natural, i ser capaç d'adaptar i utilitzar un LLM per resoldre'ls.
Competències relacionades: CE27, CT4, CE15, CE16, -
Desenvolupar un pensament crític sobre els LLM, coneixent els riscos que hi estan associats i prenent consciència de la necessitat d'utilitzar-los de manera justa i segura.
Competències relacionades: CG8, CE16, CE20,
Continguts
-
Introducció
A la introducció cobrirem els punts següents:
1/ Per què és important i necessari aquest curs?
2/ Molt breu història del Processament del Llenguatge Natural.
3/ Breu història dels models massius de llenguatge.
4/ On som i cap a on anem? -
Transformers dins el Processament del Llenguage Natural
En aquesta part, presentarem el model Transformers (self-attention) en el context del Processament del Llenguatge Natural i com aquest va transformar les aplicacions de seqüència a seqüència (seq-to-seq):
1/ Representació de paraules: semàntica distribucional i word embeddings; 2/ L'arquitectura Transformers (self-attention); 3/ Cas d'ús: enfocament seq-to-seq amb Transformers aplicat a la Traducció Automàtica. -
Models Massius de Llenguatge autoregressius
Aquesta és la part central del curs i cobreix les etapes principals de l'aprenentatge dels LLM. Més concretament, abordarem:
1/ Tokenització; 2/ Preentrenament; 3/ Habilitats emergents dels LLM: aprenentatge zero-shot i few-shot; 4/ Postentrenament per a la creació d'agents conversacionals (aprenentatge supervisat --supervised fine tuning-- i aprenentatge per reforç); 5/ Enginyeria de prompts. -
Limitacions i riscs dels LLM
Discutirem breument els següents temes relacionats amb els riscs associats als LLM: 1/ Al·lucinacions; 2/ Biaix i justícia (fairness); 3/ Seguretat dels LLM; 4/ Petjada dels LLM (footprint); 5/ Col·lapse del model; 6/ Els LLM i la Intel·ligència Artificial General (AGI) -
Temes avançats de LLM
En aquesta última part del curs, discutirem alguns temes avançats sobre els LLM, incloent-hi la Generació Augmentada per Recuperació (RAG) i l'entrenament de LLM per al raonament. Si el temps ho permet, dedicarem l'última sessió a tractar també altres temes d'actualitat basats en les preferències de l'estudiantat.
Activitats
Activitat Acte avaluatiu
Metodologia docent
El curs presenta i aprofundeix en un dels models d'aprenentatge automàtic més importants avui dia per crear aplicacions d'intel·ligència artificial: els models massius de llenguatge (o Large Language Models, LLM de l'anglès). La teoria s'introdueix a classes magistrals on el professor exposa els conceptes. Les classes magistrals també tindran un temps de discussió amb els alumnes sobre lectures prèviament assignades. Aquests conceptes es posen en pràctica a les classes de laboratori, on l'alumne aprèn a aplicar LLMs i desenvolupar solucions per a problemes concrets. Els estudiants han de treballar i lliurar un projecte al final del curs que es desenvoluparà en grup (2-3 persones) i també un treball individual menor de tipus més qualitatiu sobre el comportament dels LLM.Mètode d'avaluació
El curs es qualifica de la següent manera:F = Nota de l'examen final
PG = Nota del projecte en grup
TI = Nota del treball individual
Nota final = 40% F + 40% PG + 20% TI
Evaluació de les competències:
L'avaluació de la competència de treball en equip es basa en el treball realitzat durant els projecte en grup.
L'avaluació de la competència: "ús solvent dels recursos d'informació" es basa en el treball pràctic (tant el projecte en grup com el treball individual)
Bibliografia
Bàsic
-
Large Language Models: A Deep Dive: bridging theory and practice
- Kamath, Uday; Keenan, Kevin; Somers, Garrett; Sorenson, Sarah,
Springer,
2024.
ISBN: 9783031656477
https://research-ebsco-com.recursos.biblioteca.upc.edu/c/ik5pvi/search/details/4khglqojmb?db=nlebk -
Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
- Jurafsky, Daniel; Martin, James H.,
Online manuscript released January 6, 2026,
2026.
https://web.stanford.edu/~jurafsky/slp3/