Models Grans de Llenguatge

Esteu aquí

Crèdits
6
Tipus
Optativa
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
FIB
Aquest curs ofereix una introducció tècnica als Models Massius de Llenguatge (LLM de l'anglès "Large Language Models") com a component central dels sistemes conversacionals basats en intel·ligència artificial. S'hi tracten els fonaments de les arquitectures basades en Transformers, el preentrenament, el post-entrenament supervisat i basat en reforç, i la inferència, amb un èmfasi especial en com les lleis d'escalat i les dades influeixen en el comportament dels models. L'estudiantat aprèn com s'apliquen els LLM a tasques de comprensió i generació del llenguatge natural, i com avaluar-ne el rendiment.

Més enllà de les capacitats, el curs aborda les limitacions i els riscos dels LLMs, incloent-hi les al·lucinacions, els biaixos, la manca de robustesa, la privacitat i les qüestions de seguretat. També introdueix breument línies de recerca actuals com l'eficiència, el raonament, l'ús d'eines, els sistemes agèntics i les extensions multimodals. Mitjançant una combinació de teoria, estudis de cas, lectures i treball pràctic al laboratori, l'estudiantat desenvolupa la capacitat de raonar sobre quan i com desplegar els LLM de manera efectiva i responsable, així com una comprensió dels reptes oberts i de la recerca en curs en aquest àmbit.

Professorat

Responsable

  • Lluís Màrquez Villodre ( )

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Objectius

  1. Comprensió dels components bàsics dels models massius de llenguatge moderns (LLM), incloent-hi: models i algoritmes d'aprenentatge, processament de dades, i avaluació.
    Competències relacionades: CG3, CT4, CE14, CE18, CE20,
  2. Ser conscient dels principals punts forts i febles dels LLM, sent crític sobre el que es pot esperar d'ells i com treure'n el màxim profit en qualsevol situació.
    Competències relacionades: CG2, CG3, CT4, CT5, CE18,
  3. Conèixer els principals reptes actuals, problemes oberts i direccions de recerca al voltant dels LLM
    Competències relacionades: CG2, CG8, CG9,
  4. Adquirir criteris per saber quin tipus de models/estratègies es poden utilitzar per abordar problemes de processament del llenguatge natural, i ser capaç d'adaptar i utilitzar un LLM per resoldre'ls.
    Competències relacionades: CE27, CT4, CE15, CE16,
  5. Desenvolupar un pensament crític sobre els LLM, coneixent els riscos que hi estan associats i prenent consciència de la necessitat d'utilitzar-los de manera justa i segura.
    Competències relacionades: CG8, CE16, CE20,

Continguts

  1. Introducció
    A la introducció cobrirem els punts següents:
    1/ Per què és important i necessari aquest curs?
    2/ Molt breu història del Processament del Llenguatge Natural.
    3/ Breu història dels models massius de llenguatge.
    4/ On som i cap a on anem?
  2. Transformers dins el Processament del Llenguage Natural
    En aquesta part, presentarem el model Transformers (self-attention) en el context del Processament del Llenguatge Natural i com aquest va transformar les aplicacions de seqüència a seqüència (seq-to-seq):

    1/ Representació de paraules: semàntica distribucional i word embeddings; 2/ L'arquitectura Transformers (self-attention); 3/ Cas d'ús: enfocament seq-to-seq amb Transformers aplicat a la Traducció Automàtica.
  3. Models Massius de Llenguatge autoregressius
    Aquesta és la part central del curs i cobreix les etapes principals de l'aprenentatge dels LLM. Més concretament, abordarem:
    1/ Tokenització; 2/ Preentrenament; 3/ Habilitats emergents dels LLM: aprenentatge zero-shot i few-shot; 4/ Postentrenament per a la creació d'agents conversacionals (aprenentatge supervisat --supervised fine tuning-- i aprenentatge per reforç); 5/ Enginyeria de prompts.
  4. Limitacions i riscs dels LLM
    Discutirem breument els següents temes relacionats amb els riscs associats als LLM: 1/ Al·lucinacions; 2/ Biaix i justícia (fairness); 3/ Seguretat dels LLM; 4/ Petjada dels LLM (footprint); 5/ Col·lapse del model; 6/ Els LLM i la Intel·ligència Artificial General (AGI)
  5. Temes avançats de LLM
    En aquesta última part del curs, discutirem alguns temes avançats sobre els LLM, incloent-hi la Generació Augmentada per Recuperació (RAG) i l'entrenament de LLM per al raonament. Si el temps ho permet, dedicarem l'última sessió a tractar també altres temes d'actualitat basats en les preferències de l'estudiantat.

Activitats

Activitat Acte avaluatiu


Classes Teòriques

Hores dedicades a estudiar la materia explicada a classe de teoria i a fer les lectures recomanades.
Objectius: 1 2 3 4 5
Continguts:
Teoria
28h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
30h

Classes de Laboratori

Hores estimades dedicades a practicar el material de les classes de laboratori
Objectius: 1 2 4
Continguts:
Teoria
0h
Problemes
0h
Laboratori
30h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h

Pràctica en grup de l'assignatura

Hores estimades dedicades a realitzar la pràctica en grup de l'assignatura (incloent planificació, implementació i documentació).
Objectius: 1 2 4
Continguts:
Teoria
1h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
25h

Pràctica individual de l'assignatura

Hores estimades dedicades a realitzar la pràctica individual de l'assignatura.
Objectius: 2 5
Continguts:
Teoria
1h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h

Metodologia docent

El curs presenta i aprofundeix en un dels models d'aprenentatge automàtic més importants avui dia per crear aplicacions d'intel·ligència artificial: els models massius de llenguatge (o Large Language Models, LLM de l'anglès). La teoria s'introdueix a classes magistrals on el professor exposa els conceptes. Les classes magistrals també tindran un temps de discussió amb els alumnes sobre lectures prèviament assignades. Aquests conceptes es posen en pràctica a les classes de laboratori, on l'alumne aprèn a aplicar LLMs i desenvolupar solucions per a problemes concrets. Els estudiants han de treballar i lliurar un projecte al final del curs que es desenvoluparà en grup (2-3 persones) i també un treball individual menor de tipus més qualitatiu sobre el comportament dels LLM.

Mètode d'avaluació

El curs es qualifica de la següent manera:

F = Nota de l'examen final
PG = Nota del projecte en grup
TI = Nota del treball individual

Nota final = 40% F + 40% PG + 20% TI

Reavaluació: només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final, l'hagin suspès (no val un NP). La nota màxima que es pot obtenir a la reavaluació és un 7.

Evaluació de les competències

L'avaluació de la competència de treball en equip es basa en el treball realitzat durant els projecte en grup.

L'avaluació de la competència: "ús solvent dels recursos d'informació" es basa en el treball pràctic (tant el projecte en grup com el treball individual)

Bibliografia

Bàsica:

Capacitats prèvies

Coneixements generals d'aprenentatge automàtic i de xarxes neuronals, així com de processament del llenguatge natural.