Aquest curs ofereix una introducció tècnica als Models Massius de Llenguatge (LLM de l'anglès "Large Language Models") com a component central dels sistemes conversacionals basats en intel·ligència artificial. S'hi tracten els fonaments de les arquitectures basades en Transformers, el preentrenament, el post-entrenament supervisat i basat en reforç, i la inferència, amb un èmfasi especial en com les lleis d'escalat i les dades influeixen en el comportament dels models. L'estudiantat aprèn com s'apliquen els LLM a tasques de comprensió i generació del llenguatge natural, i com avaluar-ne el rendiment.
Més enllà de les capacitats, el curs aborda les limitacions i els riscos dels LLMs, incloent-hi les al·lucinacions, els biaixos, la manca de robustesa, la privacitat i les qüestions de seguretat. També introdueix breument línies de recerca actuals com l'eficiència, el raonament, l'ús d'eines, els sistemes agèntics i les extensions multimodals. Mitjançant una combinació de teoria, estudis de cas, lectures i treball pràctic al laboratori, l'estudiantat desenvolupa la capacitat de raonar sobre quan i com desplegar els LLM de manera efectiva i responsable, així com una comprensió dels reptes oberts i de la recerca en curs en aquest àmbit.
Professorat
Responsable
Lluís Màrquez Villodre (
)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències Transversals
Transversals
CT4 - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
CT5 - Ús solvent dels recursos d'informació. Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i informació en l'àmbit de l'especialitat i valorar de forma crítica els resultats d'aquesta gestió.
Competències Tècniques
Específiques
CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
CE16 - Dissenyar i avaluar interfícies persona-màquina que garanteixin l'accessibilitat i usabilitat dels sistemes, serveis i aplicacions informàtiques.
CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.
CE27 - Dissenyar i aplicar tècniques de processament de la veu, de reconeixement del llenguatge parlat i comprensió del llenguatge humà, amb aplicació en la intel·ligència artificial social.
Competències Tècniques Generals
Genèriques
CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
Objectius
Comprensió dels components bàsics dels models massius de llenguatge moderns (LLM), incloent-hi: models i algoritmes d'aprenentatge, processament de dades, i avaluació.
Competències relacionades:
CT4,
CE14,
CE18,
CE20,
CG3,
Ser conscient dels principals punts forts i febles dels LLM, sent crític sobre el que es pot esperar d'ells i com treure'n el màxim profit en qualsevol situació.
Competències relacionades:
CT5,
CE18,
CG2,
CG3,
CT4,
Conèixer els principals reptes actuals, problemes oberts i direccions de recerca al voltant dels LLM
Competències relacionades:
CG2,
CG8,
CG9,
Adquirir criteris per saber quin tipus de models/estratègies es poden utilitzar per abordar problemes de processament del llenguatge natural, i ser capaç d'adaptar i utilitzar un LLM per resoldre'ls.
Competències relacionades:
CT4,
CE15,
CE16,
CE27,
Desenvolupar un pensament crític sobre els LLM, coneixent els riscos que hi estan associats i prenent consciència de la necessitat d'utilitzar-los de manera justa i segura.
Competències relacionades:
CE20,
CG8,
CE16,
Continguts
Introducció
A la introducció cobrirem els punts següents:
1/ Per què és important i necessari aquest curs?
2/ Molt breu història del Processament del Llenguatge Natural.
3/ Breu història dels models massius de llenguatge.
4/ On som i cap a on anem?
Transformers dins el Processament del Llenguage Natural
En aquesta part, presentarem el model Transformers (self-attention) en el context del Processament del Llenguatge Natural i com aquest va transformar les aplicacions de seqüència a seqüència (seq-to-seq):
1/ Representació de paraules: semàntica distribucional i word embeddings; 2/ L'arquitectura Transformers (self-attention); 3/ Cas d'ús: enfocament seq-to-seq amb Transformers aplicat a la Traducció Automàtica.
Models Massius de Llenguatge autoregressius
Aquesta és la part central del curs i cobreix les etapes principals de l'aprenentatge dels LLM. Més concretament, abordarem:
1/ Tokenització; 2/ Preentrenament; 3/ Habilitats emergents dels LLM: aprenentatge zero-shot i few-shot; 4/ Postentrenament per a la creació d'agents conversacionals (aprenentatge supervisat --supervised fine tuning-- i aprenentatge per reforç); 5/ Enginyeria de prompts.
Limitacions i riscs dels LLM
Discutirem breument els següents temes relacionats amb els riscs associats als LLM: 1/ Al·lucinacions; 2/ Biaix i justícia (fairness); 3/ Seguretat dels LLM; 4/ Petjada dels LLM (footprint); 5/ Col·lapse del model; 6/ Els LLM i la Intel·ligència Artificial General (AGI)
Temes avançats de LLM
En aquesta última part del curs, discutirem alguns temes avançats sobre els LLM, incloent-hi la Generació Augmentada per Recuperació (RAG) i l'entrenament de LLM per al raonament. Si el temps ho permet, dedicarem l'última sessió a tractar també altres temes d'actualitat basats en les preferències de l'estudiantat.
Activitats
ActivitatActe avaluatiu
Classes Teòriques
Hores dedicades a estudiar la materia explicada a classe de teoria i a fer les lectures recomanades. Objectius:12345 Continguts:
Hores estimades dedicades a realitzar la pràctica en grup de l'assignatura (incloent planificació, implementació i documentació). Objectius:124 Continguts:
El curs presenta i aprofundeix en un dels models d'aprenentatge automàtic més importants avui dia per crear aplicacions d'intel·ligència artificial: els models massius de llenguatge (o Large Language Models, LLM de l'anglès). La teoria s'introdueix a classes magistrals on el professor exposa els conceptes. Les classes magistrals també tindran un temps de discussió amb els alumnes sobre lectures prèviament assignades. Aquests conceptes es posen en pràctica a les classes de laboratori, on l'alumne aprèn a aplicar LLMs i desenvolupar solucions per a problemes concrets. Els estudiants han de treballar i lliurar un projecte al final del curs que es desenvoluparà en grup (2-3 persones) i també un treball individual menor de tipus més qualitatiu sobre el comportament dels LLM.
Mètode d'avaluació
El curs es qualifica de la següent manera:
F = Nota de l'examen final
PG = Nota del projecte en grup
TI = Nota del treball individual
Nota final = 40% F + 40% PG + 20% TI
Reavaluació: només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final, l'hagin suspès (no val un NP). La nota màxima que es pot obtenir a la reavaluació és un 7.
Evaluació de les competències
L'avaluació de la competència de treball en equip es basa en el treball realitzat durant els projecte en grup.
L'avaluació de la competència: "ús solvent dels recursos d'informació" es basa en el treball pràctic (tant el projecte en grup com el treball individual)