Vés al contingut

Models Grans de Llenguatge

Crèdits
6
Tipus
Optativa
Requisits
Aquesta assignatura no té requisits , però té capacitats prèvies
Departament
CS
Aquest curs ofereix una introducció tècnica als Models Massius de Llenguatge (LLM de l'anglès "Large Language Models") com a component central dels sistemes conversacionals basats en intel·ligència artificial. S'hi tracten els fonaments de les arquitectures basades en Transformers, el preentrenament, el post-entrenament supervisat i basat en reforç, i la inferència, amb un èmfasi especial en com les lleis d'escalat i les dades influeixen en el comportament dels models. L'estudiantat aprèn com s'apliquen els LLM a tasques de comprensió i generació del llenguatge natural, i com avaluar-ne el rendiment.

Més enllà de les capacitats, el curs aborda les limitacions i els riscos dels LLMs, incloent-hi les al·lucinacions, els biaixos, la manca de robustesa, la privacitat i les qüestions de seguretat. També introdueix breument línies de recerca actuals com l'eficiència, el raonament, l'ús d'eines, els sistemes agèntics i les extensions multimodals. Mitjançant una combinació de teoria, estudis de cas, lectures i treball pràctic al laboratori, l'estudiantat desenvolupa la capacitat de raonar sobre quan i com desplegar els LLM de manera efectiva i responsable, així com una comprensió dels reptes oberts i de la recerca en curs en aquest àmbit.

Professorat

Responsable

  • Lluís Màrquez Villodre (lluism@cs.upc.edu)

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Transversals

  • CT4 - Treball en equip. Ser capaç de treballar com a membre d'un equip interdisciplinari, ja sigui com un membre més o realitzant tasques de direcció, amb la finalitat de contribuir a desenvolupar projectes amb pragmatisme i sentit de la responsabilitat, assumint compromisos tenint en compte els recursos disponibles.
  • CT5 - Ús solvent dels recursos d'informació. Gestionar l'adquisició, l'estructuració, l'anàlisi i la visualització de dades i informació en l'àmbit de l'especialitat i valorar de forma crítica els resultats d'aquesta gestió.
  • Específiques

  • CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
  • CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
  • CE16 - Dissenyar i avaluar interfícies persona-màquina que garanteixin l'accessibilitat i usabilitat dels sistemes, serveis i aplicacions informàtiques.
  • CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
  • CE20 - Triar i emprar Tècniques de Modelització estadística i anàlisi de dades, avaluant la calidad dels models, validant-i interpretant.
  • CE27 - Dissenyar i aplicar tècniques de processament de la veu, de reconeixement del llenguatge parlat i comprensió del llenguatge humà, amb aplicació en la intel·ligència artificial social.
  • Genèriques

  • CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
  • CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
  • CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
  • Objectius

    1. Comprensió dels components bàsics dels models massius de llenguatge moderns (LLM), incloent-hi: models i algoritmes d'aprenentatge, processament de dades, i avaluació.
      Competències relacionades: CG3, CT4, CE14, CE18, CE20,
    2. Ser conscient dels principals punts forts i febles dels LLM, sent crític sobre el que es pot esperar d'ells i com treure'n el màxim profit en qualsevol situació.
      Competències relacionades: CG2, CG3, CT4, CT5, CE18,
    3. Conèixer els principals reptes actuals, problemes oberts i direccions de recerca al voltant dels LLM
      Competències relacionades: CG2, CG8, CG9,
    4. Adquirir criteris per saber quin tipus de models/estratègies es poden utilitzar per abordar problemes de processament del llenguatge natural, i ser capaç d'adaptar i utilitzar un LLM per resoldre'ls.
      Competències relacionades: CE27, CT4, CE15, CE16,
    5. Desenvolupar un pensament crític sobre els LLM, coneixent els riscos que hi estan associats i prenent consciència de la necessitat d'utilitzar-los de manera justa i segura.
      Competències relacionades: CG8, CE16, CE20,

    Continguts

    1. Introducció
      A la introducció cobrirem els punts següents:
      1/ Per què és important i necessari aquest curs?
      2/ Molt breu història del Processament del Llenguatge Natural.
      3/ Breu història dels models massius de llenguatge.
      4/ On som i cap a on anem?
    2. Transformers dins el Processament del Llenguage Natural
      En aquesta part, presentarem el model Transformers (self-attention) en el context del Processament del Llenguatge Natural i com aquest va transformar les aplicacions de seqüència a seqüència (seq-to-seq):

      1/ Representació de paraules: semàntica distribucional i word embeddings; 2/ L'arquitectura Transformers (self-attention); 3/ Cas d'ús: enfocament seq-to-seq amb Transformers aplicat a la Traducció Automàtica.
    3. Models Massius de Llenguatge autoregressius
      Aquesta és la part central del curs i cobreix les etapes principals de l'aprenentatge dels LLM. Més concretament, abordarem:
      1/ Tokenització; 2/ Preentrenament; 3/ Habilitats emergents dels LLM: aprenentatge zero-shot i few-shot; 4/ Postentrenament per a la creació d'agents conversacionals (aprenentatge supervisat --supervised fine tuning-- i aprenentatge per reforç); 5/ Enginyeria de prompts.
    4. Limitacions i riscs dels LLM
      Discutirem breument els següents temes relacionats amb els riscs associats als LLM: 1/ Al·lucinacions; 2/ Biaix i justícia (fairness); 3/ Seguretat dels LLM; 4/ Petjada dels LLM (footprint); 5/ Col·lapse del model; 6/ Els LLM i la Intel·ligència Artificial General (AGI)
    5. Temes avançats de LLM
      En aquesta última part del curs, discutirem alguns temes avançats sobre els LLM, incloent-hi la Generació Augmentada per Recuperació (RAG) i l'entrenament de LLM per al raonament. Si el temps ho permet, dedicarem l'última sessió a tractar també altres temes d'actualitat basats en les preferències de l'estudiantat.

    Activitats

    Activitat Acte avaluatiu


    Classes Teòriques

    Hores dedicades a estudiar la materia explicada a classe de teoria i a fer les lectures recomanades.
    Objectius: 1 2 3 4 5
    Continguts:
    Teoria
    28h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    30h

    Classes de Laboratori

    Hores estimades dedicades a practicar el material de les classes de laboratori
    Objectius: 1 2 4
    Continguts:
    Teoria
    0h
    Problemes
    0h
    Laboratori
    30h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    25h

    Pràctica en grup de l'assignatura

    Hores estimades dedicades a realitzar la pràctica en grup de l'assignatura (incloent planificació, implementació i documentació).
    Objectius: 1 2 4
    Continguts:
    Teoria
    1h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    25h

    Pràctica individual de l'assignatura

    Hores estimades dedicades a realitzar la pràctica individual de l'assignatura.
    Objectius: 2 5
    Continguts:
    Teoria
    1h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    10h

    Metodologia docent

    El curs presenta i aprofundeix en un dels models d'aprenentatge automàtic més importants avui dia per crear aplicacions d'intel·ligència artificial: els models massius de llenguatge (o Large Language Models, LLM de l'anglès). La teoria s'introdueix a classes magistrals on el professor exposa els conceptes. Les classes magistrals també tindran un temps de discussió amb els alumnes sobre lectures prèviament assignades. Aquests conceptes es posen en pràctica a les classes de laboratori, on l'alumne aprèn a aplicar LLMs i desenvolupar solucions per a problemes concrets. Els estudiants han de treballar i lliurar un projecte al final del curs que es desenvoluparà en grup (2-3 persones) i també un treball individual menor de tipus més qualitatiu sobre el comportament dels LLM.

    Mètode d'avaluació

    El curs es qualifica de la següent manera:

    F = Nota de l'examen final
    PG = Nota del projecte en grup
    TI = Nota del treball individual

    Nota final = 40% F + 40% PG + 20% TI

    Evaluació de les competències:

    L'avaluació de la competència de treball en equip es basa en el treball realitzat durant els projecte en grup.

    L'avaluació de la competència: "ús solvent dels recursos d'informació" es basa en el treball pràctic (tant el projecte en grup com el treball individual)

    Bibliografia

    Bàsic

    Capacitats prèvies

    Coneixements generals d'aprenentatge automàtic i de xarxes neuronals, així com de processament del llenguatge natural.