Processament del Llenguatge Humà

Esteu aquí

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits, però té capacitats prèvies
Departament
CS
L'objectiu de l'assignatura és aportar els fonaments del Processament del Llenguatge Natural (PLN) a l'estudiant. Concretament, s'introdueix la problemàtica que presenta el PLN, les tècniques i recursos que es fan servir per tractar-los i els fonaments teòrics en que es basen. L'assignatura també introdueix breument les aplicacions més importants del PLN. El temari de l'assignatura es centra en les dues aproximacions més utilitzades en el PLN: l'aproximació basada en el coneixement lingüístic i l'aproximació basada en mètodes empírics (bàsicament de tipus estadístic i d'aprenentatge automàtic).

Professorat

Responsable

  • Jordi Turmo Borrás ( )

Altres

  • Salvador Medina Herrera ( )

Hores setmanals

Teoria
1.5
Problemes
0.5
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Competències Transversals

Transversals

  • CT1 - Emprenedoria i innovació. Conèixer i comprendre l'organització d'una empresa i les ciències que regeixen la seva activitat; tenir capacitat per entendre les normes laborals i les relacions entre la planificació, les estratègies industrials i comercials, la qualitat i el benefici.
  • CT2 - Sostenibilitat i Compromís Social. Conèixer i comprendre la complexitat dels fenòmens econòmics i socials típics de la societat del benestar; tenir capacitat per relacionar el benestar amb la globalització i la sostenibilitat; obtenir habilitats per utilitzar de forma equilibrada i compatible la tècnica, la tecnologia, l'economia i la sostenibilitat.
  • CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
  • CT8 - Perspectiva de gènere. Conèixer i comprendre, des de l'àmbit de la titulació mateixa, les desigualtats per raó de sexe i gènere en la societat, i integrar les diverses necessitats i preferències per raó de sexe i gènere en el disseny de solucions i la resolució de problemes.

Bàsiques

  • CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
  • CB3 - Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
  • CB4 - Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tant especialitzat com no especialitzat.
  • CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia

Competències Tècniques

Específiques

  • CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.
  • CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
  • CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
  • CE16 - Dissenyar i avaluar interfícies persona-màquina que garanteixin l'accessibilitat i usabilitat dels sistemes, serveis i aplicacions informàtiques.
  • CE17 - Desenvolupar i avaluar sistemes interactius i de presentació d'informació complexa i la seva aplicació a la resolució de problemes de disseny d'interacció persona-ordinador i persona-robot.
  • CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
  • CE27 - Dissenyar i aplicar tècniques de processament de la veu, de reconeixement del llenguatge parlat i comprensió del llenguatge humà, amb aplicació en la intel·ligència artificial social.

Competències Tècniques Generals

Genèriques

  • CG3 - Definir, avaluar i seleccionar plataformes maquinari i programari per al desenvolupament i l'execució de sistemes, serveis i aplicacions informàtiques en l'àmbit de la intel·ligència artificial.
  • CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
  • CG5 - Treballar en equips i projectes multidisciplinaris relacionats amb la intel·ligència artificial i la robòtica, interactuant fluidament amb enginyers/es i professionals d'altres disciplines.
  • CG6 - Identificar oportunitats per a aplicacions innovadores de la intel·ligència artificial i la robòtica en entorns tecnològics en contínua evolució.
  • CG7 - Interpretar i aplicar la legislació vigent, així com especificacions, reglaments i normes en l'àmbit de la intel·ligència artificial.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
  • CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.

Objectius

  1. Entendre les teories i les tècniques fonamentals associades al Processament del Llenguatge Natural
    Competències relacionades: CE27, CG3, CG5, CG6, CT6, CB3, CB4, CB5, CE02, CE14, CE18,
  2. Conèixer els recursos i les aplicacions mes rellevants del Processament del Llenguatge Natural
    Competències relacionades: CE27, CG3, CG4, CG5, CG6, CT6, CT8, CB3, CB4, CB5, CE15,
  3. Desenvolupar programes per a resoldre tasques particulars de l'àrea del Processament del Llenguatge Natural
    Competències relacionades: CE27, CG5, CG7, CG8, CG9, CT1, CT2, CT6, CT8, CB2, CB3, CB4, CB5, CE02, CE14, CE16, CE17, CE18,

Continguts

  1. Processament del Llenguatge Natural i les seves aplicacions
  2. Tècniques, recursos i aplicacions associats a l'anàlisi de paraules
  3. Tècniques, recursos i aplicacions associats a l'anàlisi de seqüencies de paraules
  4. Tècniques, recursos i aplicacions associats a l'anàlisi de frases
  5. Tècniques i aplicacions associats a l'anàlisi d'un text vist com a seqüencia de frases

Activitats

Activitat Acte avaluatiu


Sessió introductòria


Objectius: 1 2
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Identificació d'unitats lingüístiques en un document

Reconeixament de zones textuals en un document. Identificació de paraules i oracions com a unitats bàsiques per al processament de text. Identificació de l'idioma.
Objectius: 1 2
Continguts:
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Bloc de tractament d'una paraula

Estudi de tècniques i recursos per a l'adquisició automàtica d'informació morfològica i semàntica d'una paraula, així com per a la desambiguació de la seva categoría morfològica i del seu significat donat un context. Aplicació a correctors de paraules i a la identificació de la polaritat de textos d'opinió
Objectius: 1 2
Continguts:
Teoria
8h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Bloc de tractament de seqüencies de paraules amb significat

Estudi de tècniques i recursos per al reconeixement de noms d'entitats i de frases nominals que es mencionen en text. Aplicació a l'anonimització de text.
Objectius: 1 2
Continguts:
Teoria
5h
Problemes
2h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Bloc de tractament d'una frase aillada

Estudi de tècniques i recursos per a l'obtenció d'informació sintàctica associada a una frase. Aplicació a l'extracció d'informació.

Teoria
4h
Problemes
2h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Bloc de tractament d'un text com a seqüència de frases

Estudi de tècniques bàsiques per a la resolució de coreferències d'entitats mencionades en un text. Aplicació al diàleg

Teoria
1.5h
Problemes
0.5h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Pràctica 1

Identificador del llenguatge

Teoria
0h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Pràctica 2

Detector de polaritat d'un text d'opinió

Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Pràctica 3

Extractor d'informació

Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Pràctica 4

avaluació de diferents word embeddings

Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h

Pràctiques


Objectius: 3
Setmana: 15 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
45h

Exàmen


Objectius: 1 2
Setmana: 15 (Fora d'horari lectiu)
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
45h

Metodologia docent

Les classes estan organitzades en sessions de teoria/problemes i de laboratori.

A cada sessió de teoria/problemes es presentaran els nous conceptes, problemàtiques relacionades i aproximacions per resoldre-les, i es resoldràn exercicis per tal de fixar els conceptes, tècniques i algorismes explicats.

A les sessions de laboratori es desenvoluparan petites pràctiques utilitzant eines i llenguatges adequats al PLN que permetran practicar i reforçar els coneixements apresos a les classes de teoria.

Mètode d'avaluació

NEX: nota de l'examen final
NLAB: nota mitjana de les pràctiques de laboratori
NF: nota final de l'assignatura

NF = 0.5*NEX + 0.5*NLAB

Reavaluació:

Només es pot presentar a l'examen de reavaluació qui prèviament s'hagi presentat a l'examen final i l'hagi suspès.
En l'examen de reavaluació entrarà tot el temari fet a classes de teoria. La nota màxima d'aquest examen serà de 7.

Bibliografia

Bàsica:

  • Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition - Jurafsky, Dan; Martin, James H, Prentice Hall,, 2019.
  • Foundations of Statistical Natural Language Processing - Manning, Christopher; Schütze, Hinrich, MIT Press,, 1999. ISBN: 0262133601
    https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001994779706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
  • The Handbook of Computational Linguistics and Natural Language Processing - Clark, Alexander; Fox, Chris; Lappin, Shalom, Wiley-Blackwell, 2012. ISBN: 9781444324044

Capacitats prèvies