Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
CS
Web
https://www.cs.upc.edu/~turmo/plh/plan15m/PLH.html
Professorat
Responsable
- Jordi Turmo Borrás ( turmo@cs.upc.edu )
Altres
- Salvador Medina Herrera ( salvador.medina.herrera@upc.edu )
Hores setmanals
Teoria
1.5
Problemes
0.5
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Transversals
Bàsiques
Específiques
Genèriques
Objectius
-
Entendre les teories i les tècniques fonamentals associades al Processament del Llenguatge Natural
Competències relacionades: CB3, CB4, CB5, CT6, CE02, CE14, CE18, CE27, CG3, CG5, CG6, -
Conèixer els recursos i les aplicacions mes rellevants del Processament del Llenguatge Natural
Competències relacionades: CB3, CB4, CB5, CT6, CT8, CE15, CE27, CG3, CG4, CG5, CG6, -
Desenvolupar programes per a resoldre tasques particulars de l'àrea del Processament del Llenguatge Natural
Competències relacionades: CB2, CB3, CB4, CB5, CT2, CT6, CT8, CE02, CE14, CE16, CE17, CE18, CG7, CE27, CG5, CT1, CG8, CG9,
Continguts
-
Processament del Llenguatge Natural i les seves aplicacions
-
Tècniques, recursos i aplicacions associats a l'anàlisi de paraules
-
Tècniques, recursos i aplicacions associats a l'anàlisi de seqüencies de paraules
-
Tècniques, recursos i aplicacions associats a l'anàlisi de frases
-
Tècniques i aplicacions associats a l'anàlisi d'un text vist com a seqüencia de frases
Activitats
Activitat Acte avaluatiu
Identificació d'unitats lingüístiques en un document
Reconeixament de zones textuals en un document. Identificació de paraules i oracions com a unitats bàsiques per al processament de text. Identificació de l'idioma.Objectius: 1 2
Continguts:
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Bloc de tractament d'una paraula
Estudi de tècniques i recursos per a l'adquisició automàtica d'informació morfològica i semàntica d'una paraula, així com per a la desambiguació de la seva categoría morfològica i del seu significat donat un context. Aplicació a correctors de paraules i a la identificació de la polaritat de textos d'opinióObjectius: 1 2
Continguts:
Teoria
8h
Problemes
3h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Bloc de tractament de seqüencies de paraules amb significat
Estudi de tècniques i recursos per al reconeixement de noms d'entitats i de frases nominals que es mencionen en text. Aplicació a l'anonimització de text.Objectius: 1 2
Continguts:
Teoria
5h
Problemes
2h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Bloc de tractament d'una frase aillada
Estudi de tècniques i recursos per a l'obtenció d'informació sintàctica associada a una frase. Aplicació a l'extracció d'informació.
Teoria
4h
Problemes
2h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Bloc de tractament d'un text com a seqüència de frases
Estudi de tècniques bàsiques per a la resolució de coreferències d'entitats mencionades en un text. Aplicació al diàleg
Teoria
1.5h
Problemes
0.5h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Pràctica 1
Identificador del llenguatge
Teoria
0h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Pràctica 2
Detector de polaritat d'un text d'opinió
Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Pràctica 3
Extractor d'informació
Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Pràctica 4
avaluació de diferents word embeddings
Teoria
0h
Problemes
0h
Laboratori
8h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
Les classes estan organitzades en sessions de teoria/problemes i de laboratori.A cada sessió de teoria/problemes es presentaran els nous conceptes, problemàtiques relacionades i aproximacions per resoldre-les, i es resoldràn exercicis per tal de fixar els conceptes, tècniques i algorismes explicats.
A les sessions de laboratori es desenvoluparan petites pràctiques utilitzant eines i llenguatges adequats al PLN que permetran practicar i reforçar els coneixements apresos a les classes de teoria.
Mètode d'avaluació
NEX: nota de l'examen finalNLAB: nota mitjana de les pràctiques de laboratori
NF: nota final de l'assignatura
NF = 0.5*NEX + 0.5*NLAB
Reavaluació:
Només es pot presentar a l'examen de reavaluació qui prèviament s'hagi presentat a l'examen final i l'hagi suspès.
En l'examen de reavaluació entrarà tot el temari fet a classes de teoria. La nota màxima d'aquest examen serà de 7.
Bibliografia
Bàsic
-
Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
- Jurafsky, Dan; Martin, James H,
Prentice Hall,,
2019.
-
Foundations of Statistical Natural Language Processing
- Manning, Christopher; Schütze, Hinrich,
MIT Press,,
1999.
ISBN: 0262133601
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001994779706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Handbook of Computational Linguistics and Natural Language Processing
- Clark, Alexander; Fox, Chris; Lappin, Shalom,
Wiley-Blackwell,
2012.
ISBN: 9781444324044