Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
CS
Web
https://www.cs.upc.edu/~turmo/mud/plan0a6/MUD.html
The flow of the course is along two main axis: (1) computational formalisms to describe natural language processes, and (2) statistical and machine learning methods to acquire linguistic models from large data collections and solve specific linguistic tasks
Professorat
Responsable
- Jordi Turmo Borrás ( turmo@cs.upc.edu )
Altres
- Carlos Escolano Peinado ( carlos.escolano@upc.edu )
- Salvador Medina Herrera ( salvador.medina.herrera@upc.edu )
Hores setmanals
Teoria
1.5
Problemes
0.5
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
7.11
Competències
Ús solvent dels recursos d'informació
Tercera llengua
Emprenedoria i innovació
Bàsiques
Genèriques
Específiques
Objectius
-
Know and understand basic NLP tasks and their application to text analysis.
Competències relacionades: CT4, CT1, CG2, CE6, CE7, CE11, CB6, CB7, CB10, -
Know, understand, and apply text mining techniques, including entity recognition, sentiment analysis, and document retrieval.
Competències relacionades: CT4, CT5, CE11, CE12, CB6, CB7, CB8, CB9, -
Know, understand, and apply basic principles of deep learning in unstructured data tasks, such as natural language processing, or computer vision.
Competències relacionades: CT4, CT5, CG2, CE6, CE7, CE11, CE13, CB6, CB7, CB8, CB9, CB10,
Continguts
-
Natural language processing and its application to text analysis
Introduction: What is NLP and its applications -
natural language processing stages
Text segmentation: sentence splitting, tokenization; morpholigcal analysis, PoS tagging, syntactic parsing -
text classification, text similarity.
Similarity measures for text. String edit based distances. Vector and set distance measures, distributional semantics. Document retrieval.
Text classification: Sentiment analysis -
Information extraction: Entity recognition, relation extraction
-
Deep learning techniques for the analysis of non-structured data
Word embeddings, neural language processing -
Main deep learning architectures for non-structured data
Recurrent NN, Convolutional NN, Transformers
Activitats
Activitat Acte avaluatiu
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
NLP i les seves aplicacions
Introduction. What is NLP, tasks, components, and applications.Objectius: 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
etapes del processament del llenguatge natural
Text segmentation: sentence splitting/tokenization; morphological analysis; PoS tagging; syntactic parsing.Objectius: 1
Continguts:
Teoria
7.3h
Problemes
2.5h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Classificatció de textos, similaritat de textos.
Similarity measures for text. String edit based distances. Vector and set distance measures, distributional semantics. Document retrieval. Text classification: Sentiment analysisObjectius: 2
Continguts:
Teoria
1.5h
Problemes
0.5h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Tècniques de deep learning per a l'anàlisi de dades no estructurades.
Word embeddings, neural language processingObjectius: 3
Continguts:
Teoria
4.5h
Problemes
2h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Principals arquitectures de deep learning per a dades no estructurades
Recurrent NN, Convolutional NN, TransformersObjectius: 3
Continguts:
Teoria
3.5h
Problemes
1.5h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Teoria
0h
Problemes
0h
Laboratori
6h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
Classe expositiva participativa de continguts teorics i practicsClasse practica de resolució, amb la participación dels estudiants, de casos pràctics i/o exercicis relacionats amb els continguts de la materia
Practiques de laboratori - Treballen grup
Tutoríes.
Mètode d'avaluació
pràctiques de laboratori 40% + examen parcial 30% + examen final 30%Bibliografia
Bàsic
-
Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition
- Jurafsky, Dan; Martin, James H,
Prentice Hall,
2008.
ISBN: 9789332518414
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003460299706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Handbook of natural language processing
- Indurkhya, Nitin ; Damerau, Fred J,
Taylor¬Francis,
2010.
ISBN: 9780429149207
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004874386806711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Foundations of statistical natural language processing
- Manning, Christopher D; Schütze, Hinrich,
MIT Press,
1999.
ISBN: 0262133601
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001994779706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Oxford handbook of computational linguistics
- Mitkov, Ruslan,
Oxford University Press,
2003.
ISBN: 0198238827
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002689009706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Handbook of natural language processing
- Indurkhya, Nitin; Damerau, Frederick J,
Chapman and Hall/CRC,
2010.
ISBN: 9781420085938
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001234699706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Handbook of computational linguistics and natural language processing
- Clark, Alexander; Fox, Chris; Lappin, Shalom,
Wiley-Blackwell,
2010.
ISBN: 9781444324044
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001686059706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Natural language processing with deep learning
- Manning, C.; See, A,
Stanford University,
2022.
-
Natural language processing
- Collins, M,
Columbia University,
Capacitats prèvies
Nivell alt de programació en python.Coneixements d'estadística i matemàtiques a nivell de grau universitari en enginyeria o similar.
Conceptes bàsics d'aprenentatge automàtic.