Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
TSC;CS
Professorat
Responsable
- Jose Adrian Rodriguez Fonollosa (jose.fonollosa@upc.edu)
Altres
- Carlos Escolano Peinado (carlos.escolano@upc.edu)
Hores setmanals
Teoria
3
Problemes
0
Laboratori
1
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Competències tècniques
Transversals
Bàsiques
Genèriques
Objectius
-
Conèixer les tecnologies més importants d'aprenentatge profund d'interès en el processament del llenguatge oral i escrit.
Competències relacionades: CE5, CE6, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5, -
L'alumne ha de conèixer les aplicacions més importants de la tecnologia de la parla i del llenguatge.
Competències relacionades: CE5, CE6, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5, -
L'alumne ha de ser capaç de seleccionar la tecnologia de la parla i del llenguatge més adient per a una determinada tasca o aplicació.
Competències relacionades: CE5, CE6, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5, -
Desenvolupar aplicacions que utilitzin la tecnologia de la parla de forma adequada i innovadora.
Competències relacionades: CE5, CE6, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5, -
L'alumne ha de ser capaç d'identificar els paràmetres fonamentals de la veu en el domini temporal i freqüencial
Competències relacionades: CE5, CT5, CT6, CT7, CG1, CB4, CB5, -
L'alumne ha de conèixer les eines matemàtiques de modelatge i aprenentatge automàtic més útils en l'anàlisi de la veu com la quantificació vectorial, els models de barreges de gaussianes i els models ocults de Markov.
Competències relacionades: CE5, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5, -
L'alumne ha de conèixer les tècniques de modelatge estadístic del llenguatge.
Competències relacionades: CE6, CT5, CT6, CT7, CG1, CG2, CG4, CG5, CB4, CB5,
Continguts
-
Introducció a les tecnologies del llenguatge i la parla i les seves aplicacions
Aplicacions del processat del llenguatge oral i escrit. Impacte social.
Blocs principals d'un sistema de processament de la parla: reconeixement de la parla, processat del llenguatge natural, conversió de text a veu.
El llenguatge com a seqüència de paraules. Representació vectorial de paraules. Codificació one-hot. Representacions vectorials en un espai continu.
Word2vec: Continuous bag-of-words versus Continuous skip-gram. Vectors GloVe. Estructures i analogies en les representacions vectorials de paraules. -
Modelatge del llenguatge.
Modelatge estadístic basat en n-grames.
Modelatge amb xarxes neuronals. Xarxes recurrents. Xarxes convolucionals. Sistemes d'atenció: el Transformer. -
Representacions contextuals del llenguatge
Representacions del llenguatge de propòsit general.
Entrenament no supervisat. Sistemes unidireccionals i bidireccionals.
Arquitectures principals: ULMfit, OpenAI GPT, Elm, BERT, XLM. Aplicacions. -
Traducció Automàtica Neuronal
Introducció a la traducció automàtica. Automatic evaluation of translations: BLEU
Traducció Automàtica amb xarxes neuronals. -
Fonaments del reconeixement automàtic de la veu
Pattern matching. Dynamic time warping.
Models ocults de Markov: reconeixement de parables aïllades.
Reconeixement de parla contínua: modelat acústic, modelatge de llenguatge, cerca. -
Síntesi de veu
Processador lingüística.
Modelatge de la prosòdia.
Generació de formes dona.
Mètodes de concatenación.
Activitats
Activitat Acte avaluatiu
Desenvolupament del tema: Introducció a les tecnologies del llenguatge i la parla i les seves aplicacions
Introducció a les tecnologies del llenguatge i la parla i les seves aplicacions. Word vectorsObjectius: 3 2
Continguts:
Teoria
6h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Teoria
6h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Teoria
6h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Teoria
9h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
16h
Desenvolupament del tema: Traducció Automàtica Neuronal
Traducció Automàtica Neuronal
Teoria
6h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
10h
Metodologia docent
Sessions de teoria intercalant l'exposició de nou material teòric amb exemples pràctics.Tasques teòriques i pràctiques agrupades en temes.
Projecte final presentat en forma escrita i oral pels estudiants.
Mètode d'avaluació
L'avaluació de l'assignatura es basa en els següents aspectes:- Dos controls, un control intermedi i l'examen final, per avaluar de forma individual els coneixements adquirits sobre els temes treballats en les sessions de teoria (60%) i les pràctiques (15%).
- Avaluació dels treballs de laboratori (25%): informes escrits i explicació oral de les tasques realitzades i els resultats.
Bibliografia
Bàsic
-
Spoken language processing: a guide to theory, algorithm and system development
- Huang, X.; Acero, A.; Hon, H.-W,
Prentice Hall,
2001.
ISBN: 0130226165
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002590969706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Deep learning
- Goodfellow, I.; Bengio, Y.; Courville, A,
The MIT Press,
2016.
ISBN: 9780262035613
https://www.deeplearningbook.org/ -
Deep learning for NLP and speech recognition
- Kamath, U.; Liu, J.; Whitaker, J,
Springer,
2019.
ISBN: 9783030145958
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004193579706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementari
-
Text-to-speech synthesis
- Taylor, P,
Cambridge University Press,
2009.
ISBN: 9780521899277
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003624489706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Capacitats prèvies
Càlcul i àlgebra linealProbabilitat bàsica i estadística
Nivell alt de programació en Python
Aprenentatge automàtic.
Introducció al Deep Learning