Saltar al contingut Menu
Mapa
  • Inici
  • Informació
  • Contacte
  • Mapa

Processament del Llenguatge Natural (PLN)

Crèdits Dept. Tipus Requisits
7.5 (6.0 ECTS) CS
  • Optativa per a l'EI
IA - Pre-requisit per la EI

Professors

Responsable:  (-)
Altres:(-)

Objectius Generals

Presentar un panorama dels problemes que presenta el processament de la llengua (llenguatge natural o llenguatge humà), les tècniques que es fan servir per abordar-los i els fonaments teòrics en que es basen aquestes tècniques.

La base de l'assignatura es l'estudi de l'Enginyeria Lingüística en les seves tres vessants:

1.  mètodes i eines
2.  recursos i formes d'adquirir-los
3.  aplicacions.

L'enfocament de l'assignatura serà bàsicament pràctic. Es tractaran les dues grans àrees d'aplicació: els sistemes basats en diàlegs persona/màquina i els sistemes de processament de grans volums d'informació textual.

El temari de l'assignatura pretén cobrir les dues aproximacions que normalment es fan servir en les tasques de processament del llenguatge natural: l'aproximació basada en el coneixement (bàsicament lingüístic) i l'aproximació basada en mètodes empírics (bàsicament de tipus estadístic o d'Aprenentatge Automàtic).

Objectius Específics

Coneixements

  1. Abast i necessitat de les tècniques de Processament del Llenguatge Natural.
  2. Conceptes bàsics sobre les aplicacions més habituals de Processament del Llenguatge Natural. Sistemes basats en diàlegs, sistemes de traducció automàtica, sistemes de cerca de la resposta, sistemes de resum automàtic, sistemes de recuperació i extracció de l' informació textual i altres.
  3. Tècniques bàsiques que es fan servir en les tasques de Processament del Llenguatge Natural. Anàlisi morfològic i sintàctic, interpretació semàntica, desambiguació semàntica, i altres.
  4. Fonaments bàsics d'aquestes tècniques.
  5. Coneixement bàsic dels llenguatges que es fan servir a les aplicacions de Processament del Llenguatge Natural.
  6. Coneixement dels recursos necessaris pel tractament de la llengua: diccionaris, gramàtiques, lexicons, ontologies i altres

Habilitats

  1. Analitzar un problema, identificar les possibilitats i avantatges d'aplicar tècniques de Processament del Llenguatge Natural per abordar-lo.
  2. Elecció de les tècniques més adequades per cada tasca de PLN.
  3. Extreure i representar el coneixement necessari per construir una aplicació de Processament del Llenguatge Natural. Selecció i avaluació dels recursos necessaris i del recursos disponibles.
  4. Capacitat d'integrar components ja existents de PLN (tant recursos lingüístics com eines de tractament) en aplicacions reals .
  5. Capacitat per dissenyar i construir components software que resolguin problemes bàsics de PLN (analitzadors, desambiguadors, traductors, etc.).
  6. Capacitat per dissenyar i dur a terme experiments necessaris per l'aplicació dels mètodes empírics de PLN, i d'analitzar-ne els resultats.

Competències

  1. Capacitat de resoldre problemes aplicant els mètodes de la ciència i l'enginyeria
  2. Capacitat per crear i utilitzar models de la realitat.
  3. Capacitat per dissenyar sistemes, components o processos que s'ajustin a unes necessitats, utilitzant els mètodes, tècniques i eines més adients en cada cas.
  4. Capacitat per dissenyar i dur a terme experiments, i d'analitzar-ne els resultats.

Continguts

Hores estimades de:

T P L Alt L Ext. Est A Ext.
Teoria Problemes Laboratori Altres activitats Laboratori extern Estudi Altres hores fora d'horari fixat

1. Introducció al Processament del Llenguatge Natural
T      P      L      Alt    L Ext. Est    A Ext. Total 
3,0 0 0 0 0 2,0 0 5,0
Introducció. Enginyeria Lingüística, Lingüística Computacional i Processament del Llenguatge Natural. Historia, motivació i aplicacions del PLN.
Problemes que el PLN planteja.
Descripció de les tasques bàsiques del PLN. Nivells de descripció lingüística.

2. Nivells bàsics del Processament Lingüístic
T      P      L      Alt    L Ext. Est    A Ext. Total 
5,0 5,0 8,0 0 10,0 10,0 0 38,0
Tractaments textual, lèxic i morfològic.
Tasques de processament textual. Segmentació del text. Identificació de la llengua.
Tasques de processament lèxic. Identificació d'unitats lèxiques. El concepte de paraula. Lexicons, diccionaris. Ontologies lèxiques i semàntiques.
Corpus.
Formes d'adquisició de l'informació lèxica.
Tasques de processament morfològic. Analitzadors morfològics. Eines basades en tècniques d'estats finits (autòmats i transductors d'estats finits).
Tècniques d' Aprenentatge Automàtic aplicades a la morfologia. Inducció de la morfologia.
Desambiguació morfo-sintàctica (POS tagging) i semàntica (WSD).

3. Tractament sintàctic
T      P      L      Alt    L Ext. Est    A Ext. Total 
12,0 7,0 8,0 0 15,0 15,0 0 57,0
Formalismes sintàctics.
Conceptes bàsics de llenguatges formals. Gramàtiques. Tipus de gramàtiques.
Gramàtiques sintagmàtiques. Gramàtiques incontextuals ampliades.
Gramàtiques lògiques.
Formalismes sintàctics recents: GPSG, HPSG.Gramàtiques de trets amb i sense tipus (PATR II, ALE, CUF, etc.).
Tècniques bàsiques d' Anàlisi Sintàctica.
Analitzadors guiats per Gramàtiques incontextuals. Gramàtiques incontextuals esteses: ATN, CHART, CKY, Earley, LR, Tomita.
Analitzadors guiats per gramàtiques lògiques. Problemes que planteja la gestió de l' unificació.
Analitzadors estadístics, superficials i fragmentals. Chunkers.
Comparació entre les aproximacions simbòlica i empírica.
Formes d'adquisició de l'informació sintàctica.
Inducció gramatical.

4. Tractament semàntic i pragmàtic
T      P      L      Alt    L Ext. Est    A Ext. Total 
4,0 2,0 4,0 0 5,0 5,0 0 20,0
Formes de representació semàntica. Diccionaris semàntics. Ontologies semàntiques.
Semàntica lèxica. Desambiguació semàntica (WSD).
Interpretació semàntica.
Col·laboració entre sintaxi i semàntica.
Semàntica discursiva. Diàlegs. Gramàtiques del diàleg. Pragmàtica.

5. Generació
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 0 0 0 2,0 0 4,0
Generació del Llenguatge Natural.
Generació tàctica i estratègica.
Mètodes simbòlics i estadístics.

6. Aplicacions
T      P      L      Alt    L Ext. Est    A Ext. Total 
2,0 0 8,0 0 9,0 4,0 0 23,0
Aplicacions basades en diàlegs.
Interfícies en LN.
Interfícies multimodals.
Traducció automàtica.
Recuperació de l' informació.
Extracció de l' informació.
Resum automàtic.
Cerca de la resposta.
Sistemes multilingües.


Total per tipus T      P      L      Alt    L Ext. Est    A Ext. Total 
28,0 14,0 28,0 0 39,0 38,0 0 147,0
Hores addicionals dedicades a l'avaluació 3,0
Total hores de treball per l'estudiant 150,0

Metodologia docent

Les classes estan dividides en sessions de teoria, problemes i laboratori. A les sessions de teoria es desenvoluparan els coneixements de l'assignatura. Les classes de problemes permetran aprofundir en les tècniques i algorismes explicats a les sessions de teoría.

A les classes de laboratori es desenvoluparan petites pràctiques utilitzant eines i llenguatges adequats al PLN (bàsicament fent servir Python, Prolog, FreeLing i NLTK) que permetran practicar i reforçar els coneixements de les classes de teoria.

Mètode d'avaluació

L'avaluació es basarà en un examen parcial, un examen final i una nota de laboratori.

L'examen parcial no serà alliberatori i es farà a hores de classe. Les persones que no aprovin o no facin l'examen parcial seran avaluades només amb la nota de l'examen final.

La nota de laboratori provindrà dels informes que es faran de les practiques realitzades a les classes de laboratori.

El càlcul de la nota final es farà de la següent manera:

Nota Final = max (Nota examen parcial * 0.15 + Nota examen final * 0.45, Nota examen final * 0.6) + Nota laboratori * 0.4

Bibliografía bàsica

  • Robert Dale, Hermann Moisl, Harold Somers, [editors] Handbook of natural language processing, Marcel Dekker, 2000.
  • Daniel Jurafsky and James H. Martin Speech and Language Processing : an introduction to natural language processing, computational linguistics, and speech recognition, Prentice Hall, 2000.
  • Christopher D. Manning, Hinrich Schütze Foundations of statistical natural language processing, MIT Press, 1999.
  • Ruslan Mitkov, [editors] The Oxford handbook of computational linguistics, Oxford University Press, 2003.

Bibliografía complementària

  • James Allen Natural language understanding, Benjamin /Cummings, 1995.
  • Horacio Rodríguez Hontoria, M. Antònia Martí Antonin, Irene Castellón Masalles Formalismes lògics per al tractament del llenguatge natural, Edicions UPC, 1995.
  • María Antonia Martí Antonín Tecnologías del lenguaje, Editorial UOC, 2003.
  • M. Antònia Martí Antonín, Irene Castellón Masalles Lingüística computacional, EUB, Edicions Universitat de Barcelona, 2001.
  • Edward Loper and Steven Bird NLTK: The Natural Language Toolkit , ACL Workshop on Effective Tools and Methodologies for Teaching Natural Language, 2002.

Enllaços web

  1. http://nltk.sourceforge.net/
    NLTK, Natural Language Toolkit


  2. http://www.aclweb.org/
    Association of Computational Linguistics ACL


  3. http://acl.ldc.upenn.edu/
    ACL Anthology


  4. http://www.cordis.lu/ist/
    Information Society Technology IST


  5. http://oesi.cervantes.es/
    Oficina del Español en la Sociedad de la Información OESI


  6. http://www.sepln.org/
    Sociedad Española para el procesamiento del lenguaje natural SEPLN



  7. http://www.talp.upc.es/
    TALP (UPC)


  8. http://www.lsi.upc.edu/~nlp/web/
    Grup de PLN de la UPC


  9. http://opennlp.sourceforge.net/
    OpenNLP


  10. http://web.syr.edu/~mdtaffet/
    Pàgina de recursos de NLP de Mary Taffet


  11. http://nlp.stanford.edu/links/statnlp.html
    Pàgina de recursos de NLP de l' Universitat d'Stanford


Capacitats prèvies

Els estudiants haurien de tenir coneixements de:

Representació del coneixement
Tècniques de resolució de problemes
Conceptes bàsics de Processament del Llenguatge Natural
Conceptes de llenguatges formals (concretament autòmats finits,
llenguatges regulars i incontextuals)

Per això, les assignatures Intel·ligència Artificial i Teoria de la Computació
haurien de ser prerequisits d'aquesta.

Com a suggeriment addicional es recomana haver cursat l'assignatura de Compiladors.


Compartir

 
logo FIB © Facultat d'Informàtica de Barcelona - Contacte - RSS
Aquest web utilitza cookies pròpies per oferir una millor experiència i servei. En continuar amb la navegació entenem que acceptes la nostra política de cookies.
Versió clàssica Versió mòbil