Saltar al contingut Menu
Mapa
  • Inicio
  • Información
  • Contacto
  • Mapa

Procesamiento del Lenguaje Natural (PLN)

Créditos Dept.
7.5 (6.0 ECTS) CS

Profesores

Responsable:  (-)
Otros:(-)

Objectivos Generales

Exponer un panorama de los problemas que presenta el procesamiento de la lengua (lenguaje natural o lenguaje humano), las técnicas que se utilizan para abordarlos y los fundamentos teóricos en que se basan estas técnicas. La base de la asignatura es el estudio de la ingeniería lingüística en sus tres vertientes: 1. métodos y herramientas, 2. recursos y formas de adquirirlos, 3. aplicaciones. El enfoque de la asignatura será básicamente práctico. Se tratarán las dos grandes áreas de aplicación: los sistemas basados en diálogos persona-máquina y los sistemas de procesamiento de grandes volúmenes de información textual. El temario de la asignatura pretende cubrir las dos aproximaciones que normalmente se utilizan en las tareas de procesamiento del lenguaje natural: la aproximación basada en el conocimiento (básicamente lingüístico) y la aproximación basada en métodos empíricos (básicamente de tipo estadístico o de aprendizaje automático).

Objectivos Específicos

Conocimientos

  1. Alcance y necesidad de las técnicas de Procesamiento del Lenguaje Natural.
  2. Conceptos básicos sobre las aplicaciones más habituales de Procesamiento del Lenguaje Natural. Sistemas basados en diálogos, sistemas de traducción automática, sistemas de búsqueda de la respuesta, sistemas de resumen automático, sistemas de recuperación y extracción de la información textual y otros.
  3. Técnicas básicas que se usan en las tareas de Procesamiento del Lenguaje Natural. Análisis morfológico y sintáctico, interpretación semántica, desambiguación semántica, y otros.
  4. Fundamentos básicos de estas técnicas.
  5. Conocimiento básico de los lenguajes que se usan en las aplicaciones de Procesamiento del Lenguaje Natural.
  6. Conocimiento de los recursos necesarios para el tratamiento de la lengua: diccionarios, gramáticas, lexicones, ontologías y otros.

Habilidades

  1. Analizar un problema, identificar las posibilidades y ventajas de aplicar técnicas de Procesamiento del Lenguaje Natural para abordarlo.
  2. Elección de las técnicas más adecuadas para cada tarea de PLN.
  3. Extraer y representar el conocimiento necesario para construir una aplicación de Procesamiento del Lenguaje Natural. Selección y evaluación de los recursos necesarios y de los recursos disponibles.
  4. Capacidad para integrar componentes ya existentes de PLN (tanto recursos lingüísticos como herramientas de tratamiento) en aplicaciones reales.
  5. Capacidad para diseñar y construir componentes software que resuelvan problemas básicos de PLN (analizadores, desambiguadores, traductores, etc.)
  6. Capacidad para diseñar y realizar experimentos necesarios para la aplicación de los métodos empíricos de PLN y analizar los resultados.

Competencias

  1. Capacidad para resolver problemas aplicando los métodos de la ciencia y la ingeniería.
  2. Capacidad para crear y utilizar modelos de la realidad.
  3. Capacidad para diseñar sistemas, componentes o procesos que se ajusten a unas necesidades, utilizando los métodos, técnicas y herramientas más adecuadas en cada caso.
  4. Capacidad para diseñar y realizar experimentos y analizar los resultados.

Contenidos

Horas estimadas de:

T P L Alt L Ext. Est O. Ext.
Teoria Problemas Laboratorio Otras actividades Laboratorio externo Estudio Otras horas fuera del horario fijado

1. Introducción al Procesamiento del Lenguaje Natural
T      P      L      Alt    L Ext. Est    O. Ext. Total 
3,0 0 0 0 0 2,0 0 5,0
Introducción. Ingeniería Lingüística, Lingüística Computacional y Procesamiento del Lenguaje Natural. Historia, motivación y aplicaciones del PLN.

Problemas que el PLN plantea.

Descripción de las tareas básicas del PLN. Niveles de descripción lingüística.

2. Niveles básicos del Procesamiento Lingüístico
T      P      L      Alt    L Ext. Est    O. Ext. Total 
5,0 5,0 8,0 0 10,0 10,0 0 38,0
Tratamientos textual, léxico y morfológico.

Tareas de procesamiento textual. Segmentación del texto. Identificación de la lengua.

Tareas de procesamiento léxico. Identificación de unidades léxicas. El concepto de palabra. Lexicones, diccionarios. Ontologías léxicas y semánticas.

Corpus.

Formas de adquisición de la información léxica.

Tareas de procesamiento morfológico. Analizadores morfológicos. Herramientas basadas en técnicas de estados finitos (autómatas y transductores de estados finitos).

Técnicas de Aprendizaje Automático aplicadas a la morfología. Inducción de la morfología.

Desambiguación morfo-sintáctica (POS tagging) y semántica (WSD).

3. Tratamiento sintáctico
T      P      L      Alt    L Ext. Est    O. Ext. Total 
12,0 7,0 8,0 0 15,0 15,0 0 57,0
Formalismos sintácticos.

Conceptos básicos de lenguajes formales. Gramáticas. Tipos de gramáticas.

Gramáticas sintagmáticas. Gramáticas incontextuales ampliadas.

Gramáticas lógicas.

Formalismos sintácticos recientes: GPSG, HPSG. Gramáticas de rasgos con y sin tipo (PATR II, ALE, CUF, etc.).

Técnicas básicas de Análisis Sintáctico.

Analizadores guiados por Gramáticas incontextuales. Gramáticas incontextuales extendidas: ATN, CHART, CKY, Earley, LR, Tomita.

Analizadores guiados por gramáticas lógicas. Problemas que plantea la gestión de la unificación.

Analizadores estadísticos, superficiales y fragmentales. Chunkers.

Comparación entre las aproximaciones simbólica y empírica.

Formas de adquisición de la información sintáctica.

Inducción gramatical.

4. Tratamiento semántico y pragmático
T      P      L      Alt    L Ext. Est    O. Ext. Total 
4,0 2,0 4,0 0 5,0 5,0 0 20,0
Formas de representación semántica. Diccionarios semánticos. Ontologías semánticas.

Semántica léxica. Desambiguación semántica (WSD).

Interpretación semántica.

Colaboración entre sintaxis y semántica.

Semántica discursiva. Diálogos. Gramáticas del diálogo. Pragmática.

5. Generación
T      P      L      Alt    L Ext. Est    O. Ext. Total 
2,0 0 0 0 0 2,0 0 4,0
Generación del Lenguaje Natural.

Generación táctica y estratégica.

Métodos simbólicos y estadísticos.

6. Aplicaciones
T      P      L      Alt    L Ext. Est    O. Ext. Total 
2,0 0 8,0 0 9,0 4,0 0 23,0
Aplicaciones basadas en diálogos.

Interfaces en LN.

Interfaces multimodales.

Traducción automática.

Recuperación de la información.

Extracción de la información.

Resumen automático.

Búsqueda de la respuesta.

Sistemas multilingües.


Total por tipo T      P      L      Alt    L Ext. Est    O. Ext. Total 
28,0 14,0 28,0 0 39,0 38,0 0 147,0
Horas adicionales dedicadas a la evaluación 3,0
Total horas de trabajo para el estudiante 150,0

Metodología docente

Las clases están divididas en sesiones de teoría, problemas y laboratorio. En las sesiones de teoría se desarrollarán los conocimientos de la asignatura. Las clases de problemas permitirán profundizar en las técnicas y algoritmos explicados en las sesiones de teoría.

En las clases de laboratorio se desarrollarán pequeñas prácticas utilizando herramientas y lenguajes adecuados al PLN (básicamente usando Python, Prolog y NLTK) que permitirán practicar y reforzar los conocimientos de las clases de teoría.



Las ultimas sesiones de laboratorio se dedicarán a la integración de las unidades de software desarrolladas a lo largo del curso en una aplicación final.

Método de evaluación

La evaluación se basará en un examen parcial, un examen final y una nota de laboratorio.

El examen parcial no liberará temario y se hará en horas de clase. Las personas que no aprueben o no hagan el examen parcial serán evaluadas sólo con la nota del examen final.



La nota de laboratorio provendrá de los informes que se harán de las prácticas realizadas en las clases de laboratorio.



El cálculo de la nota final se hará de la siguiente manera:



Nota Final = max (Nota examen parcial * 0.15 + Nota examen final * 0.45, Nota examen final * 0.6) + Nota laboratorio * 0.4

Bibliografía básica

  • Robert Dale, Hermann Moisl, Harold Somers, [editors] Handbook of natural language processing, Marcel Dekker, 2000.
  • Daniel Jurafsky and James H. Martin Speech and Language Processing : an introduction to natural language processing, computational linguistics, and speech recognition, Prentice Hall, 2000.
  • Christopher D. Manning, Hinrich Schütze Foundations of statistical natural language processing, MIT Press, 1999.
  • Ruslan Mitkov, [editors] The Oxford handbook of computational linguistics, Oxford University Press, 2003.

Bibliografía complementaria

  • James Allen Natural language understanding, Benjamin /Cummings, 1995.
  • Horacio Rodríguez Hontoria, M. Antònia Martí Antonin, Irene Castellón Masalles Formalismes lògics per al tractament del llenguatge natural, Edicions UPC, 1995.
  • María Antonia Martí Antonín Tecnologías del lenguaje, Editorial UOC, 2003.
  • M. Antònia Martí Antonín, Irene Castellón Masalles Lingüística computacional, EUB, Edicions Universitat de Barcelona, 2001.
  • Edward Loper and Steven Bird NLTK: The Natural Language Toolkit , ACL Workshop on Effective Tools and Methodologies for Teaching Natural Language, 2002.

Enlaces web

  1. http://nltk.sourceforge.net/


  2. http://www.aclweb.org/


  3. http://acl.ldc.upenn.edu/


  4. http://www.cordis.lu/ist/


  5. http://oesi.cervantes.es/


  6. http://www.sepln.org/


  7. http://www.talp.upc.es/


  8. http://www.lsi.upc.edu/~nlp/web/


  9. http://opennlp.sourceforge.net/


  10. http://web.syr.edu/~mdtaffet/


  11. http://nlp.stanford.edu/links/statnlp.html


Capacidades previas

Los estudiantes deberán tener conocimientos de:

Representación del conocimiento
Técnicas de resolución de problemas
Conceptos básicos de Procesamiento del Lenguaje Natural
Conceptos de lenguajes formales (concretamente autómatas finitos, lenguajes regulares e incontextuales)

Por ello, las asignaturas Inteligencia Artificial y Teoría de la Computación deberán ser prerrequisitos de ésta.

Como sugerencia adicional se recomienda haber cursado la asignatura de Compiladores.


Compartir

 
logo FIB © Facultad de Informática de Barcelona - Contacto - RSS
Esta web utiliza cookies propias para ofrecerle una mejor experiencia y servicio. Si continúa la navegación, entendemos que acepta nuestra política de cookies. Versión clássica Versión móvil