Responsable: | (-) |
Otros: | (-) |
Créditos | Dept. | Tipo | Requisitos |
---|---|---|---|
7.5 (6.0 ECTS) | CS |
|
IA
- Prerequisito para la EI |
Responsable: | (-) |
Otros: | (-) |
Exponer un panorama de los problemas que presenta el procesamiento de la lengua (lenguaje natural o lenguaje humano), las técnicas que se utilizan para abordarlos y los fundamentos teóricos en que se basan estas técnicas. La base de la asignatura es el estudio de la ingeniería lingüística en sus tres vertientes: 1. métodos y herramientas, 2. recursos y formas de adquirirlos, 3. aplicaciones. El enfoque de la asignatura será básicamente práctico. Se tratarán las dos grandes áreas de aplicación: los sistemas basados en diálogos persona-máquina y los sistemas de procesamiento de grandes volúmenes de información textual. El temario de la asignatura pretende cubrir las dos aproximaciones que normalmente se utilizan en las tareas de procesamiento del lenguaje natural: la aproximación basada en el conocimiento (básicamente lingüístico) y la aproximación basada en métodos empíricos (básicamente de tipo estadístico o de aprendizaje automático).
Horas estimadas de:
T | P | L | Alt | L Ext. | Est | O. Ext. |
Teoria | Problemas | Laboratorio | Otras actividades | Laboratorio externo | Estudio | Otras horas fuera del horario fijado |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
5,0 | 5,0 | 8,0 | 0 | 10,0 | 10,0 | 0 | 38,0 | |||
Tratamientos textual, léxico y morfológico.
Tareas de procesamiento textual. Segmentación del texto. Identificación de la lengua. Tareas de procesamiento léxico. Identificación de unidades léxicas. El concepto de palabra. Lexicones, diccionarios. Ontologías léxicas y semánticas. Corpus. Formas de adquisición de la información léxica. Tareas de procesamiento morfológico. Analizadores morfológicos. Herramientas basadas en técnicas de estados finitos (autómatas y transductores de estados finitos). Técnicas de Aprendizaje Automático aplicadas a la morfología. Inducción de la morfología. Desambiguación morfo-sintáctica (POS tagging) y semántica (WSD). |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
12,0 | 7,0 | 8,0 | 0 | 15,0 | 15,0 | 0 | 57,0 | |||
Formalismos sintácticos.
Conceptos básicos de lenguajes formales. Gramáticas. Tipos de gramáticas. Gramáticas sintagmáticas. Gramáticas incontextuales ampliadas. Gramáticas lógicas. Formalismos sintácticos recientes: GPSG, HPSG. Gramáticas de rasgos con y sin tipo (PATR II, ALE, CUF, etc.). Técnicas básicas de Análisis Sintáctico. Analizadores guiados por Gramáticas incontextuales. Gramáticas incontextuales extendidas: ATN, CHART, CKY, Earley, LR, Tomita. Analizadores guiados por gramáticas lógicas. Problemas que plantea la gestión de la unificación. Analizadores estadísticos, superficiales y fragmentales. Chunkers. Comparación entre las aproximaciones simbólica y empírica. Formas de adquisición de la información sintáctica. Inducción gramatical. |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
4,0 | 2,0 | 4,0 | 0 | 5,0 | 5,0 | 0 | 20,0 | |||
Formas de representación semántica. Diccionarios semánticos. Ontologías semánticas.
Semántica léxica. Desambiguación semántica (WSD). Interpretación semántica. Colaboración entre sintaxis y semántica. Semántica discursiva. Diálogos. Gramáticas del diálogo. Pragmática. |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 0 | 0 | 0 | 2,0 | 0 | 4,0 | |||
Generación del Lenguaje Natural.
Generación táctica y estratégica. Métodos simbólicos y estadísticos. |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 0 | 8,0 | 0 | 9,0 | 4,0 | 0 | 23,0 | |||
Aplicaciones basadas en diálogos.
Interfaces en LN. Interfaces multimodales. Traducción automática. Recuperación de la información. Extracción de la información. Resumen automático. Búsqueda de la respuesta. Sistemas multilingües. |
Total por tipo | T | P | L | Alt | L Ext. | Est | O. Ext. | Total |
28,0 | 14,0 | 28,0 | 0 | 39,0 | 38,0 | 0 | 147,0 | |
Horas adicionales dedicadas a la evaluación | 3,0 | |||||||
Total horas de trabajo para el estudiante | 150,0 |
Las clases están divididas en sesiones de teoría, problemas y laboratorio. En las sesiones de teoría se desarrollarán los conocimientos de la asignatura. Las clases de problemas permitirán profundizar en las técnicas y algoritmos explicados en las sesiones de teoría.
En las clases de laboratorio se desarrollarán pequeñas prácticas utilizando herramientas y lenguajes adecuados al PLN (básicamente usando Python, Prolog y NLTK) que permitirán practicar y reforzar los conocimientos de las clases de teoría.
Las ultimas sesiones de laboratorio se dedicarán a la integración de las unidades de software desarrolladas a lo largo del curso en una aplicación final.
La evaluación se basará en un examen parcial, un examen final y una nota de laboratorio.
El examen parcial no liberará temario y se hará en horas de clase. Las personas que no aprueben o no hagan el examen parcial serán evaluadas sólo con la nota del examen final.
La nota de laboratorio provendrá de los informes que se harán de las prácticas realizadas en las clases de laboratorio.
El cálculo de la nota final se hará de la siguiente manera:
Nota Final = max (Nota examen parcial * 0.15 + Nota examen final * 0.45, Nota examen final * 0.6) + Nota laboratorio * 0.4
Los estudiantes deberán tener conocimientos de:
Representación del conocimiento
Técnicas de resolución de problemas
Conceptos básicos de Procesamiento del Lenguaje Natural
Conceptos de lenguajes formales (concretamente autómatas finitos, lenguajes regulares e incontextuales)
Por ello, las asignaturas Inteligencia Artificial y Teoría de la Computación deberán ser prerrequisitos de ésta.
Como sugerencia adicional se recomienda haber cursado la asignatura de Compiladores.