Créditos
5
Tipos
Obligatoria
Requisitos
Esta asignatura no tiene requisitos
, pero tiene capacidades previas
Departamento
CS
Web
www.cs.upc.edu/~turmo/ihlt/plan32js/IHLT.html
El temario de la asignatura se centra en las dos aproximaciones más utilizadas en el procesamiento del lenguaje natural: la aproximación basada en el conocimiento y la aproximación basada en métodos empíricos (básicamente de tipo estadístico y de aprendizaje automático).
IHLT proporciona los conocimientos básicos de PLN para cursar posteriormente las asignaturas optativas AHLT y HLE. Por una parte, AHLT profundiza en las técnicas estadísticas de PLN. Por otra parte, HLE revisa el estado del arte sobre las aplicaciones reales de la tecnología de PLN.
Profesorado
Responsable
- Jordi Turmo Borrás ( turmo@cs.upc.edu )
Otros
- Salvador Medina Herrera ( salvador.medina.herrera@upc.edu )
Horas semanales
Teoría
2
Problemas
0
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
5.93
Competencias
Genéricas
Académicas
Profesionales
Trabajo en equipo
Uso solvente de los recursos de información
Razonamiento
Objetivos
-
Conocer los conceptos fundamentales del Procesamiento del Lenguaje Natural, las técnicas de procesamiento más relevantes y los recursos existentes utilizados.
Competencias relacionadas: CEA5, CG1, CG3, CEP6, CT4, CT6, -
Conocer las aplicaciones mas importantes del Porcesamiento del Lenguaje Natural y relacionarlas con las teorías, técnicas y recursos más relevantes.
Competencias relacionadas: CEA5, CG1, CG3, CEP6, CT4, CT6, -
Realizar programas para resolver problemas que impliquen el análisis de las técnicas y recursos del Procesamiento del Lenguaje mas apropiados, así como el uso de recursos existentes y el desarrollo de otros nuevos. Uno de estos programas será de mediana envergadura y se realizará en grupos de dos estudiantes.
Competencias relacionadas: CEA5, CG1, CG3, CEP4, CEP6, CEP7, CT3, CT4, CT6, -
Resolver problemas (de forma individual y grupal) en el entorno del Procesamiento del Lenguaje Natural en los que se deba analizar las técnica y los recursos más apropiados para su resolución.
Competencias relacionadas: CEA5, CG1, CG3, CEP7, CT3, CT4, CT6,
Contenidos
-
Estructura e idioma de documento
Selección de zonas textuales, tokenización, separación de oraciones.
Identificadores de idioma -
Palabras
Morfología. Autómatas de estados finitos. Transductores de estados finitos.
Desambiguación morfológica, Modelos ocultos de Markov.
Semántica léxica. Recursos semánticos.
Desambiguación de sentidos de palabras. -
Secuencias de palabras
Reconocimiento y clasificación de secuencias de parabras que formen un significado.
Modelos discriminativos BIO. Conditional Random Fields (CRF).
Reconocimiento y clasificación de entidades nombradas (NERC).
Reconocimiento de frases nominales. -
Oracions
Gramáticas sintácticas, tipología.
Gramáticas libres de contexto.
Gramaticas probabilísticas libres de contexto.
Gramáticas en forma normal de Chomsky.
Analitzadors sintàctics, propietats i estratègies. Analizadores CKY y CKY probabilístico -
Secuencias de oraciones
Resolución de coreferencias. Detección de menciones. Tipos de técnicas de cadenas de menciones de coreferentes. Modelo mención-mención. Modelo entidad-mención. Model de ranking.
Actividades
Actividad Acto evaluativo
Reconocimiento y clasificación de secuencias de parabras que formen un significado.
Modelos discriminativos BIO. Conditional Random Fields (CRF). Reconocimiento y clasificación de entidades nombradas (NERC). Reconocimiento de frases nominales.Objetivos: 4 3 1
Teoría
2h
Problemas
0h
Laboratorio
1h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Presentación de proyectos
Teoría
4h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
40h
Examen final
Semana: 15 (Fuera de horario lectivo)
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
0h
Metodología docente
Las clases están organizadas en sesiones de teoría/problemas y laboratorio.En cada sesión de teoría&problemas se introducirán los nuevos conceptos, problemáticas relacionadas y aproximaciones para resolverlas.Además, se resolverán ejercicios para fijar los conceptos, técnicas y algoritmos explicados.
En las sesiones de laboratorio se desarrollarán pequeñas prácticas utilizando herramientas y lenguajes adecuados al PLN que permitirán practicar y reforzar los conocimientos de las clases de teoría.
Método de evaluación
La evaluación consistirá en un examen final, una proyecto y una entrega por sesión de laboratorio. En el examen final entrará el contenido de todo el curso.La nota de proyecto y de entregas de lab se calculará a partir de los informes presentados por los estudiantes.
El cálculo de la nota final se hará de la siguiente forma:
Nota Final = Nota examen final* 0.5 + Nota de laboratorio * 0.5
Bibliografía
Básico
-
Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition
- Jurafsky, D.; Martin, J.H,
Prentice-Hall, Inc.,
2024.
https://web.stanford.edu/~jurafsky/slp3/ -
The Oxford handbook of computational linguistics
- Mitkov, R. (ed.),
Oxford University Press,
2003.
ISBN: 0198238827
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002689009706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Foundations of statistical natural language processing
- Manning, C.D.; Schütze, H,
MIT Press,
1999.
ISBN: 0262133601
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991001994779706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Handbook of natural language processing
- Dale, R.; Moisl, H.; Somers, H,
Marcel Dekker,
2000.
ISBN: 0824790006
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991002071619706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
The Handbook of Computational Linguistics and Natural Language Processing Blackwell Handbooks in Linguistics
- Clark, Alexander ; Fox, Chris; Lappin, Shalom,
Wiley-Blackwell,
2010.
ISBN: 9781444324044
https://onlinelibrary-wiley-com.recursos.biblioteca.upc.edu/doi/book/10.1002/9781444324044
Web links
- Time table of the course depending on the holidays http://www.cs.upc.edu/~turmo/IHLT.html