La lingüística cuantitativa es una rama de la lingüística que se ocupa principalmente de los patrones estadísticos del lenguaje (las llamadas leyes lingüísticas), su explicación y construcción de teorías. El curso es relevante para cualquier persona interesada en cómo son las lenguas (y la comunicación animal) y por qué. Este curso abarca una muchedumbre de leyes estadísticas del lenguaje (más allá del alcance de los cursos tradicionales sobre recuperación de información o procesamiento del lenguaje natural), como analizarlas y sus orígenes. hablantes u oyentes. Este curso pone énfasis en las posibles explicaciones en términos de principios generales de la cognición en humanos y otras especies. El curso cubre los modelos matemáticos y computacionales desarrollados para explicar estas regularidades. Durante este viaje, los estudiantes enriquecerán sus conocimientos actuales con conceptos y herramientas de la lingüística, la biología, la ciencia cognitiva, la teoría de la información y la física multidisciplinar bajo la vista de pájaro de la filosofía de la ciencia. El curso es relevante para investigadores interesados ¿¿en procesar datos lingüísticos, así como propiedades estadísticas reales del lenguaje y la teoría subyacente. Dado que estas regularidades son a menudo el resultado de la reducción del esfuerzo cognitivo de los usuarios del lenguaje, el curso también es relevante para investigadores interesados ¿¿en desarrollar recursos o sistemas que sean más fáciles de utilizar o entender por los humanos o interesados ¿¿en desarrollar herramientas de procesamiento del lenguaje que aprovechen las limitaciones reales del cerebro humano.
Profesorado
Responsable
Ramon Ferrer Cancho (
)
Horas semanales
Teoría
2.5
Problemas
0.5
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
7.11
Objetivos
Conocer los fundamentos de la ciencia y el método científico. Entender la diferencia entre hipótesis y teoría, entre modelar y comprender, entre describir y explicar, entre manifestación y principio. Entender el valor de la predicción y los tipos de predicción.
Competencias relacionadas:
CTR6,
Conocer las leyes estadísticas del lenguaje y entender sus orígenes
Competencias relacionadas:
CTR4,
CTR6,
CTR7,
Conocer y entender los principios de organización de las lenguas y otros sistemas de comunicación
Competencias relacionadas:
CTR6,
CTR7,
Conocer los fundamentos matemáticos de la lingística cuantitativa. Conocer teoría de probabilidad básica y teoría de la información.
Competencias relacionadas:
CTR6,
CTR7,
Conocer los métodos de análisis estadístico de la lingüística cuantitativa.
Competencias relacionadas:
CTR4,
Aprender a redactar un artículo científico. Saber distinguir entre un informe de laboratorio y un artículo de investigación. Aprender a redactar un artículo científico en equipo.
Competencias relacionadas:
CTR3,
CTR4,
CTR6,
CTR7,
CTR9,
Contenidos
Introducció a la Lingüística Cuantitativa
¿Qué es la lingüística cuantitativa? Panorámica de leyes lingüísticas, conceptos clave y problemas de investigación en lingística cuantitativa.
Ley de brevedad y problema de la compresión
La ley de brevedad en humanos y otras especies. Métodos de análisis de la ley de brevedad. Introducción a la teoría de la información. Predicciones de la codificación óptima.
Teoria de la información
Teoría de la información clásica y extensiones para sistemas de comunicación naturales.
Teoría de leyes potenciales
Relaciones entre potenciales leyes. Deducción de leyes potenciales. Métodos de análisis de leyes potenciales.
Modelos de la ley de Zipf para la frecuencia de las palabras
Cotas de Debowski. Modelos clásicos. Modelos zipfianos de optimización de la comunicación.
La estructura estadística de las secuencias simbólicas
Retorno de palabras. Correlaciones en secuencias simbólicas. Persistencia y antipersistencia. Modelos basados ¿¿en n-gramas. Modelos generativos.
Sintaxis de dependencias
Introducción a la sintaxis de dependencias. Restricciones formales sobre estructuras de dependencias sintácticas
Teoría de orden de las palabras.
Principios de orden de las palabras. Predicciones. Orden de sujeto (S), complemento directo (O) y verbo (V).
Construcción de teoría
El método científico. Un teoria general. Cierre
Actividades
ActividadActo evaluativo
Introducció
Introducció a la lingüística quantitativa. Introducció a l'assignatura Objetivos:12 Contenidos:
Las sesiones de teoría las llevará a cabo principalmente el profesor, ya sea mediante la pizarra o proyectando diapositivas.
El trabajo de laboratorio se realizará delante del ordenador. Se espera que los estudiantes trabajen en sus deberes y el profesor explicará todo lo necesario para seguir la clase al principio de la sesión. Cada sesión de laboratorio irá acompañada de una guía completa que describirá el trabajo a realizar.
El proyecto de investigación se realizará bajo la supervisión del profesor.
Todo el material relevante para el curso estará disponible en el Racó o en el sitio web del curso.
Método de evaluación
La calificación se realiza mediante exámenes e informes sobre diversas tareas (prácticas de laboratorio y un proyecto de investigación) a lo largo del curso.
Habrá dos exámenes parciales que cuenten con un 30% de la nota. Se espera que los estudiantes entreguen 4 informes de trabajos de laboratorio aproximadamente dos semanas después de la sesión de laboratorio correspondiente, que cuenten hasta el 30% de la nota final. Por último, los estudiantes tendrán que entregar un proyecto de investigación al final del curso que representa el 40% de la nota final. El proyecto de investigación es la actividad más importante y debe entenderse como un proyecto del curso (no como una práctica más). Es necesario entender las prácticas como un entrenamiento para el proyecto de investigación.
Por tanto, la fórmula para calcular la nota final es:
donde P1 es la nota del primer examen parcial, P2 es la nota del segundo examen parcial, Le corresponde a la nota de la i-ésima práctica de laboratorio y RP es la nota del proyecto de investigación.
Information theory meets power laws: Stochastic processes and language models -
Debowski, Lukasz, Wiley ,
2021.
Web links
Laws of language outside human language. Statistical laws of language in the behavior of other species, genomes and beyond https://cqllab.upc.edu/biblio/laws/