Introducción a la Lingüística Cuantitativa

Usted está aquí

Créditos
6
Tipos
  • MIRI: Optativa
  • MDS: Optativa
  • MEI: Optativa
Requisitos
Esta asignatura no tiene requisitos, pero tiene capacidades previas
Departamento
CS
La lingüística cuantitativa es una rama de la lingüística que se ocupa principalmente de los patrones estadísticos del lenguaje (las llamadas leyes lingüísticas), su explicación y construcción de teorías. El curso es relevante para cualquier persona interesada en cómo son las lenguas (y la comunicación animal) y por qué. Este curso abarca una muchedumbre de leyes estadísticas del lenguaje (más allá del alcance de los cursos tradicionales sobre recuperación de información o procesamiento del lenguaje natural), como analizarlas y sus orígenes. hablantes u oyentes. Este curso pone énfasis en las posibles explicaciones en términos de principios generales de la cognición en humanos y otras especies. El curso cubre los modelos matemáticos y computacionales desarrollados para explicar estas regularidades. Durante este viaje, los estudiantes enriquecerán sus conocimientos actuales con conceptos y herramientas de la lingüística, la biología, la ciencia cognitiva, la teoría de la información y la física multidisciplinar bajo la vista de pájaro de la filosofía de la ciencia. El curso es relevante para investigadores interesados ¿¿en procesar datos lingüísticos, así como propiedades estadísticas reales del lenguaje y la teoría subyacente. Dado que estas regularidades son a menudo el resultado de la reducción del esfuerzo cognitivo de los usuarios del lenguaje, el curso también es relevante para investigadores interesados ¿¿en desarrollar recursos o sistemas que sean más fáciles de utilizar o entender por los humanos o interesados ¿¿en desarrollar herramientas de procesamiento del lenguaje que aprovechen las limitaciones reales del cerebro humano.

Profesorado

Responsable

  • Ramon Ferrer Cancho ( )

Horas semanales

Teoría
2.5
Problemas
0.5
Laboratorio
1
Aprendizaje dirigido
0
Aprendizaje autónomo
7.11

Objetivos

  1. Conocer los fundamentos de la ciencia y el método científico. Entender la diferencia entre hipótesis y teoría, entre modelar y comprender, entre describir y explicar, entre manifestación y principio. Entender el valor de la predicción y los tipos de predicción.
    Competencias relacionadas: CTR6,
  2. Conocer las leyes estadísticas del lenguaje y entender sus orígenes
    Competencias relacionadas: CTR4, CTR6, CTR7,
  3. Conocer y entender los principios de organización de las lenguas y otros sistemas de comunicación
    Competencias relacionadas: CTR6, CTR7,
  4. Conocer los fundamentos matemáticos de la lingística cuantitativa. Conocer teoría de probabilidad básica y teoría de la información.
    Competencias relacionadas: CTR6, CTR7,
  5. Conocer los métodos de análisis estadístico de la lingüística cuantitativa.
    Competencias relacionadas: CTR4,
  6. Aprender a redactar un artículo científico. Saber distinguir entre un informe de laboratorio y un artículo de investigación. Aprender a redactar un artículo científico en equipo.
    Competencias relacionadas: CTR3, CTR4, CTR6, CTR7, CTR9,

Contenidos

  1. Introducció a la Lingüística Cuantitativa
    ¿Qué es la lingüística cuantitativa? Panorámica de leyes lingüísticas, conceptos clave y problemas de investigación en lingística cuantitativa.
  2. Ley de brevedad y problema de la compresión
    La ley de brevedad en humanos y otras especies. Métodos de análisis de la ley de brevedad. Introducción a la teoría de la información. Predicciones de la codificación óptima.
  3. Teoria de la información
    Teoría de la información clásica y extensiones para sistemas de comunicación naturales.
  4. Teoría de leyes potenciales
    Relaciones entre potenciales leyes. Deducción de leyes potenciales. Métodos de análisis de leyes potenciales.
  5. Modelos de la ley de Zipf para la frecuencia de las palabras
    Cotas de Debowski. Modelos clásicos. Modelos zipfianos de optimización de la comunicación.
  6. La estructura estadística de las secuencias simbólicas
    Retorno de palabras. Correlaciones en secuencias simbólicas. Persistencia y antipersistencia. Modelos basados ¿¿en n-gramas. Modelos generativos.
  7. Sintaxis de dependencias
    Introducción a la sintaxis de dependencias. Restricciones formales sobre estructuras de dependencias sintácticas
  8. Teoría de orden de las palabras.
    Principios de orden de las palabras. Predicciones. Orden de sujeto (S), complemento directo (O) y verbo (V).
  9. Construcción de teoría
    El método científico. Un teoria general. Cierre

Actividades

Actividad Acto evaluativo


Introducció

Introducció a la lingüística quantitativa. Introducció a l'assignatura
Objetivos: 1 2
Contenidos:
Teoría
3h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.3h

Ley de brevedad y el problema de la compresión


Objetivos: 4 5
Contenidos:
Teoría
3.8h
Problemas
1h
Laboratorio
3.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
6.7h

Teoria de la información


Objetivos: 3 4
Teoría
4h
Problemas
1h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

Teoría de leyes potenciales


Objetivos: 2 4
Contenidos:
Teoría
4h
Problemas
1h
Laboratorio
3.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

Modelos de la ley de Zipf para la frecuencia de las palabras


Objetivos: 1 2 3 4
Contenidos:
Teoría
4h
Problemas
0.8h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

La estructura estadística de las secuencias simbólicas


Objetivos: 2 3 4 5
Contenidos:
Teoría
4h
Problemas
1h
Laboratorio
3h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

Sintaxis de dependencias


Objetivos: 2 5
Contenidos:
Teoría
4h
Problemas
1h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

Teoría de orden de las palabras


Objetivos: 3 4 5
Contenidos:
Teoría
4h
Problemas
1h
Laboratorio
3.5h
Aprendizaje dirigido
0h
Aprendizaje autónomo
7.1h

Construcción de teoría


Objetivos: 1 3
Contenidos:
Teoría
3h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
5.3h

Proyecto de investigación


Objetivos: 1 2 3 4 5 6
Teoría
0h
Problemas
0h
Laboratorio
0h
Aprendizaje dirigido
0h
Aprendizaje autónomo
36h

Metodología docente

Las sesiones de teoría las llevará a cabo principalmente el profesor, ya sea mediante la pizarra o proyectando diapositivas.

El trabajo de laboratorio se realizará delante del ordenador. Se espera que los estudiantes trabajen en sus deberes y el profesor explicará todo lo necesario para seguir la clase al principio de la sesión. Cada sesión de laboratorio irá acompañada de una guía completa que describirá el trabajo a realizar.

El proyecto de investigación se realizará bajo la supervisión del profesor.

Todo el material relevante para el curso estará disponible en el Racó o en el sitio web del curso.

Método de evaluación

La calificación se realiza mediante exámenes e informes sobre diversas tareas (prácticas de laboratorio y un proyecto de investigación) a lo largo del curso.

Habrá dos exámenes parciales que cuenten con un 30% de la nota. Se espera que los estudiantes entreguen 4 informes de trabajos de laboratorio aproximadamente dos semanas después de la sesión de laboratorio correspondiente, que cuenten hasta el 30% de la nota final. Por último, los estudiantes tendrán que entregar un proyecto de investigación al final del curso que representa el 40% de la nota final. El proyecto de investigación es la actividad más importante y debe entenderse como un proyecto del curso (no como una práctica más). Es necesario entender las prácticas como un entrenamiento para el proyecto de investigación.

Por tanto, la fórmula para calcular la nota final es:

0,3* (P1 + P2) + 0,3* (L1 + L2 + L3 + L4) + 0,4 * CP

donde P1 es la nota del primer examen parcial, P2 es la nota del segundo examen parcial, Le corresponde a la nota de la i-ésima práctica de laboratorio y RP es la nota del proyecto de investigación.

Bibliografía

Básica:

Complementaria:

Web links

Capacidades previas

Programación
Probabilidad y estadística básicas