Lingüistica y Tecnologías

Máster. Curso 2024/2025.

TECNOLOGÍAS DEL HABLA Y DEL TEXTO - 609856

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Específicas
CE5. Capacidad para utilizar con suficiente destreza los principales paquetes de programación para resolver tareas de procesamiento del lenguaje natural (texto o voz).
CE6. Desarrollar una visión amplia y estructurada de la diversidad de las lenguas y ser capaz al mismo tiempo de identificar los patrones comunes a los diversos sistemas lingüísticos.
CE7. Capacidad de comprender y emplear los términos y los principios metodológicos de la tipología, así como las bases teóricas de las principales hipótesis tipológicas.

ACTIVIDADES DOCENTES

Otras actividades
- Visionado de vídeo/audiolecciones y sesiones síncronas o asíncronas
- Estudio individual del material básico
- Lectura y análisis de material complementario
- Resolución de casos prácticos
- Cuestionarios de autoevaluación
- Comunicación virtual con el profesor
- Foros y comunicación colaborativa
- Seminarios presenciales
- Realización y presentación de un proyecto

Semestre

1

Breve descriptor:

La asignatura ofrece una formación teórico-práctica en tecnologías del habla y del texto, orientada a la construcción y explotación de recursos lingüísticos principalmente, los corpus del habla y del texto, planos y etiquetados que constituyen muestras del habla o del texto, la conversión del habla a texto. Para la explotación de los recursos lingüísticos se aprenderá a utilizar herramientas software. Se utilizarán fundamentos estadísticos para el análisis de muestras lingüísticas textuales, orales y escritas. La asignatura se organiza en dos partes diferenciadas, las tecnologías del texto y las tecnologías del habla.

Requisitos

Conocimientos y/o destrezas previas recomendadas
- conocimientos de lenguajes de marcado y tecnologías web
- conocimientos básicos de estadística
- capacidad de autoaprendizaje y planificación
- capacidad de trabajar en equipo
- capacidad crítica
- capacidad de aprender del error
- un nivel de inglés que permita la lectura de bibliografía en dicha lengua
- capacidad para desenvolverse con soltura en un entorno informático

Objetivos

El objetivo fundamental de la asignatura es adquirir los conocimientos teóricos y prácticos para la construcción, evaluación y análisis de muestras de habla y texto (corpus) 

El objetivo principal se desgrana en los siguientes objetivos parciales:

1. Conocer y aplicar los conceptos estadísticos necesarios para analizar muestras lingüísticas de habla o texto

2. Identificar, distinguir y aplicar lenguajes estándares de etiquetado a la descripción de muestras lingüísticas de habla o texto

3. Demostrar capacidad para segmentar y etiquetar adecuadamente muestras lingüísticas de habla o texto

4. Saber analizar muestras lingüísticas de habla o texto 

5. Desenvolverse con soltura a la hora de buscar, identificar y aplicar las herramientas de software adecuadas a un estudio acústico del habla o un estudio lingüístico del habla o texto

6. Ser capaz de crear, consultar y evaluar corpus lingüísticos de habla o texto

7. Saber convertir habla a texto con la ayuda de herramientas de software

8. Saber automatizar el análisis acústico de muestras de habla

Contenido

Introducción a la herramienta Sktech Engine

Principios para la construcción de un corpus.

Explorar el contenido del corpus

Anotación de corpus. Creación y uso de corpus anotados en SketchEngine. 

Los tipos corpus de Sketch Engine

Creación de recursos lingüísticos con SketchEngine

Manejo de Praat 

Interpretación de espectogramas y segmentación

Automatización del análisis acustico





Evaluación

La asignatura se evaluará en dos partes, evaluación de tecnologías del texto y evaluación de tecnologías del habla. Para aprobar la asignatura es imprescindible aprobar cada parte. La calificación final será la media aritmética de las dos partes.
Si se suspende en la convocatoria ordinaria, en la convocatoria extraordinaria el alumno puede elegir presentarse sólo a la parte que ha suspendido o a las dos partes, en cuyo caso se asume que renuncia a la nota que ha obtenido previamente.

Cada parte de la asignatura se evaluará de la forma siguiente:
- Evaluación continua: tiene un peso del 50% de la nota final. Se calculará como la media aritmética de todas las actividades evaluables
- Examen final: tiene un peso del 50% de la nota final. Es imprescindible aprobar el examen final para poder aprobar la asignatura


Actos fraudulentos:
"La realización de una actividad evaluable (e.g. examen, trabajo, práctica) supone la aceptación del Código de Conducta Complutense sobre Responsabilidad y Honestidad intelectual (https://www.ucm.es/medicinatraslacional/file/codigo-de-conducta-complutense?ver). La detección de actos fraudulentos (e.g. suplantación, plagio, generación de documentación falsa en actos académicos) se someterá a los procedimientos de disciplina universitaria previstos académicamente y reconocidos como falta grave."

Bibliografía

Arias, I., Fernández-Pampillón, A., Samy, D., & Arús, J. (2020). Taller sobre herramientas de análisis textual: La herramienta Sketch Engine. E-Prints Complutense. https://eprints.ucm.es/id/eprint/13796/21/Taller de Sketch Engine - Completo - 26-05-2020.pdf.
Ashby, P. (2011). Understanding phonetics. Hodder Education, Hachette Livre UK.
Benus, S. (2021) Investigating Spoken English. A Practical Guide to Phonetics and Phonology Using Praat. Palgrave Macmillan.
Burnard, L. (2005). Metadata for corpus work, in M. Wynne (ed.) Developing Linguistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books, pp. 30–46.
Clegg, J.H., & Fails, W.C. (2017). Manual de fonética y fonología españolas. Routledge.
Hayward, K. (2014). Experimental phonetics. Routledge.
Hualde, J.I. (2014). Los sonidos del español. Cambridge
Leech, G. (2005). Adding Linguistic Annotation, in M. Wynne (ed.) Developing Linguistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books, pp. 17–29.
Parodi, G. (2008). Lingüística de corpus: una introducción al ámbito. RLA. Revista de lingüística teórica y aplicada, 46(1), 93-119.
Pavel, M., & Skarnitz, R. (2009). Principles of Phonetic Segmentation. Epocha Publishing House.
Sinclair, J. (2005) Corpus and Text - Basic Principles, in M. Wynne (ed.) Developing Linguistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books, pp. 1–16.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo T12/09/2024 - 13/12/2024VIERNES 15:00 - 16:00AULA VIRTUALANA MARIA FERNANDEZ-PAMPILLON CESTEROS
MANUEL MARQUEZ CRUZ
MIGUEL JIMENEZ BRAVO BONILLA