Universidad de La Rioja

Anotación sintáctica
GUÍA DOCENTE    Curso 2024-25

Titulación:Máster Universitario en Procesamiento del Lenguaje y Aplicaciones de la Int656M
Asignatura:Anotación sintáctica5284
Materia:Diseño, etiquetado y anotación de corpus
Módulo:Lingüística computacional y procesamiento del lenguaje
Modalidad de enseñanza de la titulación:VirtualCarácter:Obligatoria
Curso:1Créditos ECTS:4,00Duración:Semestral (Primer Semestre)
Horas virtuales sincrónicas:40,00Horas estimadas de trabajo autónomo:60,00
Horas virtuales asincrónicas:0,00 
Idiomas en que se imparte la asignatura:Español
Idiomas del material de lectura o audiovisual:Inglés, Español

Departamentos responsables de la docencia

FILOLOGÍAS MODERNASR107
Dirección:C/ San José de Calasanz, 33Código postal:26004
Localidad:LogroñoProvincia:La Rioja
Teléfono:941299433Fax:941299419Correo electrónico:dpto.dfm@unirioja.es

Profesorado previsto

Profesor:Martín Arista, Francisco J.Responsable de la asignatura
Teléfono:941299425Correo electrónico:javier.martin@unirioja.es
Despacho:108Edificio:FILOLOGÍASTutorías:Consultar

Descripción de los contenidos

-Anotación estructural y funcional
-Anotación de constituyentes
-Recursos informáticos para la anotación
-Automatización

Requisitos previos de conocimientos y competencias para poder cursar con éxito la asignatura

Ninguno especificado.

Competencias

Competencias generales

CG01 - Poseer y comprender conocimientos sobre procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística que aporten una base u oportunidad de ser originales en el desarrollo de soluciones dentro del ámbito de la lingüística computacional
CG02 - Aplicar los conocimientos adquiridos a la resolución de problemas en entornos nuevos o poco conocidos relacionados con las áreas de estudio de lingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística
CG03 - Integrar conocimientos y formular juicios a partir de una información que incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de la lingüística computacional, el procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística
CG04 - Comunicar las conclusiones sobre llingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no especializados de un modo claro y sin ambigüedades
CG05 - Evaluar el progreso del propio aprendizaje de técnicas y recursos de procesamiento del lenguaje natural e inteligencia artificial aplicada a la lingüística

Competencias específicas

CC05 - Aplicar sistemas de anotación sintáctica constitutivos a un corpus lingüístico
CC06 - Distinguir los principios fundamentales en los que se sustenta un sistema de anotación sintáctica constitutivo
CC07 - Implementar las estrategias principales para llevar a cabo anotación sintáctica
CE06 - Comprender la base descriptiva del etiquetado morfológico, así como de la anotación sintáctica y de la anotación semántica
CE07 - Analizar lenguaje natural con categorías y funciones universales de etiquetado y anotación de corpus para la comparación lingu¨ística, la enseñanza y la traducción
CE09 - Comparar modelos, recursos y técnicas de anotación sintáctica, semántica y discursiva de corpus
HD07 - Diseñar sistemas de anotación sintáctica constitutivos
HD08 - Aplicar sistemas de anotación sintáctica constitutivos a corpus con herramientas de distinta naturaleza (automática, semiautomática, manual)
HD09 - Adaptar sistemas de anotación sintáctica constitutivos a la anotación de distintos modelos de lengua

Resultados del aprendizaje

Los resultados de aprendizaje (Conocimientos o contenidos [CC], competencias [CG y CE] y habilidades o destrezas [HD]) se incluyen en el apartado de competencias hasta que se actualice la aplicación informática del Ministerio de Universidades.

Objetivos de desarrollo sostenible

Objetivos de Desarrollo sostenible4 Educación de calidad.5 Igualdad de género.9 Industria, innovación e infraestructura.12 Producción y consumo responsables.

Temario

Bloque 1. Cuestiones computacionales 1. Introducción a Gramáticas Libres de Contexto - Conceptos básicos. 2. Algoritmo CYK para Análisis Sintáctico - Implementación con gramáticas y enfoque probabilístico. 3. Aprendizaje Automático en Sintaxis: Métodos dirigidos por datos. 4. Evaluación de Modelos Sintácticos - Métodos automáticos. 5. Herramientas y Librerías para Análisis Sintáctico ¿ Introducción práctica
Bloque 2. Cuestiones lingüísticas. 1. Anotación de corpus 2. Anotación sintáctica 3. Anotación sintáctica de corpus orales: estudio de caso.

Bibliografía

Tipo:Título
BásicaJurafsky, Daniel / James H. Martin (2022): Speech and Language Processing, London: Pearson, 20082.
BásicaManning, Christopher D. / Hinrich Schutze (1999): Foundations of statistical natural language processing, Cambridge, Massachusetts: The MIT Press.
BásicaReal Academia Española (2009): Nueva gramática de la lengua española. Morfología y sintaxis, Madrid: Espasa Calpe.
BásicaReal Academia Española (2010): Nueva gramática de la lengua española. Manual, Madrid: Espasa Calpe.
BásicaRojo, Guillermo (1983): Aspectos básicos de sintaxis funcional. Ed. Ágora: Málaga. https://gramatica.usc.es/~grojo/Publicaciones/Aspectos_basicos_de_sintaxis_funcional.pdf
BásicaRojo, Guillermo / Tomás Jiménez Juliá (1989): Fundamentos del análisis sintáctico funcional. Universidad de Santiago de Compostela: Santiago de Compostela. https://gramatica.usc.es/~grojo/Publicaciones/Fundamentos_analisis_sintactico_funcional.pdf
BásicaMartí, M. Antònia, Mariona Taulé (2022), ¿Desarrollos tecnológicos de la lingüística de corpus en español¿ en Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe (eds.): Lingüística de corpus en español/The Routledge Handbook of Spanish Corpus Linguistics, Ro
BásicaGómez-Rodríguez, Carlos / David Vilares (2018): ¿Constituent Parsing as Sequence Labeling¿,. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. Brussels, Belgium. Association for Computational Linguistics, pp. 1314¿132
BásicaSantalla del Río, M.ª Paula e Eva M.ª Domínguez Noya (2020): ¿Las construcciones comparativas en corpus del español sintácticamente anotados¿ en Nowikow W., López González A.M., Pawlikowska M., Baran M., Sobczak W. (red.): Lingüística hispánica teórica y a
BásicaSantalla del Río, M.ª Paula y Eva M.ª Domínguez Noya (2022): ¿De un sistema de anotación sintáctica para lengua escrita a otro para lengua oral¿. e-AESLA 7, 2021, pp. 83-100. https://cvc.cervantes.es/lengua/eaesla/pdf/07/06.pdf
ComplementariaCivit, Montserrat, M. Antònia Martí y Nuria Bufí. (2006): ¿Cat3LB and Cast3LB: From Constituents to Dependencies¿. International Conference on Natural Language Processing (in Finland), Berlin, Heidelberg: Springer, pp: 141¿152.
ComplementariaDomínguez Noya, Eva M.ª y M.ª Paula Santalla del Río (2022): «Excepto, incluso: estructuras no predicativas delimitativas en CSA y otros corpus del español sintácticamente anotados», en Raúl Fernández, Jódar / Joanna Nowak-Michalska / Xavier Pascual López
ComplementariaLiu, Jiangming / Yue Zhang (2017): ¿In-Order Transition-based Constituent Parsing¿. Transactions of the Association for Computational Linguistics, 5, pp. 413¿424.
ComplementariaMartí, M. Antònia, Mariona Taulé (2023): ¿Análisis morfosintáctico y sintáctico automático¿ en Guillermo Rojo, Victoria Vázquez Rozas, Rena Torres Cacoullos (eds.), Sintaxis del español/The Routledge Handbook of Spanish Syntax, Routledge Spanish Language H
ComplementariaNivre, Joakim, Marie-Catherine de Marneffe, Filip Ginter, Yoav Goldberg, Jan Hajic, Christopher D. Manning, Ryan McDonald, Slav Petrov, Sampo Pyysalo, Natalia Silveira, Reut Tsarfaty y Daniel Zeman (2016): ¿Universal Dependencies v1: A Multilingual Treeban
ComplementariaNivre, Joakim, Marie-Catherine de Marneffe, Filip Ginter, Jan Hajic, Christopher D. Manning, Sampo Pyysalo, Natalia Silveira, Reut Tsarfaty y Daniel Zeman (2020): ¿Universal Dependencies (v2): Evergoing Multilingual Treebank Collection¿. Language Resources
ComplementariaKitaev, Nikita / Dan Klein (2018): ¿Constituency Parsing with a Self-Attentive Encoder¿. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), Melbourne, Australia. Association for Computational
ComplementariaSánchez Lancis, Carlos Eliseo (2023): ¿Corpus para el estudio de la sintaxis del español¿ en Guillermo Rojo, Victoria Vázquez Rozas, Rena Torres Cacoullos (eds.), Sintaxis del español/The Routledge Handbook of Spanish Syntax, Routledge Spanish Language Ha
ComplementariaTaulé, Mariona, M. Antònia Martí y Marta Recasens (2008): ¿Ancora: Multilevel Annotated Corpora for Catalan and Spanish¿. Proceedings of 6th International Conference on Language Resources and Evaluation, Marrakech, pp. 96¿101.
ComplementariaVinyals, Oriol / Lukasz Kaiser / Terry Koo / Slav Petrov / Ilya Sutskever / Geoffrey Hinton (2015): ¿Grammar as a foreign language¿. Advances in neural information processing systems, 28.
Recursos en Internet
Demo de parsers
      https://parser.kitaev.io/
Librerías de PLN con soporte de análisis sintáctico de constituyentes
      https://stanfordnlp.github.io/stanza/
Librerías de PLN con soporte de análisis sintáctico de constituyentes
      https://spacy.io/
Corpus y bases de datos sintácticos
      http://clic.ub.edu/corpus/es
CSA - Corpus sintácticamente analizado
      http://galvan.usc.es/drasae
UAM Spanish Treebank (UAM)
      http://www.lllf.uam.es/ESP/Treebank.html
IULA Spanish LSP Treebank (LSP)
      http://www.iula.upf.edu/recurs01_tbk_uk.htm
Visual Interactive Syntax Learning
      https://edu.visl.dk/
Universal dependencies
      https://universaldependencies.org/

Metodología

Modalidades organizativas

Clases teóricas
Seminarios y talleres
Clases prácticas
Estudio y trabajo en grupo
Estudio y trabajo autónomo individual

Métodos de enseñanza

Método expositivo - Lección magistral
Estudio de casos
Resolución de ejercicios y problemas
Aprendizaje basado en problemas
Aprendizaje orientado a proyectos
Aprendizaje cooperativo

Organización

Actividades dirigidasTamaño
de grupo
Horas
virtuales
sincrónicas
Horas
virtuales
asincrónicas
Horas
totales
Clases teóricasGrande15,00 15,00
Seminarios y talleresReducido5,00 5,00
Clases prácticasReducido20,00 20,00
Total de horas de actividades dirigidas40,00
Trabajo autónomo del estudianteHoras
Estudio y trabajo autónomo individual60,00
Total de horas de trabajo autónomo60,00
Total de horas100,00

Evaluación

Sistema de evaluaciónRecuperableNo Recup.
Trabajos y proyectos100%
Total100%

Comentarios

En lo relativo a la realización fraudulenta de pruebas de evaluación, se atenderá a lo establecido en el artículo 20 del Reglamento de docencia y evaluación del aprendizaje en las asignaturas de grado y máster de la Universidad de La Rioja.

Versión: 14/06/2024 10:30:29 - G 2024-25 - 656M - 5284 - Impresión: 16/11/2025 00:55:28