Universidad de La Rioja

Etiquetado POS y lematización
GUÍA DOCENTE    Curso 2024-25

Titulación:Máster Universitario en Procesamiento del Lenguaje y Aplicaciones de la Int656M
Asignatura:Etiquetado POS y lematización5283
Materia:Diseño, etiquetado y anotación de corpus
Módulo:Lingüística computacional y procesamiento del lenguaje
Modalidad de enseñanza de la titulación:VirtualCarácter:Obligatoria
Curso:1Créditos ECTS:4,00Duración:Semestral (Primer Semestre)
Horas virtuales sincrónicas:40,00Horas estimadas de trabajo autónomo:60,00
Horas virtuales asincrónicas:0,00 
Idiomas en que se imparte la asignatura:Español
Idiomas del material de lectura o audiovisual:Inglés, Español

Departamentos responsables de la docencia

FILOLOGÍAS HISPÁNICA Y CLÁSICASR106
Dirección:C/ San José de Calasanz, 33Código postal:26004
Localidad:LogroñoProvincia:La Rioja
Teléfono:941299410Fax:941299419Correo electrónico:dpto.dfhc@unirioja.es
FILOLOGÍAS MODERNASR107
Dirección:C/ San José de Calasanz, 33Código postal:26004
Localidad:LogroñoProvincia:La Rioja
Teléfono:941299433Fax:941299419Correo electrónico:dpto.dfm@unirioja.es

Profesorado previsto

Profesor:Mateo Mendaza, RaquelResponsable de la asignatura
Teléfono:941299416Correo electrónico:raquel.mateo@unirioja.es
Despacho:107Edificio:FILOLOGÍASTutorías:Consultar
Profesor:García Andreva, Fernando
Teléfono:941299406Correo electrónico:fernando.garciaan@unirioja.es
Despacho:301Edificio:FILOLOGÍASTutorías:Consultar

Descripción de los contenidos

-Tokenización
-Etiquetado POS
-Técnicas de lematización para el etiquetado
-Técnicas de desambiguación para el etiquetado
-Recursos informáticos para la anotación
-Automatización

Requisitos previos de conocimientos y competencias para poder cursar con éxito la asignatura

Ninguno especificado.

Competencias

Competencias generales

CG01 - Poseer y comprender conocimientos sobre procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística que aporten una base u oportunidad de ser originales en el desarrollo de soluciones dentro del ámbito de la lingüística computacional
CG02 - Aplicar los conocimientos adquiridos a la resolución de problemas en entornos nuevos o poco conocidos relacionados con las áreas de estudio de lingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística
CG03 - Integrar conocimientos y formular juicios a partir de una información que incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de la lingüística computacional, el procesamiento del lenguaje natural y aplicaciones de
la inteligencia artificial a la lingüística
CG04 - Comunicar las conclusiones sobre llingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no
especializados de un modo claro y sin ambigüedades
CG05 - Evaluar el progreso del propio aprendizaje de técnicas y recursos de procesamiento del lenguaje natural e inteligencia artificial aplicada a la lingüística

Competencias específicas

CC04 - Categorizar las unidades de análisis de un corpus lingüístico pertenecientes al nivel de la palabra por parte de la oración y lema
CC03 - Estructurar un corpus lingu¨ístico en unidades de análisis de nivel texto, fragmento, oración o palabra
CC38 - Comparar distintas técnicas de desambiguación para el etiquetado de corpus
CC39 - Comparar distintas técnicas de lematización para el etiquetado de corpus
CE06 - Comprender la base descriptiva del etiquetado morfológico, así como de la anotación sintáctica y de la anotación semántica
CE07 - Analizar lenguaje natural con categorías y funciones universales de etiquetado y anotación de corpus para la comparación lingüística, la enseñanza y la traducción
CE08 - Comparar modelos, recursos y técnicas de etiquetado morfológico de corpus
CE09 - Comparar modelos, recursos y técnicas de anotación sintáctica, semántica y discursiva de corpus
HD03 - Tokenizar un corpus
HD04 - Etiquetar un corpus con partes de la oración
HD05 - Lematizar las formas de un corpus
HD06 - Desambiguar etiquetado POS y lematización

Resultados del aprendizaje

Los resultados de aprendizaje (Conocimientos o contenidos [CC], competencias [CG y CE] y habilidades o destrezas [HD]) se incluyen en el apartado de competencias hasta que se actualice la aplicación informática del Ministerio de Universidades.

Objetivos de desarrollo sostenible

Objetivos de Desarrollo sostenible4 Educación de calidad.5 Igualdad de género.9 Industria, innovación e infraestructura.12 Producción y consumo responsables.

Temario

1. Introducción al Procesamiento del Lenguaje Natural
2. Anotación textual
3. Anotación morfológica
4. Anotación morfológica vs. POS tagging
5. Anotación POS automática
6. Programas y bibliotecas para POS tagging

Bibliografía

Tipo:Título
BásicaMolina Mejía, J.M. 2021. Lingüística computacional y de corpus. Teorías, métodos y aplicaciones. Editorial Universidad de Antioquia. ISBN: 9585010399
BásicaDash, N. S. 2021. Language Corpora Annotation and Processing. Springer Absys Biba
BásicaSierra Martínez, G. E. 2017. Introducción a los corpus lingüísticos. México, Universidad Nacional Autónoma de México. ISBN: 978-607-029-898-1.
ComplementariaCahill, L. 2017. Computational Morphology. In A. Hippisley & G. Stump (Eds.), The Cambridge Handbook of Morphology. Cambridge University Press. Absys Biba
ComplementariaIde, N. & J. Pustejovsky (Eds.). 2017. Handbook of Linguistic Annotation. Springer. ISBN 978-94-024-0879-9
ComplementariaLüdeling, A. and M. Kytö (Eds.). 2008. Corpus Linguistics: An International Handbook. Volume 1. de Gruyter Absys Biba
ComplementariaMarín Gálvez, R. 2009. El tratamiento computacional del léxico y sus aplicaciones. En Elena de Miguel Aparicio, Panorama de la lexicología. Pags 465-485. Absys Biba
ComplementariaMoreno Sandoval, A. 1998. Lingüística computacional: introducción a los modelos simbólicos, estadísticos y biológicos Síntesis Absys Biba
ComplementariaNugues, P. M. 2014. Language Processing with Perl and Prolog. Theories, Implementation, and Application. Springer. ISBN-13: 978-3-642-41464-0
ComplementariaGonzález, M., S. S. Reyes, A. Rodrigo & M. Silberztein. 2022. Formalizing Natural Languages: Applications to Natural Language Processing and Digital Humanities. 16th International Conference, NooJ 2022, Rosario, Argentina, Absys Biba
ComplementariaPiotrowski, M. 2022. Natural Language Processing for Historical Texts. Springer Absys Biba
ComplementariaLu, X. 2014. Computational Methods for Corpus Annotation and Analysis. Springer Absys Biba
Recursos en Internet

Metodología

Modalidades organizativas

Clases teóricas
Seminarios y talleres
Clases prácticas
Estudio y trabajo en grupo
Estudio y trabajo autónomo individual

Métodos de enseñanza

Método expositivo - Lección magistral
Estudio de casos
Resolución de ejercicios y problemas
Aprendizaje basado en problemas
Aprendizaje orientado a proyectos
Aprendizaje cooperativo

Organización

Actividades dirigidasTamaño
de grupo
Horas
virtuales
sincrónicas
Horas
virtuales
asincrónicas
Horas
totales
Clases teóricasGrande15,00 15,00
Seminarios y talleresReducido5,00 5,00
Clases prácticasReducido20,00 20,00
Total de horas de actividades dirigidas40,00
Trabajo autónomo del estudianteHoras
Estudio y trabajo autónomo individual60,00
Total de horas de trabajo autónomo60,00
Total de horas100,00

Evaluación

Sistema de evaluaciónRecuperableNo Recup.
Trabajos y proyectos70%30%
Total100%

Comentarios

La nota obtenida en las pruebas no recuperables que se realicen durante el periodo de impartición de la asignatura se guardará para la convocatoria extraordinaria.
En lo relativo a la realización fraudulenta de pruebas de evaluación, se atenderá a lo establecido en el artículo 20 del Reglamento de docencia y evaluación del aprendizaje en las asignaturas de grado y máster de la Universidad de La Rioja.

Versión: 14/06/2024 10:30:29 - G 2024-25 - 656M - 5283 - Impresión: 15/11/2025 16:51:05