Etiquetado POS y lematización
GUÍA DOCENTE Curso 2024-25
| Titulación: | Máster Universitario en Procesamiento del Lenguaje y Aplicaciones de la Int | 656M |
| Asignatura: | Etiquetado POS y lematización | 5283 |
| Materia: | Diseño, etiquetado y anotación de corpus |
| Módulo: | Lingüística computacional y procesamiento del lenguaje |
| Modalidad de enseñanza de la titulación: | Virtual | Carácter: | Obligatoria |
| Curso: | 1 | Créditos ECTS: | 4,00 | Duración: | Semestral (Primer Semestre) |
| Horas virtuales sincrónicas: | 40,00 | Horas estimadas de trabajo autónomo: | 60,00 |
| Horas virtuales asincrónicas: | 0,00 | |
| Idiomas en que se imparte la asignatura: | Español |
| Idiomas del material de lectura o audiovisual: | Inglés, Español |
Departamentos responsables de la docencia
| FILOLOGÍAS HISPÁNICA Y CLÁSICAS | R106 |
| Dirección: | C/ San José de Calasanz, 33 | Código postal: | 26004 |
| Localidad: | Logroño | Provincia: | La Rioja |
| Teléfono: | 941299410 | Fax: | 941299419 | Correo electrónico: | dpto.dfhc@unirioja.es |
| FILOLOGÍAS MODERNAS | R107 |
| Dirección: | C/ San José de Calasanz, 33 | Código postal: | 26004 |
| Localidad: | Logroño | Provincia: | La Rioja |
| Teléfono: | 941299433 | Fax: | 941299419 | Correo electrónico: | dpto.dfm@unirioja.es |
Profesorado previsto
| Profesor: | Mateo Mendaza, Raquel | Responsable de la asignatura |
| Teléfono: | 941299416 | Correo electrónico: | raquel.mateo@unirioja.es |
| Despacho: | 107 | Edificio: | FILOLOGÍAS | Tutorías: | Consultar |
| Profesor: | García Andreva, Fernando |
| Teléfono: | 941299406 | Correo electrónico: | fernando.garciaan@unirioja.es |
| Despacho: | 301 | Edificio: | FILOLOGÍAS | Tutorías: | Consultar |
Descripción de los contenidos
-Tokenización
-Etiquetado POS
-Técnicas de lematización para el etiquetado
-Técnicas de desambiguación para el etiquetado
-Recursos informáticos para la anotación
-Automatización
Requisitos previos de conocimientos y competencias para poder cursar con éxito la asignatura
Ninguno especificado.
Competencias
Competencias generales
CG01 - Poseer y comprender conocimientos sobre procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística que aporten una base u oportunidad de ser originales en el desarrollo de soluciones dentro del ámbito de la lingüística computacional
CG02 - Aplicar los conocimientos adquiridos a la resolución de problemas en entornos nuevos o poco conocidos relacionados con las áreas de estudio de lingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística
CG03 - Integrar conocimientos y formular juicios a partir de una información que incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de la lingüística computacional, el procesamiento del lenguaje natural y aplicaciones de
la inteligencia artificial a la lingüística
CG04 - Comunicar las conclusiones sobre llingüística computacional, procesamiento del lenguaje natural y aplicaciones de la inteligencia artificial a la lingüística -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no
especializados de un modo claro y sin ambigüedades
CG05 - Evaluar el progreso del propio aprendizaje de técnicas y recursos de procesamiento del lenguaje natural e inteligencia artificial aplicada a la lingüística
Competencias específicas
CC04 - Categorizar las unidades de análisis de un corpus lingüístico pertenecientes al nivel de la palabra por parte de la oración y lema
CC03 - Estructurar un corpus lingu¨ístico en unidades de análisis de nivel texto, fragmento, oración o palabra
CC38 - Comparar distintas técnicas de desambiguación para el etiquetado de corpus
CC39 - Comparar distintas técnicas de lematización para el etiquetado de corpus
CE06 - Comprender la base descriptiva del etiquetado morfológico, así como de la anotación sintáctica y de la anotación semántica
CE07 - Analizar lenguaje natural con categorías y funciones universales de etiquetado y anotación de corpus para la comparación lingüística, la enseñanza y la traducción
CE08 - Comparar modelos, recursos y técnicas de etiquetado morfológico de corpus
CE09 - Comparar modelos, recursos y técnicas de anotación sintáctica, semántica y discursiva de corpus
HD03 - Tokenizar un corpus
HD04 - Etiquetar un corpus con partes de la oración
HD05 - Lematizar las formas de un corpus
HD06 - Desambiguar etiquetado POS y lematización
Resultados del aprendizaje
Los resultados de aprendizaje (Conocimientos o contenidos [CC], competencias [CG y CE] y habilidades o destrezas [HD]) se incluyen en el apartado de competencias hasta que se actualice la aplicación informática del Ministerio de Universidades.
Objetivos de desarrollo sostenible





Temario
1. Introducción al Procesamiento del Lenguaje Natural
2. Anotación textual
3. Anotación morfológica
4. Anotación morfológica vs. POS tagging
5. Anotación POS automática
6. Programas y bibliotecas para POS tagging
Bibliografía
| Tipo: | Título |
| Básica | Molina Mejía, J.M. 2021. Lingüística computacional y de corpus. Teorías, métodos y aplicaciones. Editorial Universidad de Antioquia. ISBN: 9585010399 |
| Básica | Dash, N. S. 2021. Language Corpora Annotation and Processing. Springer Absys Biba |
| Básica | Sierra Martínez, G. E. 2017. Introducción a los corpus lingüísticos. México, Universidad Nacional Autónoma de México. ISBN: 978-607-029-898-1. |
| Complementaria | Cahill, L. 2017. Computational Morphology. In A. Hippisley & G. Stump (Eds.), The Cambridge Handbook of Morphology. Cambridge University Press. Absys Biba |
| Complementaria | Ide, N. & J. Pustejovsky (Eds.). 2017. Handbook of Linguistic Annotation. Springer. ISBN 978-94-024-0879-9 |
| Complementaria | Lüdeling, A. and M. Kytö (Eds.). 2008. Corpus Linguistics: An International Handbook. Volume 1. de Gruyter Absys Biba |
| Complementaria | Marín Gálvez, R. 2009. El tratamiento computacional del léxico y sus aplicaciones. En Elena de Miguel Aparicio, Panorama de la lexicología. Pags 465-485. Absys Biba |
| Complementaria | Moreno Sandoval, A. 1998. Lingüística computacional: introducción a los modelos simbólicos, estadísticos y biológicos Síntesis Absys Biba |
| Complementaria | Nugues, P. M. 2014. Language Processing with Perl and Prolog. Theories, Implementation, and Application. Springer. ISBN-13: 978-3-642-41464-0 |
| Complementaria | González, M., S. S. Reyes, A. Rodrigo & M. Silberztein. 2022. Formalizing Natural Languages: Applications to Natural Language Processing and Digital Humanities. 16th International Conference, NooJ 2022, Rosario, Argentina, Absys Biba |
| Complementaria | Piotrowski, M. 2022. Natural Language Processing for Historical Texts. Springer Absys Biba |
| Complementaria | Lu, X. 2014. Computational Methods for Corpus Annotation and Analysis. Springer Absys Biba |
Metodología
Modalidades organizativas
Clases teóricas
Seminarios y talleres
Clases prácticas
Estudio y trabajo en grupo
Estudio y trabajo autónomo individual
Métodos de enseñanza
Método expositivo - Lección magistral
Estudio de casos
Resolución de ejercicios y problemas
Aprendizaje basado en problemas
Aprendizaje orientado a proyectos
Aprendizaje cooperativo
Organización
| Actividades dirigidas | Tamaño de grupo | Horas virtuales sincrónicas | Horas virtuales asincrónicas | Horas totales |
| Clases teóricas | Grande | 15,00 | | 15,00 |
| Seminarios y talleres | Reducido | 5,00 | | 5,00 |
| Clases prácticas | Reducido | 20,00 | | 20,00 |
| Total de horas de actividades dirigidas | 40,00 |
| Trabajo autónomo del estudiante | Horas |
| Estudio y trabajo autónomo individual | 60,00 |
| Total de horas de trabajo autónomo | 60,00 |
Evaluación
| Sistema de evaluación | Recuperable | No Recup. |
| Trabajos y proyectos | 70% | 30% |
| Total | 100% |
Comentarios
La nota obtenida en las pruebas no recuperables que se realicen durante el periodo de impartición de la asignatura se guardará para la convocatoria extraordinaria.
En lo relativo a la realización fraudulenta de pruebas de evaluación, se atenderá a lo establecido en el artículo 20 del Reglamento de docencia y evaluación del aprendizaje en las asignaturas de grado y máster de la Universidad de La Rioja.
Versión: 14/06/2024 10:30:29 - G 2024-25 - 656M - 5283 - Impresión: 15/11/2025 16:51:05