Preparación de datos
GUÍA DOCENTE Curso 2022-23
Titulación: | Máster universitario en Ciencia de Datos y Aprendizaje Automático | 855M |
Asignatura: | Preparación de datos | 5228 |
Materia: | Programación y preparación de datos |
Módulo: | Programación y lenguajes para la ciencia de datos |
Modalidad de enseñanza de la titulación: | Presencial | Carácter: | Obligatoria |
Curso: | 1 | Créditos ECTS: | 3,00 | Duración: | Semestral (Primer Semestre) |
Horas presenciales: | 30,00 | Horas estimadas de trabajo autónomo: | 45,00 |
Idiomas en que se imparte la asignatura: | No especificado |
Idiomas del material de lectura o audiovisual: | No especificado |
Departamentos responsables de la docencia
MATEMÁTICAS Y COMPUTACIÓN | R111 |
Dirección: | C/ Madre de Dios, 53 | Código postal: | 26006 |
Localidad: | Logroño | Provincia: | La Rioja |
Teléfono: | 941299452 | Fax: | 941299460 | Correo electrónico: | dpto.dmc@unirioja.es |
Profesorado previsto
Profesor: | López Gómez, Rosario | Responsable de la asignatura |
Teléfono: | 941299465 | Correo electrónico: | rosario.lopez@unirioja.es |
Despacho: | 3209 | Edificio: | CENTRO CIENTÍFICO TECNOLÓGICO | Tutorías: | Consultar |
Descripción de los contenidos
Transformación de datos: normalizar, correlacionar, discretizar, agregar, fusionar. Reducción de datos. Casos prácticos
Requisitos previos de conocimientos y competencias para poder cursar con éxito la asignatura
Ninguno especificado.
Competencias
Competencias generales
CG01 - Capacidad de análisis y síntesis a nivel avanzado en el ámbito de la ciencia de datos y aprendizaje automático
CG02 - Capacidad de iniciativa y autonomía para llevar a cabo proyectos relacionados con la ciencia de datos y aprendizaje automático
CG03 - Habilidad para dar un uso avanzado a las herramientas de búsqueda de información relevante en el ámbito de la ciencia de datos y aprendizaje automático y, en particular, a las disponibles en la web
CG06 - Capacidad de iniciativa y autonomía para las distintas tareas propias de la actividad investigadora en el ámbito de la ciencia de datos y aprendizaje automático
Competencias específicas
CE01 - Habilidad para utilizar lenguajes de programación específicos para la ciencia de datos, que sirvan de base para el posterior aprendizaje y desarrollo de técnicas más complejas, así como aplicar herramientas software para el tratamiento y modelado de gran cantidad de información
CE02 - Capacidad para analizar, aplicar y diferenciar métodos de transformación de datos que permiten simplificar un problema de tratamiento de información
Resultados del aprendizaje
- Es capaz de utilizar técnicas de programación para el diseño de programas que resuelvan problemas propios del tratamiento de datos.
- Conoce y sabe emplear lenguajes de programación, junto a sus correspondientes módulos y librerías, que se consideran apropiados para la ciencia de datos.
- Es capaz de realizar transformaciones de problemas mediante la aplicación de técnicas de preprocesamiento.
Temario
- Introducción. Importancia del preprocesamiento de datos.
- Integración de datos: extracción y agregación, resolución de problemas, codificación e integración homogénea de datos.
- Limpieza de duplicados y anomalías, eliminación de ruido e inconsistencias, recuperación datos, eliminación outliers, resolución de conflictos.
- Normalización y transformación de los datos: agregación, generalización, normalización, transformaciones lineales, cuadráticas, polinomiales.
- Limpieza y tratamiento de datos Imperfectos. Valores erróneos y detección de datos anómalos. Eliminación de ruido.
- Reducción de la dimensionalidad: selección/extracción de características, agrupación/compactación de datos, muestreo o selección de instancias y discretización de datos.
Bibliografía
Tipo: | Título |
Básica | Data Mining and Predictive Analytics. D. T. Larose, C. D. Larose, Wiley, 2015 Absys |
Básica | Data Preparation for Data Mining. D. Pyle. Morgan Kaufmann Publishers, 1999 Absys |
Básica | Data Preprocessing in Data Mining. S. Garcia, J. Luego, F. Herrera, Springer, 2015 |
Básica | Mastering Python for Data Science. S. Madhavan, Packt Publishing, 2015 Absys |
Complementaria | Data Mining and Knowledge Discovery Handbook. Second Edition. O. Maimon, L. Rokach, Springer, 2010. Absys |
Complementaria | Evaluating machine learning models. A. Zheng, O¿Really, 2015 |
Complementaria | Hands-On Data analysis with Numpy and Pandas. C. Miller, Packt Publishing, 2018 |
Complementaria | Pandas Cookbook. T. Petrou, Packt Publishing, 2017 |
Complementaria | Practical Data Analysis. Second Edition. H. Cuesta. Packt Publishing, 2016 |
Recursos en Internet |
El material didáctico (ejercicios prácticos, cuestiones, actividades ...etc) se encontrará disponible en el aula virtual para todos los alumnos matriculados en esta asignatura. |
Metodología
Modalidades organizativas
Clases teóricas
Seminarios y talleres
Clases prácticas
Tutorías
Estudio y trabajo en grupo
Estudio y trabajo autónomo individual
Métodos de enseñanza
Método expositivo - Lección magistral
Estudio de casos
Resolución de ejercicios y problemas
Aprendizaje basado en problemas
Aprendizaje orientado a proyectos
Aprendizaje cooperativo
Organización
Actividades presenciales | Tamaño de grupo | Horas |
Clases teóricas | Grande | 10,00 |
Seminarios y talleres | Grande | 8,00 |
Clases prácticas | Informática | 10,00 |
Tutorías | Grande | 2,00 |
Total de horas presenciales | 30,00 |
Trabajo autónomo del estudiante | Horas |
Estudio y trabajo en grupo | 10,00 |
Estudio y trabajo autónomo individual | 35,00 |
Total de horas de trabajo autónomo | 45,00 |
Evaluación
Sistemas de evaluación | Recuperable | No Recup. |
Pruebas escritas | 30% | |
Informes y memorias de prácticas | | 40% |
Trabajos y proyectos | 30% | |
Total | 100% |
15/03/2023 10:34:50 - G 2022-23 - 855M - 5228