Infraestructuras para la ciencia de datos
GUÍA DOCENTE Curso 2022-23
Titulación: | Máster universitario en Ciencia de Datos y Aprendizaje Automático | 855M |
Asignatura: | Infraestructuras para la ciencia de datos | 5221 |
Materia: | Despliegue de proyectos de ciencia de datos |
Módulo: | Métodos de análisis y procesamiento de datos |
Modalidad de enseñanza de la titulación: | Presencial | Carácter: | Optativa |
Curso: | 1 | Créditos ECTS: | 3,00 | Duración: | Semestral (Segundo Semestre) |
Horas presenciales: | 30,00 | Horas estimadas de trabajo autónomo: | 45,00 |
Idiomas en que se imparte la asignatura: | Español |
Idiomas del material de lectura o audiovisual: | Inglés, Español |
Departamentos responsables de la docencia
MATEMÁTICAS Y COMPUTACIÓN | R111 |
Dirección: | C/ Madre de Dios, 53 | Código postal: | 26006 |
Localidad: | Logroño | Provincia: | La Rioja |
Teléfono: | 941299452 | Fax: | 941299460 | Correo electrónico: | dpto.dmc@unirioja.es |
Profesorado previsto
Profesor: | Aransay Azofra, Jesús María | Responsable de la asignatura |
Teléfono: | 941299438 | Correo electrónico: | jesus-maria.aransay@unirioja.es |
Despacho: | 3245 | Edificio: | CENTRO CIENTÍFICO TECNOLÓGICO | Tutorías: | Consultar |
Descripción de los contenidos
Herramientas de uso y gestión de infraestructura como servicio para el despliegue de proyectos de ciencia de datos. Despliegue y gestión de versiones. Integración continua: de la versión de desarrollo a la de producción. Casos prácticos y experiencias reales exitosas y fallidas.
Requisitos previos de conocimientos y competencias para poder cursar con éxito la asignatura
Ninguno especificado.
Competencias
Competencias generales
CG02 - Capacidad de iniciativa y autonomía para llevar a cabo proyectos relacionados con la ciencia de datos y aprendizaje automático
CG03 - Habilidad para dar un uso avanzado a las herramientas de búsqueda de información relevante en el ámbito de la ciencia de datos y aprendizaje automático y, en particular, a las disponibles en la web
CG04 - Habilidad para comunicarse oralmente a nivel avanzado sobre temas del ámbito de la ciencia de datos y aprendizaje automático, usando la terminología y técnicas aceptadas por los profesionales del sector
CG05 - Habilidad para formular por escrito a nivel avanzado temas del ámbito de la ciencia de datos y aprendizaje automático usando correctamente diferentes tipos de enfoques académicos relacionados con su campo de estudio
CG06 - Capacidad de iniciativa y autonomía para las distintas tareas propias de la actividad investigadora en el ámbito de la ciencia de datos y aprendizaje automático
Competencias específicas
CE11 - Capacidad para determinar y poner al servicio de la ciencia de datos sistemas e infraestructuras avanzadas
Resultados del aprendizaje
- Conoce y es capaz de utilizar infraestructuras informáticas avanzadas disponibles para ser usadas en el despliegue de proyectos en la ciencia de datos, por ejemplo, sistemas en la nube o sistemas virtualizados.
- Conoce la problemática de la integración continua y el control de versiones en el desarrollo de proyectos de ciencia de dato y es capaz de utilizar herramientas para gestionarlas.
Temario
- Metodologías para el despliegue de proyectos en Ciencia de Datos: Integración continua, entrega continua, DevOps, DataOps
- Uso de contenedores para despliegue de aplicaciones en Ciencia de Datos
- Herramientas de gestión de configuración de infraestructuras para proyectos en Ciencia de Datos (infraestructura como código)
- Generación y uso de entornos virtuales para entornos de desarrollo y producción
- Herramientas para integración y despliegue continuos: Jenkins, Travis CI, GitHub Actions, Circle CI
- Definición de flujos de trabajo para la automatización
- Gestión, despliegue y actualización de las partes de un proyecto de Ciencia de Datos en ejecución
- Casos prácticos y experiencias reales exitosas y fallidas
Bibliografía
Tipo: | Título |
Básica | Practical DataOps: Delivering Agile Data Science at Scale |
Básica | Getting DataOps Right |
Básica | Continuous Integration and Delivery: Build and release quality software at scale with Jenkins, Travis CI, and CircleCI |
Básica | Python for DevOps: Learn Ruthlessly Effective Automation |
Básica | Building Machine Learning Powered Applications |
Básica | The practice of cloud system administration. Volume 2, Designing and operating large distributed systems Absys Biba |
Básica | Vagrant: up and running Absys Biba |
Básica | Docker: up and running Absys Biba |
Básica | Pro Puppet Absys Biba |
Complementaria | Creating a Data-Driven Enterprise with DataOps |
Complementaria | Getting Data Right: Tackling the Challenges of Big Data Volume and Variety |
Complementaria | Puppet best practices Absys Biba |
Complementaria | Infrastructure as Code Absys Biba |
Complementaria | Docker Cookbook Absys Biba |
Recursos en Internet |
El material didáctico de la asignatura se encontrará disponible en el aula virtual para todos los estudiantes matriculados en la misma. |
Metodología
Modalidades organizativas
Clases teóricas
Seminarios y talleres
Clases prácticas
Tutorías
Estudio y trabajo en grupo
Estudio y trabajo autónomo individual
Métodos de enseñanza
Método expositivo - Lección magistral
Estudio de casos
Resolución de ejercicios y problemas
Aprendizaje basado en problemas
Aprendizaje orientado a proyectos
Aprendizaje cooperativo
Organización
Actividades presenciales | Tamaño de grupo | Horas |
Clases teóricas | Grande | 10,00 |
Seminarios y talleres | Grande | 8,00 |
Clases prácticas | Informática | 10,00 |
Tutorías | Grande | 2,00 |
Total de horas presenciales | 30,00 |
Trabajo autónomo del estudiante | Horas |
Estudio y trabajo autónomo individual | 30,00 |
Estudio y trabajo en grupo | 15,00 |
Total de horas de trabajo autónomo | 45,00 |
Evaluación
Sistemas de evaluación | Recuperable | No Recup. |
Pruebas de ejecución de tareas reales y/o simuladas | 20% | |
Informes y memorias de prácticas | 40% | |
Trabajos y proyectos | 40% | |
Total | 100% |
15/03/2023 10:34:47 - G 2022-23 - 855M - 5221