Inicio

Nombre del curso: Soluciones de datos en la Nube
Créditos: 4
Profesor: Cristian Camilo Castellanos (cc.castellanos87@uniandes.edu.co)
Gabriel Paredes
Versión PDF Click Aquí

Descripción

La adopción de computación en la nube continúa creciendo en una variedad de organizaciones y dominios y han permitido la evolución y escalamiento en diversas áreas, especialmente en soluciones de datos. Esta adopción implica entender los cambios arquitectónicos, funcionales, de seguridad y gobierno junto con el modelo de costos para tomar decisiones bien informadas que permiten aprovechar las ventajas específicas de la nube como agilidad, elasticidad, escalabilidad, y resiliencia. Este curso se enfoca en el diseño y evaluación de soluciones de datos que van desde almacenamiento, transaccionalidad, seguridad y gobierno, como sus usos en analítica básica y avanzada. Una solución de datos en la nube bien diseñada, parte de la clara definición de las necesidades de negocio, casos de uso y su traducción en criterios de diseño, selección de servicios, tecnologías y configuraciones específicas para dar respuesta a dichas necesidades. Este curso aproxima a los estudiantes al marco conceptual y práctico de diseñar soluciones de datos que respondan a las necesidades actuales y futuras de las organizaciones y cómo las tecnologías de nube son un habilitador y potenciador para abordarlas.

El temario está compuesto por cuatro módulos:

  • Módulo # 1 – Conceptos básicos, tipos de almacenamiento, seguridad y gobierno de datos en la nube.
  • Módulo # 2 – Soluciones de bases de datos SQL, No-SQL y de propósito específico.
  • Módulo # 3 – Ingeniería de datos, soluciones de ETL, analítica básica y procesamiento de big data.
  • Módulo # 4 – Soluciones de analítica avanzada, aprendizaje automático e inteligencia artificial.

Objetivos Pedagógicos

  • Identificar los conceptos básicos de computación en la nube y las estrategias de datos modernas.
  • Identificar y aplicar los componentes de ciberseguridad de información en nube.
  • Analizar las ventajas estratégicas que motivan el diseño y despliegue de soluciones de datos y analítica sobre nube pública
  • Evaluar las necesidades, motivadores y restricciones que conducen el diseño de soluciones de datos en nube.
  • Identificar y aplicar los patrones de soluciones de datos y analítica de nube a partir de los requerimientos de negocio y TI.
  • Diseñar soluciones de datos de manera práctica sobre un servicio de nube pública.
  • Identificar los elementos claves de consumo y estimación de costos asociados a una solución de datos en nube.
  • Evaluar las diferentes estrategias de migración y modernización de soluciones de datos y analítica en la nube a partir de sus características claves.
  • Entender y evaluar la factibilidad, calidad, y buenas prácticas de soluciones de datos en nube.

Plan de temas

El curso se desarrolla en una introducción más cuatro módulos. En cada uno de ellos se proponen un conjunto de patrones agnósticos y algunas de sus implementaciones que buscan contextualizar al estudiante y aplicar las temáticas vistas.

Módulo Temas
M1: Conceptos básicos, almacenamiento, gobierno y seguridad en la nube. 1- Conceptos básicos de nube pública y arquitectura de información.
2- Tipos de almacenamiento y transferencia de datos.
3- Gobierno y ciberseguridad de datos en la nube.
4- Práctica: almacenamiento, gobierno y seguridad, ejercicio de costeo.
M2: Servicios de bases de datos SQL y No-SQL 1- Base de datos transaccionales administradas y serverless
2- Bases de datos No-SQL y de propósito específico (IoT, Blockchain)
3- Rompiendo el monolito de datos (Lectura)
4- Práctica: Bases datos SQL y No-SQL (DynamoDB, IoT)
M3: Servicios de analítica y procesamiento de grandes volúmenes de datos 1- Soluciones de ingestión de datos, ETL, Ingeniería de datos, data streaming
2- Soluciones de analítica datos (DWH, Data Lake, Data Lake House, Data Mesh)
3- Grandes volúmenes de datos y escalabilidad (Patrones Lambda, Kappa, in-memory, motores de indexación)
4- Soluciones de explotación de datos (BI, APIs, Consultas Ad-hoc)
5- Práctica: ETL, DWH, Data Lake, BI
M4: Servicios de aprendizaje automático e inteligencia artificial. 1- Conceptos básicos de aprendizaje automático (ML), Infraestructura para ML
2- Soluciones de desarrollo de ML, democratización, análisis de sesgo.
3- ML como servicio: transcripción, NLU, computación visual, pronóstico, GenAI.
4- Práctica: Desarrollo de ML, ML como servicio y GenAI

Política de manejo de notas

  • No existe aproximación automática en la nota definitiva
  • Las notas de las evaluaciones de los diferentes módulos se califican entre 1.50 y 5.00 con dos decimales y no hay aproximaciones
  • Para pasar el curso es indispensable lograr en el puntaje ponderado 3.00/5.00