Diseño de ingestas y lagos de datos

En el mundo actual, las empresas necesitan como parte de su arquitectura de datos, un componente que les permita almacenar, procesar y analizar grandes cantidades de datos. Estos componentes son los data lakes (o lagos de datos), y su última evolución, los lakehouses.

Los data lakes son repositorios centralizados para almacenar cualquier tipo de dato sin requerir una estructura previa. Los lakehouses son una evolución de los lagos de datos que combinan la escalabilidad y flexibilidad de los datalakes con el rendimiento y la fiabilidad de los data warehouses tradicionales. Sin embargo, administrarlos y operarlos de forma óptima es un desafío que requiere planificación y diseño para garantizar una organización adecuada de los datos en el mismo.

Al realizar este máster, tendrás los conocimientos necesarios para diseñar, implementar, organizar y administrar estos componentes. Además, aprenderás sobre formatos de almacenamiento, incluyendo el manejo de formatos de fichero específicos para lagos y la funcionalidad que ofrecen; estudiaremos los patrones de ingesta y lo relativo a la promoción de datos entre las distintas capas lógicas.

Contenidos:

  • Formatos de almacenamiento.
  • Patrones de ingesta en batch y en tiempo real.
  • Capas lógicas de un lago.
  • Construcción de lagos de datos con herramientas cloud.