Diseño de Ingestas y Data Lakehouses

En el mundo actual, las empresas necesitan como parte de su arquitectura de datos, un componente que les permita almacenar, procesar y analizar grandes cantidades de datos. Estos componentes son los Data Lakehouses, la última evolución de los lagos de datos.

Los lakehouses son repositorios centralizados para almacenar cualquier tipo de dato sin requerir una estructura previa. Los lakehouses son una evolución de los lagos de datos que combinan la escalabilidad y flexibilidad de los datalakes con el rendimiento y la fiabilidad de los data warehouses tradicionales. Sin embargo, administrarlos y operarlos de forma óptima es un desafío que requiere planificación y diseño para garantizar una organización adecuada de los datos en el mismo.

Al realizar este máster, tendrás los conocimientos necesarios para diseñar, implementar, organizar y administrar estos componentes. Además, aprenderás sobre formatos de almacenamiento, incluyendo el manejo de formatos de fichero específicos para lagos y la funcionalidad que ofrecen; estudiaremos los patrones de ingesta y lo relativo a la promoción de datos entre las distintas capas lógicas.

Contenidos:

  • Formatos de almacenamiento.
  • Patrones de ingesta en batch y en tiempo real.
  • Capas lógicas de un Data Lakehouse.
  • Construcción de Data Lakehouses con herramientas cloud.