El curso se centra en el diseño y desarrollo de soluciones de procesamiento de datos en la plataforma Microsoft Azure. Exploraremos en detalle las herramientas específicas de Azure empleadas por los ingenieros de datos, tanto en la fase de ingesta como en las etapas posteriores.
El enfoque principal será lograr un aprendizaje significativo a través de proyectos personales guiados por el tutor de manera directa y evaluación basada en la adquisición de competencias. Los estudiantes aprenderán los fundamentos y las mejores prácticas para construir pipelines de datos eficientes y
escalables, que permitan la ingesta, transformación, almacenamiento y análisis de grandes volúmenes de datos.
El curso cubre conceptos esenciales como el almacenamiento y procesamiento de datos en la nube, la arquitectura de pipelines de datos y las herramientas disponibles en el proveedor Microsoft Azure para su implementación. También se hará hincapié en la seguridad y monitorización de los pipelines, así como en la optimización del rendimiento y la escalabilidad de las soluciones implementadas.
El alumno se familiarizará con los servicios de Azure para cada etapa del ciclo de vida de los datos: ingesta, orquestación y coordinación de flujos de datos desde diversas fuentes mediante Azure Data Factory. Además, podrán gestionar la ingesta de datos en tiempo real y procesar eventos a gran escala utilizando Azure Event Hubs. Se profundiza en Storage Account Gen2 para administrar y proteger grandes volúmenes de datos.
Explorarán el análisis de datos a gran escala, creando flujos de trabajo colaborativos y analizando datos masivos con Azure Databricks. Podrán utilizar diferentes lenguajes de programación o emplear Azure Synapse Analytics como herramienta integral para el análisis y procesamiento de datos de alto rendimiento. Tendrán asimismo la oportunidad de trabajar con diversas bases de datos relacionales y no relacionales, como Azure SQL Database y Azure Cosmos DB, así como otros servicios transversales relevantes.
Contenidos:
- Introducción.
- Fundamentos y mejores prácticas en pipelines de datos.
- Arquitecturas y servicios de Azure para ingenieros de datos.
- Ingesta y orquestación con Azure Data Factory.
- Procesamiento de eventos en tiempo real con Azure Event Hubs.
- Almacenamiento escalable y seguro con Storage Account Gen2.
- Análisis de datos masivos con Azure Databricks y Azure Synapse Analytics.
- Bases de datos relacionales y no relacionales: Azure SQL Database y Azure Cosmos DB.
- Seguridad, monitorización y optimización de pipelines de datos.
- Servicios transversales que complementan la formación en la nube de Azure.