Skip to content

Python Big Data Engineering: Procesamiento, Análisis y Escalabilidad

License

Notifications You must be signed in to change notification settings

fralfaro/python_bd

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📦 Python Big Data Engineering: Procesamiento, Análisis y Escalabilidad

Una guía integral para dominar el procesamiento y análisis de Big Data con Python.

Banner del Curso

Este curso te guía paso a paso en la construcción de sistemas de procesamiento de datos masivos usando Python y herramientas modernas del ecosistema Big Data. Aprenderás a diseñar pipelines robustos, analizar grandes volúmenes de datos y escalar tus soluciones en entornos distribuidos.

Dirigido a desarrolladores, científicos de datos e ingenieros que buscan dominar el flujo de datos extremo a extremo, desde la ingesta hasta el análisis, utilizando prácticas profesionales y tecnologías ampliamente adoptadas.

📚 Contenidos del curso

Módulo Temas clave
🧱 Fundamentos de Ingeniería de Datos Arquitectura moderna de datos, tipos y formatos de archivos, concepto de pipelines, almacenamiento en crudo vs estructurado
🛠️ Procesamiento de Datos en Python pandas vs PySpark, transformaciones distribuidas, limpieza, joins, manejo eficiente de memoria
🔄 Automatización y Orquestación Apache Airflow, Prefect, diseño de DAGs, orquestación de tareas, flujos asincrónicos
🧪 Validación y Testing de Datos Great Expectations, testing de pipelines con pytest, tipado con mypy, monitoreo de flujos
🚀 Escalabilidad y Cloud Despliegue en BigQuery, Snowflake, Redshift, procesamiento distribuido con Spark y Beam, Docker, Kubernetes, serverless

About

Python Big Data Engineering: Procesamiento, Análisis y Escalabilidad

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published