Bootcamp Replays
Bootcamp Python para Procesamiento de Datos en Tiempo Real
Descripción
Perfil de Ingreso
Este programa requiere conocimientos en Python y bases de datos. Para aprovecharlo al máximo, necesitas:
- check Python 3.13+
- check Docker y Docker Compose
- check Familiaridad con SQL y async básico en Python (asyncio)
Perfil de Egreso
Al finalizar el bootcamp, contarás con los fundamentos para construir pipelines de datos en tiempo real:
- check_circle Internals de bases de datos transaccionales: WAL, MVCC, buffer pool y puntos de saturación.
- check_circle Construcción de pipelines batch idempotentes con Python y DuckDB.
- check_circle Change Data Capture (CDC) y replicación lógica en PostgreSQL.
- check_circle Event streaming con Apache Kafka: particiones, consumer groups y exactly-once semantics.
- check_circle Stream processing con PySpark Structured Streaming y Apache Flink (PyFlink).
- check_circle OLAP en tiempo real con ClickHouse ingiriendo de Kafka y sirviendo queries sub-segundo.
- check_circle Pipeline completo en producción: Postgres → CDC → Kafka → Spark → ClickHouse → FastAPI → Grafana.