Bootcamp Python para Procesamiento de Datos en Tiempo Real

Internals de bases de datos transaccionales: WAL, MVCC, buffer pool y puntos de saturación.

Construcción de pipelines batch idempotentes con Python y DuckDB.

Change Data Capture (CDC) y replicación lógica en PostgreSQL.

Event streaming con Apache Kafka: particiones, consumer groups y exactly-once semantics.

Stream processing con PySpark Structured Streaming y Apache Flink (PyFlink).

OLAP en tiempo real con ClickHouse ingiriendo de Kafka y sirviendo queries sub-segundo.

Pipeline completo en producción: Postgres → CDC → Kafka → Spark → ClickHouse → FastAPI → Grafana.

Descripción