Bootcamp Replays

Bootcamp Python para Procesamiento de Datos en Tiempo Real

Descripción

input

Perfil de Ingreso

Este programa requiere conocimientos en Python y bases de datos. Para aprovecharlo al máximo, necesitas:

  • check Python 3.13+
  • check Docker y Docker Compose
  • check Familiaridad con SQL y async básico en Python (asyncio)
output

Perfil de Egreso

Al finalizar el bootcamp, contarás con los fundamentos para construir pipelines de datos en tiempo real:

  • check_circle Internals de bases de datos transaccionales: WAL, MVCC, buffer pool y puntos de saturación.
  • check_circle Construcción de pipelines batch idempotentes con Python y DuckDB.
  • check_circle Change Data Capture (CDC) y replicación lógica en PostgreSQL.
  • check_circle Event streaming con Apache Kafka: particiones, consumer groups y exactly-once semantics.
  • check_circle Stream processing con PySpark Structured Streaming y Apache Flink (PyFlink).
  • check_circle OLAP en tiempo real con ClickHouse ingiriendo de Kafka y sirviendo queries sub-segundo.
  • check_circle Pipeline completo en producción: Postgres → CDC → Kafka → Spark → ClickHouse → FastAPI → Grafana.