SEXTANTEcursos técnicos de IA
métodobackward-design
árbitroel dato
Entrar
← CursosCURSO C·02NIVELES 6CHECKPOINTS C0–C5
Avanzado · 50 h · 42 lecciones · abierto

Evals & Observabilidad de sistemas LLM

Banco de pruebas: un agente de soporte real (RAG + tool-calling) instrumentado, medido y gobernado por evals. De las vibes a un flywheel de datos.

flywheel.loop3 fases
ANALIZAR MEDIR MEJORAR look at your data
Analizartrazas
Medirjuez
Mejorardeploy
Filosofía

Si no lo mides, son vibes. El dato gobierna el deploy — error analysis sobre trazas reales de producción.

Banco de pruebas
agente soporte · RAG + tools
Stack
Langfuse · Ragas/DeepEval · promptfoo
Horas
50h
Nivel
Avanzado
Temario · ruta de maestría

Los 6 niveles

N0 → N5
cada nivel cierra contra un checkpoint
Sistema de progreso · tabla maestra

6 checkpoints

estados: pendiente · en curso · superado
no se avanza sin superar el número
IDCheckpointNivelEstado
C0Sistema instrumentadoN0
C1Error analysis + datasetnúcleoN1
C2Juez calibradonúcleoN2
C3Suite por arquitecturaN3
C4Gate de CIN4
C5Flywheel en producciónN5