Índice del nivel: Memoria
al terminar el nivel, darás a Magallanes una memoria que sobrevive a un reinicio del proceso a mitad de encargo — notas estructuradas, store externo con políticas de escritura y recuperación, y riesgo de poisoning auditado. Retomará sin re-trabajo y con estado consistente. Ese agente y su demostración son el checkpoint C2.
0.1Por qué la compaction no basta
En el nivel anterior le diste a Magallanes una compaction que preserva decisiones, estado y problemas abiertos. Funciona — dentro del hilo. Pero el proceso muere a mitad de encargo: un deploy, un OOM-kill, un pod que rota. Al relanzar no queda nada: ni el resumen, ni el plan, ni qué fuentes ya descartó.
La compaction salvó el run. Nada salva lo aprendido entre runs. Eso no se arregla con un mejor resumen: se arregla persistiendo lo crítico fuera de la ventana de contexto. Lance Martin denomina esta palanca write — "saving it outside the context window to help an agent perform a task" (Martin, 2025). Este nivel es esa palanca.
Magallanes llega tal y como salió de C1: grafo LangGraph instrumentado con Langfuse, con trimming y compaction. Sus tres tools siguen congeladas — buscar, leer, escribir_seccion. El trabajo de hoy es que recuerde más allá del proceso que lo ejecuta.
0.2Lecciones
- La memoria es arquitectura — la taxonomía CoALA (working, episodic, semantic, procedural) y la distinción short-term (checkpointer, thread-scoped) vs long-term (Store, cross-thread): qué tipo de memoria resuelve cada necesidad.
- Note-taking estructurado — notas que el agente persiste fuera del contexto y consulta al retomar; estructura mínima (estado, decisiones, pendientes) y política de cuándo escribir.
- El store externo — memoria de largo plazo con LangGraph Store: namespaces, put/get/search, semantic search donde aporte, y una lista razonada de qué NO guardar.
- Sobrevivir al reinicio — el kill del proceso como test de integración: medir el re-trabajo antes y después, y auditar el memory poisoning del propio diseño.
- Frameworks de memoria, leídos con lupa — la pregunta práctica: ¿tiras tu arquitectura artesanal de las lecciones 2 a 4 y adoptas Mem0 o Zep? Responderla exige leer sus benchmarks como claims de vendor; la disputa LOCOMO entre Mem0 y Zep es el caso de estudio.
- La memoria que sobrevive — el entregable completo del checkpoint C2 sobre Magallanes.
0.3El checkpoint C2 — Memoria que sobrevive al reinicio
Sobre Magallanes, montarás una memoria de tres piezas: notas del encargo, store cross-sesión con políticas, y un backend persistente. Después lo matarás a mitad de encargo y comprobarás que retoma sin re-trabajo. El entregable integra arquitectura, demostración del reinicio, trade-off medido y auditoría de riesgo.
Se evalúa por cinco dimensiones:
- Note-taking efectivo — retoma desde sus notas sin releer todo el historial; notas con estructura (estado, decisiones, pendientes).
- Store con políticas — qué y cuándo escribe (hot path vs background, justificado) y qué y cuándo recupera; namespacing correcto.
- Supervivencia demostrada — reinicio sin pérdida de estado, medido en re-trabajo.
- Trade-off medido — coste, latencia y calidad vs llevarlo todo en contexto, con números.
- Riesgo auditado — un escenario de poisoning probado y una mitigación aplicada (proveniencia/scoping/decay).
El re-trabajo se cuenta sobre la traza Langfuse: búsquedas repetidas, documentos releídos, secciones reescritas. No a ojo.
0.4Antes de empezar
- Prerequisitos: completa el nivel anterior. La compaction motiva la memoria: lo que no debe perderse en el resumen es exactamente lo que debe persistir fuera. Sin ese nivel, las decisiones de qué guardar carecen de ancla.
- Stack: las lecciones 1 a 3 corren en local con backends en memoria. El lab de la lección 4 exige un backend persistente — Postgres en docker — para el checkpointer y el store. Móntalo antes de llegar a la prueba del kill.
- Recordatorio de lectura crítica: la lección 5 trae cifras de vendor. Las leerás con la misma lupa que aplicaste a las ventanas de contexto anunciadas en N0. Una cifra sin baseline, sin autor y sin réplica no es un hecho — es un claim.