El sistema detrás de tus agentes de código
@brolag
La pregunta ya no es "debería usar agentes?" sino "cómo puedo usarlos correctamente?"
1,300
PRs por semana
0
líneas escritas por humanos
Los humanos solo revisan y aprueban. El agente planea, implementa, corre tests, fix CI, push PR.
Todos usan agentes. Pocos tienen un sistema que los haga funcionar en producción.
Un agente que acierta 85% en cada paso suena bien. Pero mira que pasa cuando encadenas pasos:
Por eso Stripe divide todo en tasks atomicas y pone un límite de 2 reintentos. Sin eso, el agente entra en espiral.
El sistema que construye el sistema. No es el prompt. Es el sistema completo que rodea al agente: contexto, herramientas, hooks, reglas, isolation.
El harness es el producto.
El código generado es solo el output.
Vercel Benchmark
AGENTS.md: 100% pass rate
Skills: 53% pass rate
Dale el problema y la solución esperada. El agente resuelve el cómo.
La mayoría optimiza prompts. Los que operan en producción optimizan aislamiento y políticas.
Todo lo que el agente sabe sobre tu proyecto antes de empezar.
Tres archivos en tu repositorio que cambian cómo trabaja el agente.
Qué sabe el agente sobre tu proyecto
Tareas reutilizables que puede ejecutar
Agentes con roles y reglas propias
Se versionan en git. Se comparten con el equipo. Evolucionan con el proyecto.
Comportamientos reutilizables. Como funciones, pero para el agente.
/security-review — OWASP en tu código/pr-review — Dual-AI review antes de merge/slop-scan — Detectar over-engineering/tdd — Test-driven con enforcementEscribís la habilidad una vez → la usás en cada proyecto.
Personalidades con roles, reglas y restricciones propias.
Pensalo como un junior especializado que nunca olvida sus reglas.
Un orquestador liviano reparte tareas. Cada sub-agente es especialista en su dominio.
Cada sub-agente recibe 200K tokens frescos
Le decís "nunca hagas force push". Lo cumple la mayoría del tiempo. Pero "la mayoría" no es "siempre".
17 eventos, exit code 2 = bloquear, 0 tokens consumidos
El problema #1 de multi-agent: dos agentes editando el mismo archivo. La solución: worktrees.
Regla: agentes nunca comparten archivos. Cada uno en su worktree.
¿Cómo corro 5 instancias en paralelo sin volverme loco?
El mejor agente no sirve si tu entorno de trabajo no esta optimizado para operar multiples sesiones.
Los agentes no son solo para codear. Pueden organizar tareas, colaborar con el equipo, y operar 24/7.
Plataforma para correr agentes autonomos 24/7. No necesita que estes frente a la terminal.
Un agente autonomo que trabaja con el equipo:
Operando 24/7 en un VPS
El agente de código es el principio. El agente de equipo es el siguiente paso.
"Give Claude a way to verify its work — it will 2-3x the quality." — Boris Cherny
Escaneá para ver los slides
Recursos y referencias de la charla →