Meetup Station · 31 Marzo 2026

AGENTIC
CODING
AVANZADO

El sistema detrás de tus agentes de código

Alfredo Bonilla @brolag · Indie Mind
01 / 23
Alfredo Bonilla

Alfredo Bonilla

@brolag

Founder @ Indie Mind
Director de Tecnología @ Lyfter
02 / 23
La revolución silenciosa

Esto ya está pasando

Stripe Minions
1,300 PRs/semana 0 código humano
Rakuten
12.5M líneas 79% más rápido
Boris Cherny Creador Claude Code
20-30 PRs/día 5 instancias

La pregunta ya no es "debería usar agentes?" sino "cómo puedo usarlos correctamente?"

03 / 23
Stripe Minions (2026)

1,300

PRs por semana

0

líneas escritas por humanos

Los humanos solo revisan y aprueban. El agente planea, implementa, corre tests, fix CI, push PR.

04 / 23
El verdadero gap

De tirar prompts a sistemas de producción

Lo que la mayoría hace
Tira un prompt Copia y pega el resultado Arregla lo que falló Repite
Lo que hacen Stripe, EY, Rakuten
Harness con contexto y reglas Agente planifica y ejecuta Hooks verifican cada paso Humano solo revisa el PR

Todos usan agentes. Pocos tienen un sistema que los haga funcionar en producción.

06 / 23
La matemática que nadie te muestra

El Problema del Error Compuesto

Un agente que acierta 85% en cada paso suena bien. Pero mira que pasa cuando encadenas pasos:

5 pasos (tarea simple) 44% de éxito
10 pasos (feature típico) 20% de éxito
20 pasos (tarea compleja) 4% de éxito
85% por paso ≠ 85% total

Por eso Stripe divide todo en tasks atomicas y pone un límite de 2 reintentos. Sin eso, el agente entra en espiral.

El verdadero skill

Harness Engineering

El sistema que construye el sistema. No es el prompt. Es el sistema completo que rodea al agente: contexto, herramientas, hooks, reglas, isolation.

El harness es el producto.

El código generado es solo el output.

Vercel Benchmark

AGENTS.md: 100% pass rate
Skills: 53% pass rate

7b / 23
Primer principio

Que > Como

Enfocado en el COMO
"Usa bcrypt con salt de 12 rounds,
 guarda en tabla users.password_hash"
Enfocado en el QUE
"Problema: usuarios se registran con emails
 personales y no podemos filtrar por empresa.
 Solucion: validar dominio corporativo,
 configurable por admin, con tests."

Dale el problema y la solución esperada. El agente resuelve el cómo.

Harness Engineering

La Jerarquía de Control

Isolation — Lo que no puede acceder, no puede romper. Sandbox, VM, worktree.
MAXIMA
Policy — Hooks y reglas en código. Se ejecutan fuera del modelo. El agente no puede ignorarlas.
ALTA
Context — CLAUDE.md, AGENTS.md, rules/. Generalmente las sigue.
MEDIA
Prompts — Instrucciones en texto. Las sigue 70-90% del tiempo.
BASE

La mayoría optimiza prompts. Los que operan en producción optimizan aislamiento y políticas.

08 / 23
Segundo principio

Ingeniería de Contexto

Todo lo que el agente sabe sobre tu proyecto antes de empezar.

Sin contexto
"Implementa autenticación"
→ Codigo generico, librerias random, sin tests
Con contexto
"Implementa autenticación"
+ AGENTS.md dice: Next.js 15, NextAuth, Prisma, Jest
→ Código que encaja en TU proyecto
09 / 23
Arquitectura Agéntica

Las 3 Primitivas

Tres archivos en tu repositorio que cambian cómo trabaja el agente.

📜

Contexto

Qué sabe el agente sobre tu proyecto

Comportamientos

Tareas reutilizables que puede ejecutar

🤖

Especialistas

Agentes con roles y reglas propias

Se versionan en git. Se comparten con el equipo. Evolucionan con el proyecto.

11 / 23
Primitiva #1

CLAUDE.md

Qué incluir
  • Stack y versiones
  • Convenciones de código
  • Comandos de test
  • Prohibiciones explicitas
Qué NO incluir
  • Código fuente (ya lo lee)
  • Secretos o API keys
  • Cosas que el modelo ya sabe
  • Más de 100 líneas
# AGENTS.md
## Stack
Next.js 15, TS, Prisma
## Tests
npm test
## Reglas
NO: any, console.log
13 / 23
Primitiva #2

Skills

Comportamientos reutilizables. Como funciones, pero para el agente.

# skills/security-review/skill.md
name: security-review
trigger: /security-review
Revisá OWASP Top 10 en el código.
Verificá: inputs sanitizados,
no SQL directo, CSRF tokens.
Reportá hallazgos por severidad.

Ejemplos prácticos

  • /security-review — OWASP en tu código
  • /pr-review — Dual-AI review antes de merge
  • /slop-scan — Detectar over-engineering
  • /tdd — Test-driven con enforcement

Escribís la habilidad una vez → la usás en cada proyecto.

14 / 23
Primitiva #3

Agentes Especializados

Personalidades con roles, reglas y restricciones propias.

# agents/db-migration-expert.md
Sos un experto en migraciones de base de datos.
REGLAS:
- Siempre creá rollback antes de migrar
- Nunca borrés datos, solo marcá obsoletos
- Validá conteos: origen = destino
- Reportá resumen al final

¿Por qué no solo un prompt?

  • El agente siempre sigue estas reglas
  • No tenés que repetir instrucciones
  • Otros del equipo lo pueden invocar
  • Se versiona y mejora con el tiempo

Pensalo como un junior especializado que nunca olvida sus reglas.

15 / 23
Escalar el trabajo

Equipos de Sub-agentes

Un orquestador liviano reparte tareas. Cada sub-agente es especialista en su dominio.

Mapa de dependencias

T1Setup + types (sin dependencias)
T2API route (sin dependencias)
T3UI component (depende de T1)
T4Integration tests (depende de T2 + T3)
Fase 1: T1 + T2 en paralelo Fase 2: T3 Fase 3: T4 (bloqueado)

Roles del equipo

  • Orquestador — 15% del contexto, solo planea y reparte
  • Agente Explore — busca en el codebase
  • Agente Implement — escribe código
  • Agente Review — revisa el diff

Cada sub-agente recibe 200K tokens frescos

16 / 23
De "casi siempre" a "siempre"

Determinismo: Hooks

Prompts = 70-90%

Le decís "nunca hagas force push". Lo cumple la mayoría del tiempo. Pero "la mayoría" no es "siempre".

Hooks = 100%
1Violación #1: notifica
2Violación #2: bloquea
3Crítico (rm -rf): siempre bloquea

17 eventos, exit code 2 = bloquear, 0 tokens consumidos

17 / 23
Aislamiento de archivos

Worktrees: cada agente en su mundo

El problema #1 de multi-agent: dos agentes editando el mismo archivo. La solución: worktrees.

Que es un worktree

  • Una copia aislada del repo en otra carpeta
  • Cada agente trabaja en su propia copia
  • Cero conflictos de archivos
  • El lead mergea todo al final
git worktree add ../feature-auth feature/auth
git worktree add ../feature-api feature/api
# Dos agentes, dos carpetas, cero conflictos

Boris Cherny lo hace así

  • 5 checkouts separados (no branches)
  • Cada instancia en un feature diferente
  • OS notifications cuando necesita input
  • 20-30 PRs/día — una persona

Regla: agentes nunca comparten archivos. Cada uno en su worktree.

De idea a PR

El Flujo Completo

Clarificar Entender el problema. Preguntar si hay ambiguedad. Gate: humano confirma
Deliberar 3 perspectivas analizan riesgos, dependencias, trade-offs.
Planificar Archivos a modificar, orden de operaciones, criterios de éxito. Gate: humano aprueba
Ejecutar Implementa con sub-agentes. Tests despues de cada paso. Gate: tests pasan
Revisar Security (OWASP) + calidad + arquitectura. Dual-AI review. Gate: score 8+
Entregar Commit, push, PR automático con resumen. Gate: human review
Agente razona Deterministico Gate humano/auto
18 / 23
Ergonomics

Tu Estacion de Trabajo Agentica

¿Cómo corro 5 instancias en paralelo sin volverme loco?

cmux — El multiplexor

  • Multiples sesiones de agente en una pantalla
  • Split panes: código + agente + logs
  • Sesiones persisten si se cierra la terminal
  • Atajos para saltar entre agentes
Ctrl+b c — nueva ventana
Ctrl+b n — siguiente agente
Ctrl+b % — split vertical

Dendrite — Todo listo en 1 comando

  • cmux + editor + git visual preconfigurados
  • Monitoreo de tokens y costos
  • Layouts para multi-agente
  • 12 herramientas integradas
curl -fsSL https://raw.githubusercontent.com/brolag/dendrite/main/install.sh | bash

El mejor agente no sirve si tu entorno de trabajo no esta optimizado para operar multiples sesiones.

22 / 23
Más allá del código

Agentes para Todo el Equipo

Los agentes no son solo para codear. Pueden organizar tareas, colaborar con el equipo, y operar 24/7.

OpenClaw

Plataforma para correr agentes autonomos 24/7. No necesita que estes frente a la terminal.

  • Agentes con cron jobs (research, monitoreo)
  • Canales: Telegram, Discord, WhatsApp
  • Cada agente con su identidad y reglas
  • Corre en cualquier servidor (Mac Mini, VPS)

Ejemplo: Navi

Un agente autonomo que trabaja con el equipo:

  • Responde preguntas del equipo via Slack
  • Ayuda a planificar y revisar pendientes
  • Comunica changelogs y actualizaciones
  • Escala al humano cuando no sabe

Operando 24/7 en un VPS

El agente de código es el principio. El agente de equipo es el siguiente paso.

22b / 23
El siguiente nivel

Sistemas que se Mejoran Solos

Agente trabaja Detecta error Genera regla Aplica en proxima sesion Nunca repite

Mecanismos

  • Memoria avanzada — lecciones auto-extraidas por sesion
  • Auto-rules — Stop hook genera reglas
  • Expertise.yaml — trackea dominios

Resultado real

  • 80+ reglas aprendidas automaticamente
  • Sesion 1: corriges un error
  • Sesion 3+: nunca se repite

"Give Claude a way to verify its work — it will 2-3x the quality." — Boris Cherny

"Describí el qué.
El agente se encarga del cómo."
Alfredo Bonilla @brolag · indie-mind.com
QR - Slides

Escaneá para ver los slides

Recursos y referencias de la charla →
23 / 23