Meetup Station · 31 Marzo 2026

AGENTIC
CODING
AVANZADO

El sistema detrás de tus agentes de código

Alfredo Bonilla @brolag · Indie Mind

01 / 23

Alfredo Bonilla

@brolag

Founder @ Indie Mind

Director de Tecnología @ Lyfter

02 / 23

La revolución silenciosa

Esto ya está pasando

Stripe Minions

1,300 PRs/semana 0 código humano

Rakuten

12.5M líneas 79% más rápido

Boris Cherny Creador Claude Code

20-30 PRs/día 5 instancias

La pregunta ya no es "debería usar agentes?" sino "cómo puedo usarlos correctamente?"

03 / 23

Stripe Minions (2026)

1,300

PRs por semana

0

líneas escritas por humanos

Los humanos solo revisan y aprueban. El agente planea, implementa, corre tests, fix CI, push PR.

04 / 23

El verdadero gap

De tirar prompts a sistemas de producción

Lo que la mayoría hace

Tira un prompt Copia y pega el resultado Arregla lo que falló Repite

Lo que hacen Stripe, EY, Rakuten

Harness con contexto y reglas Agente planifica y ejecuta Hooks verifican cada paso Humano solo revisa el PR

Todos usan agentes. Pocos tienen un sistema que los haga funcionar en producción.

06 / 23

La matemática que nadie te muestra

El Problema del Error Compuesto

Un agente que acierta 85% en cada paso suena bien. Pero mira que pasa cuando encadenas pasos:

5 pasos (tarea simple) 44% de éxito

10 pasos (feature típico) 20% de éxito

20 pasos (tarea compleja) 4% de éxito

85% por paso ≠ 85% total

Por eso Stripe divide todo en tasks atomicas y pone un límite de 2 reintentos. Sin eso, el agente entra en espiral.

El verdadero skill

Harness Engineering

El sistema que construye el sistema. No es el prompt. Es el sistema completo que rodea al agente: contexto, herramientas, hooks, reglas, isolation.

El harness es el producto.

El código generado es solo el output.

Vercel Benchmark

AGENTS.md: 100% pass rate
Skills: 53% pass rate

7b / 23

Primer principio

Que > Como

Enfocado en el COMO
"Usa bcrypt con salt de 12 rounds,
 guarda en tabla users.password_hash"

Enfocado en el QUE
"Problema: usuarios se registran con emails
 personales y no podemos filtrar por empresa.
 Solucion: validar dominio corporativo,
 configurable por admin, con tests."

Dale el problema y la solución esperada. El agente resuelve el cómo.

Harness Engineering

La Jerarquía de Control

Isolation — Lo que no puede acceder, no puede romper. Sandbox, VM, worktree.

MAXIMA

Policy — Hooks y reglas en código. Se ejecutan fuera del modelo. El agente no puede ignorarlas.

ALTA

Context — CLAUDE.md, AGENTS.md, rules/. Generalmente las sigue.

MEDIA

Prompts — Instrucciones en texto. Las sigue 70-90% del tiempo.

BASE

La mayoría optimiza prompts. Los que operan en producción optimizan aislamiento y políticas.

08 / 23

Segundo principio

Ingeniería de Contexto

Todo lo que el agente sabe sobre tu proyecto antes de empezar.

Sin contexto

"Implementa autenticación"
→ Codigo generico, librerias random, sin tests

Con contexto

"Implementa autenticación"
+ AGENTS.md dice: Next.js 15, NextAuth, Prisma, Jest
→ Código que encaja en TU proyecto

09 / 23

Arquitectura Agéntica

Las 3 Primitivas

Tres archivos en tu repositorio que cambian cómo trabaja el agente.

📜

Contexto

Qué sabe el agente sobre tu proyecto

⚡

Comportamientos

Tareas reutilizables que puede ejecutar

🤖

Especialistas

Agentes con roles y reglas propias

Se versionan en git. Se comparten con el equipo. Evolucionan con el proyecto.

11 / 23

Primitiva #1

CLAUDE.md

Qué incluir

Stack y versiones
Convenciones de código
Comandos de test
Prohibiciones explicitas

Qué NO incluir

Código fuente (ya lo lee)
Secretos o API keys
Cosas que el modelo ya sabe
Más de 100 líneas

# AGENTS.md
## Stack
Next.js 15, TS, Prisma
## Tests
npm test
## Reglas
NO: any, console.log

13 / 23

Primitiva #2

Skills

Comportamientos reutilizables. Como funciones, pero para el agente.

# skills/security-review/skill.md
name: security-review
trigger: /security-review
Revisá OWASP Top 10 en el código.
Verificá: inputs sanitizados,
no SQL directo, CSRF tokens.
Reportá hallazgos por severidad.

Ejemplos prácticos

/security-review — OWASP en tu código
/pr-review — Dual-AI review antes de merge
/slop-scan — Detectar over-engineering
/tdd — Test-driven con enforcement

Escribís la habilidad una vez → la usás en cada proyecto.

14 / 23

Primitiva #3

Agentes Especializados

Personalidades con roles, reglas y restricciones propias.

# agents/db-migration-expert.md
Sos un experto en migraciones de base de datos.
REGLAS:
- Siempre creá rollback antes de migrar
- Nunca borrés datos, solo marcá obsoletos
- Validá conteos: origen = destino
- Reportá resumen al final

¿Por qué no solo un prompt?

El agente siempre sigue estas reglas
No tenés que repetir instrucciones
Otros del equipo lo pueden invocar
Se versiona y mejora con el tiempo

Pensalo como un junior especializado que nunca olvida sus reglas.

15 / 23

Escalar el trabajo

Equipos de Sub-agentes

Un orquestador liviano reparte tareas. Cada sub-agente es especialista en su dominio.

Mapa de dependencias

T1Setup + types (sin dependencias)

T2API route (sin dependencias)

T3UI component (depende de T1)

T4Integration tests (depende de T2 + T3)

Fase 1: T1 + T2 en paralelo Fase 2: T3 Fase 3: T4 (bloqueado)

Roles del equipo

Orquestador — 15% del contexto, solo planea y reparte
Agente Explore — busca en el codebase
Agente Implement — escribe código
Agente Review — revisa el diff

Cada sub-agente recibe 200K tokens frescos

16 / 23

De "casi siempre" a "siempre"

Determinismo: Hooks

Prompts = 70-90%

Le decís "nunca hagas force push". Lo cumple la mayoría del tiempo. Pero "la mayoría" no es "siempre".

Hooks = 100%

1Violación #1: notifica

2Violación #2: bloquea

3Crítico (rm -rf): siempre bloquea

17 eventos, exit code 2 = bloquear, 0 tokens consumidos

17 / 23

Aislamiento de archivos

Worktrees: cada agente en su mundo

El problema #1 de multi-agent: dos agentes editando el mismo archivo. La solución: worktrees.

Que es un worktree

Una copia aislada del repo en otra carpeta
Cada agente trabaja en su propia copia
Cero conflictos de archivos
El lead mergea todo al final

git worktree add ../feature-auth feature/auth
git worktree add ../feature-api feature/api
# Dos agentes, dos carpetas, cero conflictos

Boris Cherny lo hace así

5 checkouts separados (no branches)
Cada instancia en un feature diferente
OS notifications cuando necesita input
20-30 PRs/día — una persona

Regla: agentes nunca comparten archivos. Cada uno en su worktree.

De idea a PR

El Flujo Completo

Clarificar Entender el problema. Preguntar si hay ambiguedad. Gate: humano confirma

Deliberar 3 perspectivas analizan riesgos, dependencias, trade-offs.

Planificar Archivos a modificar, orden de operaciones, criterios de éxito. Gate: humano aprueba

Ejecutar Implementa con sub-agentes. Tests despues de cada paso. Gate: tests pasan

Revisar Security (OWASP) + calidad + arquitectura. Dual-AI review. Gate: score 8+

Entregar Commit, push, PR automático con resumen. Gate: human review

Agente razona Deterministico Gate humano/auto

18 / 23

Ergonomics

Tu Estacion de Trabajo Agentica

¿Cómo corro 5 instancias en paralelo sin volverme loco?

cmux — El multiplexor

Multiples sesiones de agente en una pantalla
Split panes: código + agente + logs
Sesiones persisten si se cierra la terminal
Atajos para saltar entre agentes

Ctrl+b c — nueva ventana
Ctrl+b n — siguiente agente
Ctrl+b % — split vertical

Dendrite — Todo listo en 1 comando

cmux + editor + git visual preconfigurados
Monitoreo de tokens y costos
Layouts para multi-agente
12 herramientas integradas

curl -fsSL https://raw.githubusercontent.com/brolag/dendrite/main/install.sh | bash

El mejor agente no sirve si tu entorno de trabajo no esta optimizado para operar multiples sesiones.

22 / 23

Más allá del código

Agentes para Todo el Equipo

Los agentes no son solo para codear. Pueden organizar tareas, colaborar con el equipo, y operar 24/7.

OpenClaw

Plataforma para correr agentes autonomos 24/7. No necesita que estes frente a la terminal.

Agentes con cron jobs (research, monitoreo)
Canales: Telegram, Discord, WhatsApp
Cada agente con su identidad y reglas
Corre en cualquier servidor (Mac Mini, VPS)

Ejemplo: Navi

Un agente autonomo que trabaja con el equipo:

Responde preguntas del equipo via Slack
Ayuda a planificar y revisar pendientes
Comunica changelogs y actualizaciones
Escala al humano cuando no sabe

Operando 24/7 en un VPS

El agente de código es el principio. El agente de equipo es el siguiente paso.

22b / 23

El siguiente nivel

Sistemas que se Mejoran Solos

Agente trabaja → Detecta error → Genera regla → Aplica en proxima sesion → Nunca repite

Mecanismos

Memoria avanzada — lecciones auto-extraidas por sesion
Auto-rules — Stop hook genera reglas
Expertise.yaml — trackea dominios

Resultado real

80+ reglas aprendidas automaticamente
Sesion 1: corriges un error
Sesion 3+: nunca se repite

"Give Claude a way to verify its work — it will 2-3x the quality." — Boris Cherny

"Describí el qué.
El agente se encarga del cómo."

Alfredo Bonilla @brolag · indie-mind.com

Escaneá para ver los slides

Recursos y referencias de la charla →

23 / 23

AGENTICCODINGAVANZADO

Alfredo Bonilla

Esto ya está pasando

De tirar prompts a sistemas de producción

El Problema del Error Compuesto

Harness Engineering

Que > Como

La Jerarquía de Control

Ingeniería de Contexto

Las 3 Primitivas

Contexto

Comportamientos

Especialistas

CLAUDE.md

Skills

Ejemplos prácticos

Agentes Especializados

¿Por qué no solo un prompt?

Equipos de Sub-agentes

Mapa de dependencias

Roles del equipo

Determinismo: Hooks

Worktrees: cada agente en su mundo

Que es un worktree

Boris Cherny lo hace así

El Flujo Completo

Tu Estacion de Trabajo Agentica

cmux — El multiplexor

Dendrite — Todo listo en 1 comando

Agentes para Todo el Equipo

OpenClaw

Ejemplo: Navi

Sistemas que se Mejoran Solos

Mecanismos

Resultado real

AGENTIC
CODING
AVANZADO