room714 logo
CLAUDE.md y el Contexto como Recurso Escaso: Lo que tus Instrucciones le Cuestan al Modelo
Tecnología

CLAUDE.md y el Contexto como Recurso Escaso: Lo que tus Instrucciones le Cuestan al Modelo

2026-06-01
#ia#agentes#arquitectura#eficiencia#llm

Hay un patrón que se repite en casi todos los equipos que trabajan con agentes de IA: el fichero de instrucciones crece. Y crece. Y nadie lo poda. En parte porque añadir una regla nueva es fácil, y en parte porque nadie asume el coste real de esa decisión.

El problema no es la longitud en sí. Es que cada línea de instrucción ocupa espacio en el contexto que el modelo podría dedicar a resolver tu problema. Tratar ese contexto como un cajón de sastre es el equivalente a llenar la RAM de tu servidor con logs que nunca lees.

  • El contexto de un modelo es un recurso finito y caro: todo lo que metes compite con lo que importa.
  • Instrucciones acumuladas sin criterio degradan la atención del modelo en tareas complejas, igual que la deuda técnica lastra un codebase.

Arquitectura: El prompt como decisión de ingeniería

Cuando un equipo diseña su infraestructura de agentes, dedica horas a elegir el modelo, la base de datos vectorial o el orquestador. Dedica minutos a redactar las instrucciones del sistema. Esa proporción está invertida.

Un system prompt bien diseñado no es documentación interna; es lógica de negocio compilada en lenguaje natural. Cada regla que añades debería superar la misma barra que supera una línea de código antes de entrar en producción: ¿está justificada? ¿se puede medir su efecto? ¿hay algo más ligero que haga el mismo trabajo?

Si no serías capaz de defender esa instrucción en una revisión de código, no debería estar en tu prompt.

La compresión de políticas —técnica que consiste en destilar el comportamiento aprendido en instrucciones más compactas— está ganando tracción precisamente porque el coste de inferencia no es trivial a escala. Lo que parece gratis en un prototipo se convierte en una partida de costes relevante cuando el agente procesa miles de conversaciones al día. Si ya has leído sobre los agentes que operan con autonomía económica, sabes que cada token procesado tiene un precio que alguien acaba pagando.

Eficiencia: Menos instrucciones, mejor comportamiento

Hay una paradoja en los sistemas de agentes muy instruidos: cuantas más reglas acumulas, más impredecible se vuelve el comportamiento. El modelo intenta satisfacer varias directrices en tensión y el resultado no es más control; es más ruido.

La alternativa no es eliminar instrucciones, sino diseñarlas con criterio de escasez. Eso implica priorización explícita, eliminación de reglas redundantes y separación entre lo que debe ir en el prompt y lo que puede resolverse con lógica determinista fuera del modelo.

Este enfoque encaja directamente con la filosofía "small over big" que aplicamos en Room 714: no se trata de tener el sistema más potente, sino el más ajustado al problema. Si estás construyendo o auditando una arquitectura de agentes y sientes que el sistema prompt se te ha ido de las manos, es el momento de hacer una revisión quirúrgica antes de que el coste —en dinero y en calidad— escale contigo.

Artículos relacionados

City Skyline