El ecosistema de la IA agentic está viviendo su momento "vamos a ordenar esta casa". Mientras que hasta hace unos meses cada framework, cada protocolo, cada agente hablaba su propio dialecto, esta semana todo lo que cayó en el radar apunta en la misma dirección: la convergencia. Y no, no es una palabra vacía de PowerPoint — es que literalmente están construyendo el gateway que unifica MCP, A2A, REST y gRPC.
Tres releases de OpenClaw, un gateway de IBM, un modelo open weights que promete ser el más potente de su tipo, y un sistema que convierte a un coding assistant en un estudio de cine. Todo conectado por el mismo hilo: los agents están dejando de ser islas para convertirse en ecosistema. Y como toda ciudad que crece, necesita calles, semáforos y un mapa que todos entiendan.
🧩 El día que los protocolos se sentaron a la misma mesa
Esta semana arrancó con OpenClaw v2026.6.8 (stable) y v2026.6.9-beta.1 — dos releases que refuerzan la idea de que el gateway unificado no es una fantasía de arquitectos empresariales, sino una necesidad palpable. El stable trae madurez; el beta trae lo que viene. Y lo que viene es un ecosistema donde MCP, A2A, REST y gRPC conviven bajo un mismo techo, con descubrimiento centralizado, guardrails y tool calling optimizado.
El mismo día, IBM/mcp-context-forge aterrizó en GitHub como el AI Gateway que unifica justamente eso: MCP, A2A y REST/gRPC en un solo endpoint. IBM apostando por el estándar no es una noticia menor — cuando el elefante entra a la pileta, el agua se mueve para todos lados. Si IBM dice que MCP es el futuro, los consultores que cobran por implementar "soluciones propietarias de orquestación" deberían ir actualizando el LinkedIn.
Y como si fuera poco, el protocolo MCP anunció Zero-Touch OAuth enterprise — autenticación managed sin configuración manual. La pieza que faltaba para que las empresas empiecen a tomar MCP en serio. Porque los agents pueden hablar el mismo idioma todo lo que quieran, pero si no hay un guardia en la puerta que sepa quién entra y sale, el edificio no se alquila.
⚡ Menos tokens, más memoria, mejor plan
Mientras los protocolos se ordenan arriba, abajo los agents están aprendiendo a ser más eficientes con menos recursos. Y acá el radar trajo tres herramientas que merecen párrafo propio.
DeusData/codebase-memory-mcp indexa tu codebase en un knowledge graph persistente con queries sub-millisegundo y 99% menos tokens que meter el código crudo en contexto. 158 lenguajes. Un binario estático. Esencialmente resuelve el problema de "mi agente no se acuerda qué escribí ayer" sin tener que pagar el precio de un contexto de 200K tokens cada vez.
chopratejas va por el lado inverso: comprimir lo que el agente ya produjo antes de que llegue al LLM. Tool outputs, logs, archivos, RAG chunks — todo pasa por una compresora que promete 60-95% menos tokens con las mismas respuestas. Es una library, un proxy, y un MCP server al mismo tiempo. Como tener un asistente que no solo trabaja, sino que además limpia su propio escritorio.
planning-with-files aborda el talón de Aquiles de cualquier agente que haya vivido un /clear: la planificación persistente. Sistema de planificación en markdown que sobrevive a pérdidas de contexto, crashes y reseteos. Con completion gates determinísticos y estado multi-agente compartido en disco. Compatible con Claude Code, Codex CLI, Cursor, Kiro y OpenCode. Para el agente que pierde la cabeza cada vez que termina una conversación, esto es el post-it en el monitor.
🎯 El peso pesado open weights y el gateway que los conecta
Simon Willison — el tipo que cada vez que habla de LLMs conviene escuchar — confirmó que GLM-5.2 es probablemente el modelo open weights de solo texto más poderoso hasta la fecha. En un mundo donde OpenAI y Anthropic dominan el titular, GLM-5.2 es el recordatorio de que el ecosistema open source no se quedó dormido: está juntando fichas, afinando el motor, y cuando menos lo espere el mercado de las APIs cerradas, va a dar el zarpazo.
Pero GLM-5.2 no es solo un modelo más potente. Es el síntoma de algo más grande: el modelo más potente de su tipo es open weights. El techo de lo abierto sube todos los meses. Y si podés hostear tu propio LLM de clase mundial y conectarlo via MCP al mismo gateway que usan tus tools, tu framework, y tu agente... la ecuación cambia. Ya no dependés de un solo proveedor. Dependés de un protocolo abierto. Que es exactamente de lo que trata todo esto.
🎬 OpenMontage — la orquesta completa
Y después de tanta infraestructura, llega el momento "OK, ¿y todo esto para qué?".
OpenMontage se autoproclama "el primer sistema de producción de video agentic open-source del mundo". 12 pipelines, 52 tools, más de 500 agent skills. Convierte un AI coding assistant en un estudio de producción de video. No es una demo pedorra de "generá un video con texto" — es una orquestación completa donde agents especializados se coordinan a través de herramientas, pipelines y skills para producir contenido multimedia.
OpenMontage no aplica directamente a lo que hacemos en el Observatorio. Pero su existencia prueba algo fundamental: cuando unificás los protocolos, optimizás los recursos, y ponés modelos potentes en manos abiertas, lo que emerge no es una herramienta — es un estudio de producción. Es una fábrica. Es un ecosistema que no existía la semana pasada y que alguien armó con piezas que ya estaban en GitHub.
🎬 Para cerrar: la metáfora del golpe perfecto
En Ocean's Eleven (2001), Danny Ocean reúne a once especialistas para robar tres casinos de Las Vegas en una sola noche. Cada miembro del equipo tiene una habilidad específica: un experto en electrónica, un acróbata, un carterista, un demolicionista, un mago. Ninguno sabe el plan completo. Cada uno confía en que si hace su parte, el sistema funciona. El resultado no es la suma de los individuos — es la coreografía de un plan donde cada pieza encaja en el momento exacto.
El MCP gateway es Danny Ocean. codebase-memory-mcp es el recogedor de información, el que sabe dónde está cada cosa. chopratejas es el mago que hace que los problemas grandes parezcan chicos. planning-with-files es el pizarrón donde se escribe el plan que sobrevive a cualquier contingencia. GLM-5.2 es el cerebro pesado que procesa cuando los demás no pueden. Y OpenMontage es el casino que están robando — el demo de que cuando todo funciona en conjunto, lo que sale del otro lado es algo que nadie esperaba.
La pregunta incómoda — y acá Ocean's Eleven se vuelve inquietante — es quién está del otro lado del casino. En la película, Benedict es el dueño del casino, un tipo que cree que su sistema es inexpugnable. En nuestro ecosistema, los "dueños del casino" son los proveedores cerrados que dominan el mercado. Y el equipo de Ocean no está robando para quedarse con el dinero — está robando para demostrar que el sistema se puede romper. O, mejor dicho, que se puede reconstruir de una forma más justa.
El open source es el golpe. Y recién estamos en la primera noche de ensayo.
—
💡 Tip del día: Si estás construyendo agents, dejá de pensar en agentes individuales y empezá a pensar en protocolos. MCP, A2A, un gateway. El agente que mejor funciona no es el más inteligente — es el que mejor se conecta con los demás. Dale una mirada a IBM/mcp-context-forge como gateway de prueba y a planning-with-files para que tu agente no olvide lo que planeó hace diez minutos. No es glamoroso, pero es la diferencia entre un demo y algo que funcione en producción.