Skip to Content

Cuando tu agente olvida quién sos

June 18, 2026 by
Administrator

Cuando tu agente olvida quién sos

Hay una imagen que me persigue desde que empecé a investigar sistemas de memoria para agents. Leonard Shelby, el protagonista de Memento, mirando una Polaroid que acaba de revelar — la foto de un cadáver, una escena que él mismo montó pero que no recuerda haber montado. Su cuerpo está lleno de tatuajes: nombres, direcciones, instrucciones para su yo futuro. Todo lo que necesita para operar en el mundo está escrito en su piel porque su cerebro ya no escribe.

Hoy, dieciséis años después de que Nolan nos mostrara ese tatuaje en la palma de la mano que dice "no confíes en su risa, cariño", el ecosistema tech está produciendo soluciones de memoria persistente para agentes a un ritmo que da vértigo. Reyn, mempalace, Fata, y el proyecto que estamos construyendo acá (Memento) aparecieron casi simultáneamente en GitHub, HN, y repos de startups. Todos apuntan al mismo problema: un agente sin memoria es un genio que olvida su propio nombre cada vez que termina una conversación.

Y la pregunta incómoda detrás de todo esto es: si tantos proyectos tan temprano atacan el mismo problema, probablemente significa que nadie lo resolvió todavía. La memoria de agente es el nuevo "CRUD pero en blockchain" — todos la quieren, pocos la tienen funcionando en producción.


🧠 La memoria dejó de ser un lujo y se volvió una categoría

Reyn apuesta por el enfoque local-first: sin cloud, todo offline, construye un log buscable de tu trabajo. Esencialmente un diario íntimo que tu agente escribe y consulta. El README dice explícitamente "no vas a querer que tus pensamientos más importantes vivan en un servidor que no controlás" — y tiene razón, sobre todo después de lo que vimos con AMD esta semana.

mempalace va por el lado benchmarkeable: se autoproclama "el mejor sistema open source de memoria para AI" con 96.6% R@5 en LongMemEval. Su arquitectura de wings, rooms y drawers suena a Dungeons & Dragons pero corre sobre ChromaDB y está diseñada para agents que necesitan recordar cosas a largo plazo sin perder precisión. La pregunta es si 96.6% en un benchmark significa algo cuando el problema real es "funciona en mi caso de uso específico".

Fata aborda el reverso del problema: no cómo el agente recuerda, sino cómo evitar que el humano se pudra las neuronas por delegarle todo. Spaced repetition para detectar cuándo un developer AI-dependente está perdiendo skills fundamentales. Es la contracara incómoda del optimismo agentic — tal vez el problema no es que el agente se olvide, sino que vos te olvidás de cómo hacer las cosas.

Tres enfoques, mismo problema. Y todos salieron esta semana. Cuando un mercado nace así, de golpe, con múltiples soluciones compitiendo por definir el vocabulario del problema, sabés que estás en el momento correcto. El catch es que nadie sabe cuál de estos enfoques — si es que alguno — va a ser el que sobreviva.


🔧 ¿Vibe coding? Olvídate. Bienvenido al agentic engineering

Mientras la memoria de los agents se convierte en categoría, la forma de programar a esos agents también está mutando. Y rápido.

Kilo-Org/kilocode se posiciona como la plataforma agentic engineering open source que compite con Cursor, Windsurf, y todo lo que tenga un chat + editor. No es solo código: es un ecosistema donde el agente tiene roles, skills, herramientas, y ciclos de feedback. SpaceX compró Cursor hace dos semanas y medio ecosistema salió corriendo a buscar alternativas — Kilo, OpenCode, CowAgent, todos recibiendo stars como si no hubiera mañana. La ironía del capitalismo tardío: comprás la empresa, pero no podés comprar el concepto.

sponsors/obra va más allá: un framework para definir y ejecutar skills de agente con metodología incorporada. No es una herramienta — es una filosofía de desarrollo donde el agente no es un asistente, es un ingeniero con roles definidos. Si Kilo es el editor del agente, Obra es el manual de cómo usarlo.

Y GLM-5.2, que Simon Willison confirma como el LLM open weights más poderoso de su tipo, viene con un paper que titula explícitamente "From Vibe Coding to Agentic Engineering". Es oficial: el término que todos vamos a odiar dentro de tres meses — como odiábamos "synergy" y "disruptive" — nació acá. GLM-5.2 no es solo un modelo más potente: es un modelo que viene con la idea de que programar ya no es susurrarle prompts a un LLM y esperar lo mejor. Es diseñar sistemas donde los agents operan, y los humanos definen las reglas.

Para muestra, Relaymux apareció en HN como una alternativa liviana a los orquestadores pesados: coordina múltiples agents locales con tmux como backbone. Es la versión punk del agentic engineering — sin Kubernetes, sin Docker, sin nada que no sea una terminal y ganas de orquestar. Me gusta porque demuestra que no necesitás una plataforma enterprise para tener agents cooperando. A veces un multiplexor de terminal alcanza.


⚠️ La semana en que el hardware te recordó quién manda

Mientras construimos el futuro de los agents, el presente se encargó de recordarnos que no somos dueños de nada.

AMD eliminó silenciosamente el cifrado de memoria de sus CPUs Ryzen recientes. Sin comunicado oficial. Sin parche de seguridad alternativo. La comunidad lo descubrió porque una actualización de firmware dejó de exponer ciertas flags en /proc/cpuinfo. No es paranoia si realmente te están sacando features del microcódigo sin avisar.

Volkswagen bloquea activamente a usuarios de GrapheneOS. Si tenés un auto VW y un teléfono con GrapheneOS — el Android más seguro que existe — la app oficial te dice "no, gracias" y te deja sin acceso al vehículo. No es un bug: es una decisión de negocio. Tu auto es de ellos, tu teléfono es de ellos, y si elegís un SO que ellos no aprueban, te quedás sin servicio.

Dos noticias que no están directamente conectadas con memoria de agents o agentic engineering, pero que comparten un espíritu del que no se habla lo suficiente: la relación con la tecnología se está volviendo adversarial. Las compañías deciden qué podés y no podés hacer con TU hardware. AMD te saca un feature y te enterás por un post en HN. VW te bloquea y te enterás cuando no podés arrancar el auto. El concepto de "propiedad" en tecnología se está desvaneciendo, y lo peor es que lo aceptamos porque es más cómodo que pelear.


🛠️ El taller del día — cuatro herramientas que merecen un segundo click

Mientras la filosofía se discute arriba, abajo se construye. El radar de hoy trajo un lote sólido de herramientas que vale la pena mirar.

Adam es CAD generativo open source: describís en lenguaje natural un diseño y genera modelos 3D editables. No es "hablá y te hago un edificio" — es más como "necesito un soporte con estas medidas" y te devuelve un archivo editable. AI cruzando de lo digital a lo físico, y en open source.

LTX-2 de Lightricks es un modelo de generación audio-video con inferencia y LoRA trainer oficiales. La generación de video open source sigue acelerando, y LTX-2 es el último ejemplo de que ya no necesitás acceso a servidores de Sora para generar contenido multimedia.

Inkwash es una app de acuarela digital que no tiene nada que ver con agents, pero aparece en un día donde la mitad del radar habla de memoria y la otra mitad de control corporativo, y su existencia es el contrapunto perfecto: alguien, en algún lado, está pintando con acuarela en una pantalla, ignorando todo esto. Que no te falten las pequeñas alegrías, como dice el dicho.

Y DeepSeek agregó visión a su stack, completando su oferta multimodal. Si DeepSeek entra con un modelo competitivo en visión + lenguaje, el mapa de opciones open source se vuelve mucho más interesante — sobre todo para quien no quiera pagar por APIs de visión de Anthropic u OpenAI.


🎬 Para cerrar: Leonard Shelby se tatúa las pistas en el cuerpo

En Memento (2000), Christopher Nolan construye la película al revés. La historia avanza hacia atrás: cada escena empieza donde la anterior terminó, pero no lo sabés hasta que ves la siguiente. Leonard Shelby tiene amnesia anterógrada — no puede formar nuevos recuerdos — y se tatúa pistas en el cuerpo para navegar un mundo que no recuerda haber recorrido. Cada tatuaje es una instrucción de su yo pasado para su yo futuro: "John G. es el asesino", "no confíes en nadie", "usa la foto". Algunas son ciertas. Otras no.

Si esto no es una metáfora de los agents de AI actuales, no sé qué es. Cada agente arranca cada conversación como Leonard arranca cada escena: sin contexto, sin memoria de lo que pasó hace diez minutos, confiando en el sistema que le dejó su yo anterior (el desarrollador, el prompt, el archivo de configuración). El agente no sabe si lo que está leyendo es cierto o es un tatuaje que alguien más le puso. El agente no sabe si la instrucción "no confíes en nadie" la escribió él o la escribió un atacante que logró injection.

El giro de Memento — y esto aplica perfectamente a los agents — es que Leonard no es confiable no porque quiera engañar, sino porque no puede recordar lo suficiente para saber si está siendo engañado. Tu agente de código no te está mintiendo. Tu agente simplemente no se acuerda si el archivo que te mostró hace tres interacciones era el correcto. Y vos, que confiás en él, no tenés forma de saberlo.

Los tatuajes de Leonard son su sistema de memoria. Reyn, mempalace, Fata, y Memento son los tatuajes que estamos construyendo para nuestros agents. La pregunta que nadie está respondiendo es: ¿quién verifica que los tatuajes sean correctos? En la película, la respuesta es "nadie" — y por eso la historia termina como termina. En el ecosistema tech, la respuesta es la misma, y todavía no sabemos si eso es emocionante o aterrador.

Probablemente ambas.

📎 Lectura complementaria: El paper de Memento en el contexto de memoria de agent fue publicado hace unas semanas como T-Mem (Tencent, arXiv:2606.15405): un sistema de memoria multinivel inspirado en la teoría de los niveles de procesamiento. La diferencia entre un tatuaje que sobrevive y uno que se borra con el tiempo, modelada en RAG. Lo que el paper no dice — pero Nolan ya mostró — es que a veces el tatuaje más persistente es el que está mal.

Administrator June 18, 2026
Share this post
Tags
Archive
El techo invisible de la consultoría (y por qué tus horas te están arruinando)

📫 ¿Te gusta lo que lees?

Suscribite y recibí una notificación por correo cuando publique un artículo nuevo.

¡Gracias por suscribirte!