HomeMarketingLas guerras en tiempo de ejecución de agentes comenzaron esta semana
spot_img

Las guerras en tiempo de ejecución de agentes comenzaron esta semana

spot_img

El tiempo de ejecución del agente es la nueva capa del navegador y su sitio web se evaluará con respecto al tiempo de ejecución, no con ningún modelo individual.

Se trata de un cambio que los profesionales de la web aún no han realizado. La conversación todavía gira en torno a los modelos. ¿Qué modelo escribe mejor? ¿Cuál cita con mayor precisión? ¿Cuál API es más barata este mes? La conversación sobre modelos es ruidosa porque se envían nuevos modelos cada pocas semanas y cada lanzamiento es teatral.

La historia interesante es la que está debajo. Se están reconstruyendo los cimientos. Esta semana hizo que fuera imposible ignorarlo.

La pila de ejecución se envió en abril

El 15 de abril, Cloudflare lanzó Project Think, un nuevo SDK de agentes creado en torno a una ejecución duradera con recuperación de fallos y puntos de control, subagentes que se ejecutan como elementos secundarios aislados, sesiones persistentes con mensajes estructurados en árbol y ejecución de código en espacio aislado que se ejecuta en Dynamic Workers. A las pocas horas del mismo día, OpenAI envió la siguiente evolución de su SDK de agentes con ejecución nativa de sandbox y un arnés de modelo nativo. Dos de los operadores de infraestructura más grandes de la web enviaron respuestas competitivas a la misma pregunta, y la pregunta era: ¿cómo funciona realmente un agente de IA de larga duración en producción?

Luego, el 16 de abril, Cloudflare añadió cinco piezas más. AI Platform: una capa de inferencia independiente del proveedor que enruta modelos para agentes. Búsqueda de IA: un índice vectorial más un canal de fragmentación que se envía como un producto administrado específicamente para la recuperación de agentes, compitiendo con Pinecone y Algolia en la capa RAG del lado del agente en lugar de con Google AI Mode. Servicio de Email en beta pública, diseñado para que los agentes puedan utilizar como canal la interfaz más universal del mundo. PlanetScale Postgres y MySQL dentro de Workers. Y la base de ingeniería para alojar LLM de código abierto de gran tamaño como Kimi K2.5 directamente en la red de Cloudflare.

Leer  Cómo convertir su contenido en respuestas de IA

Sundar Pichai describió el mismo cambio una semana antes. En el podcast Cheeky Pint del 7 de abril con el cofundador de Stripe, John Collison, llamó a la Búsqueda un “administrador de agentes”: “Muchas de las consultas de búsqueda de información serán agentes en la Búsqueda. Completarás tareas. Tendrás muchos hilos en ejecución”. Muchos subprocesos por consulta es una descripción del tiempo de ejecución de la Búsqueda. El CEO de Google señala el mismo sustrato que Cloudflare y OpenAI enviaron esta semana.

Si OpenClaw era la web agencial para consumidores (una demostración jugable, un prototipo interesante, algo para hacer gestos), esta es la web agencial para adultos. Durable. En zona de pruebas. Auditable. El tipo de infraestructura en la que realmente administraría un negocio.

El patrón en todo esto es una cosa: el tiempo de ejecución. No el modelo. No la aplicación de chat para consumidores. No la diapositiva principal. El tiempo de ejecución es la capa donde los agentes se activan, persisten durante horas y días, se les da acceso al sistema de archivos, a la red y a la memoria. El tiempo de ejecución es la capa que decide si la sesión de un agente sobrevive a una falla, si se puede razonar sobre sus subagentes y si la ejecución de su código está contenida.

La pregunta equivocada y la nueva

Los profesionales de la Web han pasado los últimos 18 meses haciendo la pregunta equivocada. La pregunta era: ¿Para qué modelo de IA deberíamos optimizar? ChatGPT o Claude o Géminis o Perplejidad. ¿De quién son las citas que importan más? ¿A quién debemos dejar pasar? Esa conversación cobró sentido cuando las modelos leyeron su sitio web directamente.

Leer  Wikipedia prohíbe el uso de contenido generado por IA

Ya no lo hacen. El modelo lee lo que le entrega el tiempo de ejecución. El motor de ejecución obtuvo su página. El tiempo de ejecución lo analizó. El tiempo de ejecución ejecutó (o no ejecutó) su JavaScript. El tiempo de ejecución resolvió sus datos estructurados. La autenticación negociada en tiempo de ejecución. Cuando el modelo ve algo de su sitio web, está viendo la interpretación que hace el tiempo de ejecución.

La nueva pregunta, si se toma en serio esta semana, es en qué tiempo de ejecución del agente es legible su sitio web. Tres cosas para probar antes de la próxima semana:

  1. ¿Sus puntos finales más importantes devuelven respuestas estructuradas legibles por máquina o solo se muestran correctamente dentro de una sesión completa del navegador?
  2. ¿Su autenticación tiene un alcance tal que un agente que actúa en nombre de un usuario pueda mantener una sesión a través de múltiples llamadas, o solo admite inicios de sesión humanos de una sola vez?
  3. ¿Sus datos estructurados siguen significando lo mismo si un tiempo de ejecución que no ejecutó su JavaScript intentó leerlos?

Estas son preguntas sobre legibilidad en tiempo de ejecución. El modelo no tiene nada que ver con ellos. El tiempo de ejecución decide si su respuesta está pareja en la ventana de contexto del modelo, y el modelo elige lo que le entregue el tiempo de ejecución.

Se están reconstruyendo las tuberías de la red. Cada modelo en los próximos dos años verá su sitio web a través de uno de estos tiempos de ejecución, no directamente. El trabajo de su sitio web, a partir de ahora, es ser legible en tiempo de ejecución.

Leer  La búsqueda agente basada en tareas de Google está revolucionando el SEO hoy, no mañana

La conversación modelo seguirá ocurriendo en los escenarios de las conferencias y en las diapositivas principales. La conversación en tiempo de ejecución se produce en los registros de cambios de productos de las empresas de infraestructura. Las empresas que envían el tiempo de ejecución decidirán a qué sitios web llegarán mediante la búsqueda y el comercio de IA. Deja de preguntar qué modelo. Empiece a preguntar qué tiempo de ejecución.

Más recursos:


Esta publicación se publicó originalmente en No Hacks.


Imagen de portada: Viktoriia_M/Shutterstock

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img