HomeMarketingEl nuevo visitante de la Web acaba de obtener una identidad
spot_img

El nuevo visitante de la Web acaba de obtener una identidad

spot_img

El 20 de marzo de 2026, Google añadió silenciosamente una nueva entrada a su lista oficial de buscadores web. No es un rastreador. No es un robot de entrenamiento. Un agente.

Google-Agent es la cadena de agente de usuario para los sistemas de inteligencia artificial que se ejecutan en la infraestructura de Google y navegan por sitios web en nombre de los usuarios. Cuando alguien le pide a un asistente de inteligencia artificial que investigue un producto, complete un formulario o compare opciones entre sitios web, el Agente de Google es lo que realmente visita la página. Project Mariner, la herramienta experimental de navegación mediante inteligencia artificial de Google, es el primer producto que la utiliza.

Este no es el robot de Google. El robot de Google rastrea la web continuamente e indexa páginas para realizar búsquedas. El Agente de Google sólo aparece cuando un humano se lo pide. Esa distinción cambia todo acerca de cómo opera.

Robots.txt no se aplica

Google clasifica a Google-Agent como un buscador activado por el usuario. La categoría incluye herramientas como Google Read Aloud (texto a voz), NotebookLM (análisis de documentos) y Feedfetcher (RSS). Todos ellos comparten una propiedad: un humano inició la solicitud. La posición de Google es que los buscadores activados por el usuario “generalmente ignoran las reglas de robots.txt” porque la búsqueda fue solicitada por una persona.

La lógica: si escribe una URL en Chrome, el navegador busca la página independientemente de lo que diga robots.txt. Google-Agent opera según el mismo principio. El agente es el proxy del usuario, no un rastreador autónomo.

Leer  Su rastreador de visibilidad de IA está rompiendo silenciosamente sus análisis y su estrategia

Esta es una desviación significativa de cómo OpenAI y Anthropic manejan tráfico similar. ChatGPT-User y Claude-User funcionan como recuperadores activados por el usuario, pero respetan las directivas robots.txt. Si bloquea ChatGPT-User en robots.txt, ChatGPT no buscará su página cuando un usuario le solicite que navegue. Google hizo una llamada diferente.

Los propietarios de sitios web que confiaban en robots.txt como mecanismo de control de acceso universal ahora tienen una brecha. Si necesita restringir el acceso desde el Agente de Google, necesitará autenticación del lado del servidor o controles de acceso. Las mismas herramientas que usarías para bloquear a un visitante humano.

Identidad criptográfica: autenticación de bot web

El desarrollo más significativo está enterrado en una sola línea de la documentación de Google: Google-Agent está experimentando con el web-bot-auth protocolo utilizando la identidad https://agent.bot.goog.

Web Bot Auth es un borrador de estándar del IETF que funciona como un pasaporte digital para bots. Cada agente posee una clave privada, publica su clave pública en un directorio y firma criptográficamente cada solicitud HTTP. El sitio web verifica la firma y sabe, con certeza criptográfica, que el visitante es quien dice ser.

Cualquiera puede falsificar las cadenas de agentes de usuario. La autenticación de Web Bot no puede. La adopción de este protocolo por parte de Google, incluso de forma experimental, indica hacia dónde se dirige la identidad del agente. Akamai, Cloudflare y Amazon (AgentCore Browser) ya lo admiten. Google aporta la masa crítica.

Esto es importante porque la web está a punto de tener un problema de identidad. A medida que aumenta el tráfico de agentes, los sitios web deben distinguir entre agentes de IA legítimos que actúan en nombre de usuarios reales y raspadores que pretenden ser agentes. La verificación de IP ayuda, pero las firmas criptográficas escalan mejor y son más difíciles de falsificar.

Leer  El modo Google AI introduce la visualización de datos para consultas financieras

Qué significa esto para su sitio web

Google-Agent crea un modelo de visitantes de tres niveles para la web:

  1. Visitantes humanos navegando directamente.
  2. Rastreadores indexación de contenidos para búsqueda y formación (Googlebot, GPTBot, Google-Extended).
  3. Agentes actuando en nombre de humanos específicos en tiempo real (Agente de Google, Usuario de ChatGPT, Usuario de Claude).

Cada nivel tiene diferentes reglas de acceso, diferentes intenciones y diferentes expectativas. Un rastreador quiere indexar su contenido. Un agente quiere completar una tarea. Puede ser leer la página de un producto, comparar precios, completar un formulario de contacto o reservar una cita.

Esto es lo que debe hacer ahora:

Supervise sus registros. Google-Agent se identifica con una cadena de agente de usuario que contiene compatible; Google-Agent. Google publica rangos de IP para su verificación. Comience a realizar un seguimiento de la frecuencia con la que visitan los agentes, a qué páginas acceden y qué intentan hacer.

Verifique su CDN y las reglas de firewall. Si sus herramientas de seguridad bloquean agresivamente el tráfico que no es del navegador, es posible que el Agente de Google sea rechazado antes de que llegue a su servidor. Verifique que los rangos de IP publicados por Google estén permitidos.

Pruebe sus formularios y flujos. El Agente de Google puede enviar formularios y navegar por procesos de varios pasos. Si sus formularios de pago, reserva o contacto se basan en patrones de JavaScript que confunden a los sistemas automatizados, los visitantes de los agentes fallarán silenciosamente. El HTML semántico y las etiquetas claras siguen siendo la base.

Acepte que robots.txt ya no es una herramienta de control de acceso completa. Para el contenido que realmente necesita restringir, utilice la autenticación. robots.txt fue diseñado para rastreadores. La era de los agentes necesita límites diferentes.

Leer  Cómo ven los agentes de IA su sitio web (y cómo crearlo para ellos)

La Web híbrida no llega. Está registrado

Hace un año, la idea de que los agentes de IA navegaran por sitios web junto con los humanos fue una predicción de una conferencia. Hoy en día, tiene una cadena de agente de usuario, rangos de IP publicados, un protocolo de identidad criptográfico y una entrada en la documentación oficial de Google.

La web no se dividió en humanos y máquinas. Se fusionó. Cada página que publicas ahora sirve a ambas audiencias simultáneamente, y Google acaba de hacer posible ver exactamente cuándo aparece la audiencia no humana.

Más recursos:


Esta publicación se publicó originalmente en No Hacks.


Imagen de portada: Summit Art Creations/Shutterstock

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img