Un nuevo análisis de 858.457 sitios alojados en la plataforma Duda muestra cómo los rastreadores de IA interactúan con sitios web a escala. Los datos ofrecen una visión más clara de cómo está creciendo la actividad de rastreo y qué deberían hacer los SEO y las empresas para aumentar el tráfico de la búsqueda con IA.
El rastreo de IA ya ha alcanzado escala
El rastreo de IA está creciendo rápidamente, con más solicitudes vinculadas a respuestas en tiempo real y la mayor parte de esa actividad proveniente de un único proveedor. Los datos crean un patrón que muestra qué sitios se están rastreando y, lo que es más importante, por qué.
Crecimiento año tras año en referencias de LLM
El tráfico de referencias de LLM ha aumentado considerablemente durante el último año, y múltiples plataformas muestran ganancias significativas desde puntos de partida muy diferentes.
Patrones de tráfico de referencia de IA
- Referencias totales de LLM: 93.484 a 161.469 (+72,7%)
- ChatGPT: 81.652 a 136.095 (+66,7%)
- Claude: 106 a 2488 (crecimiento 23 veces)
- Copiloto: 22 a 9.560 (desde casi cero)
- Perplejidad: 11.533 a 13.157 (+14,1%)
El crecimiento no se está produciendo de manera uniforme, pero en general, el tráfico de referencias desde los sistemas de inteligencia artificial está aumentando. Eso hace que los descubrimientos generados por IA sean una fuente creciente de tráfico, no marginal.
Los rastreadores obtienen cada vez más contenido para obtener respuestas terrestres
Los rastreadores de IA ya no se utilizan principalmente para la indexación, y ahora la mayor parte de la actividad está vinculada a la recuperación de contenido en tiempo real para generar respuestas para los usuarios.
La mayor parte del rastreo ahora se realiza en respuesta a consultas de los usuarios en lugar de crear un índice, lo que cambia la forma en que se accede y utiliza el contenido.
- Búsqueda de usuarios (respuestas en tiempo real): 56,9% de toda la actividad del rastreador, impulsada casi en su totalidad por ChatGPT
- Capacitación (aprendizaje de modelos): 28,8%, dividido entre GPTBot y otros rastreadores de modelos.
- Descubrimiento (indexación de contenido): 14,3%, distribuido en múltiples sistemas
- Volumen de recuperación de usuarios de ChatGPT: ~39,8 millones de visitas
Las tendencias están impulsadas en gran medida por ChatGPT, que es responsable de casi toda la actividad de recuperación en tiempo real. Eso significa que el movimiento hacia el rastreo basado en respuestas no se distribuye uniformemente, sino que se concentra en una plataforma que determina cómo se accede al contenido. Esta tendencia puede cambiar con el nuevo rastreador Google-Agent de Google.
Concentración del mercado en el rastreo de IA
La actividad de los rastreadores de IA está muy concentrada, siendo OpenAI responsable de la gran mayoría de las solicitudes, lo que refleja su posición como la principal herramienta en la que confían los usuarios para encontrar y recuperar información.
- OpenAI: 55,8 millones de visitas (81,0%)
- Antrópico (Claude): 11,5 millones (16,6%)
- Perplejidad: 1,3 millones (1,8%)
- Google (Géminis): 380.000 (0,6%)
La mayor parte de la actividad de rastreo de IA proviene de OpenAI, que se alinea con el papel de ChatGPT como herramienta principal para buscar y recuperar información. Claude le sigue con una participación mucho menor, lo que sugiere un patrón de uso diferente, mientras que el resto del mercado representa una porción mínima de la actividad de los rastreadores.
Escala y lo que eso realmente significa
El rastreo de IA ya está funcionando en una gran parte de la web, llegando a cientos de miles de sitios y generando decenas de millones de solicitudes en un solo mes.
Más de la mitad de todos los sitios del conjunto de datos recibieron al menos una visita de un rastreador de IA, lo que demuestra que esta actividad no se limita a un pequeño subconjunto de sitios web.
- Total de sitios analizados: 858,457
- Sitios con al menos una visita al rastreador de IA: 506,910 (59%)
- Total de visitas al rastreador de IA (febrero de 2026): 68,9 millones
El rastreo de IA no se limita a sitios de alto perfil o con mucho tráfico. Ya está muy extendido, con una actividad constante en la mayor parte de la web.
La relación entre el rastreo y el tráfico real
Los sitios que permiten que los sistemas de inteligencia artificial los rastreen muestran constantemente una participación más sólida en múltiples métricas.
Lo que realmente muestran los datos es:
- Los sitios que permiten el rastreo de IA reciben mucho más tráfico humano
- Los sitios con mayor tráfico tienen más probabilidades de ser rastreados
Los sitios que permiten el rastreo mediante sistemas de inteligencia artificial reciben significativamente más tráfico humano, con un promedio de 527,7 sesiones en comparación con 164,9 para los sitios que no se rastrean. Esto no establece una causalidad, pero muestra una clara alineación entre los sitios que atraen visitantes humanos y la frecuencia con la que los sistemas de inteligencia artificial los vuelven a visitar.
- Tráfico humano promedio (rastreado por IA o no): 527,7 frente a 164,9 (3,2 veces mayor)
- Promedio de finalización de formularios: 4,17 frente a 1,57 (2,7 veces más)
- Clic para llamar promedio: 8,62 frente a 3,46 (2,5 veces mayor)
- Sitios con más de 10.000 sesiones: tasa de rastreo del 90,5 %
Los sistemas de inteligencia artificial no descubren sitios débiles o inactivos y los levantan. Están regresando a sitios que ya atraen visitantes humanos. Para los especialistas en marketing, eso desvía el enfoque de intentar “ser rastreados” y se centra en generar una demanda real de audiencia, ya que la visibilidad en los sistemas de inteligencia artificial parece seguirla.
¿Qué se correlaciona con más gateo?
La investigación comparó sitios que incluyen integraciones específicas de terceros, características estructuradas y profundidad de contenido con aquellos que no lo hacen y encontró cuáles eran más importantes para la actividad y las referencias del rastreador de IA.
En todo el conjunto de datos, el 59 % de los sitios recibieron al menos una visita de un rastreador de IA en febrero de 2026. Los sitios que se rastrean con más frecuencia tienden a combinar tres tipos de señales: integraciones externas, datos comerciales estructurados y profundidad del contenido.
1. Integraciones externas
Estas integraciones conectan el sitio a sistemas externos que validan y distribuyen información comercial.
- Integración de Yext: Tasa de rastreo del 97,1 % frente a ~58 % sin (+38,9 pp)
- Integraciones de reseñas: Tasa de rastreo del 89,8 % frente al 58,8 % sin él, 376,9 visitas promedio al rastreador
Los sitios que están conectados a datos externos y sistemas de revisión se rastrean cada vez con más frecuencia, lo que indica que los sistemas de inteligencia artificial dependen de estas integraciones como señales de que una empresa es real, verificable y que vale la pena volver a visitar.
2. Características estructuradas del sitio y datos comerciales
Estos están integrados en el sitio y ayudan a los sistemas de inteligencia artificial a comprender y verificar la identidad empresarial.
- Sincronización de perfil de empresa de Google: tasa de rastreo del 92,8 % frente al 58,9 % sin ella, 415,6 visitas promedio del rastreador
- Esquema local: 72,3% vs 55,2% (+17,1pp), 22,3% de adopción
- Páginas dinámicas: 69,4% frente a 58,2% (+11,2pp)
- Comercio electrónico: 54,2% vs 59,2% (-5,0pp)
Los sitios que definen claramente su identidad empresarial y estructuran su información de forma legible por máquina se rastrean con más frecuencia, lo que demuestra que los sistemas de inteligencia artificial favorecen los sitios de los que pueden interpretar, verificar y extraer información fácilmente.
3. Profundidad del contenido (volumen de datos utilizables)
Los sitios con más contenido brindan más oportunidades para que los sistemas de inteligencia artificial recuperen, hagan referencia y reutilicen información en las respuestas.
- Sitios con más de 50 publicaciones de blog: 1373,7 visitas promedio al rastreador frente a 41,6 sin blog (~33 veces más)
Los sitios con más contenido se rastrean con mucha más frecuencia, lo que indica que los sistemas de inteligencia artificial pueden volver a fuentes que ofrecen una mayor fuente de información utilizable para generar respuestas.
Integridad del esquema empresarial local = más rastreo
Esta parte de la investigación se centra específicamente en el esquema empresarial local, comparando cómo se relaciona la integridad de la implementación del esquema para comunicar detalles comerciales con la actividad del rastreador de IA. Los campos medidos incluyen nombre de la empresa, número de teléfono, dirección, horario y perfiles sociales.
- Sin campos de esquema local: tasa de rastreo del 55,2 %
- 10 a 11 campos de esquema completados: tasa de rastreo del 82 %
- Los sitios con un esquema local más completo muestran una tasa de rastreo 26,8 puntos porcentuales más alta (82% frente a 55,2%)
Los sitios que proporcionan información comercial local más completa en forma estructurada se rastrean con más frecuencia y reciben más visitas de los rastreadores. A medida que se completan más campos de este tipo, tanto la tasa de rastreo como la frecuencia de rastreo aumentan.
Los datos muestran que los datos comerciales locales claramente definidos hacen que un sitio sea más fácil para los sistemas de IA identificar, verificar y posteriormente revisar todos los requisitos previos para recibir tráfico de la búsqueda de IA.
Comidas para llevar
El rastreo mediante IA es un método paralelo para el descubrimiento de contenido y la investigación muestra patrones claros para los sitios que los rastreadores visitan con mayor frecuencia.
- El rastreo de IA funciona junto con la búsqueda tradicional, cambiando la forma en que se accede y se reutiliza el contenido.
- Los sitios con señales locales estructuradas, contenido más profundo y esquemas más completos se rastrean con más frecuencia
- Múltiples señales de refuerzo aparecen juntas en los mismos sitios, no de forma aislada
- Los datos muestran dirección, no causalidad, pero los patrones son consistentes
Los datos muestran que los sitios que facilitan a los rastreadores de IA indexarlos y volver a visitarlos tienden a funcionar mejor. Curiosamente, los sitios que presentan información clara, estructurada y verificable, mientras continúan generando una demanda de audiencia real, tienen más probabilidades de ser visitados nuevamente por sistemas de IA y beneficiarse del tráfico generado a través de la búsqueda por IA.
Lea la investigación: Un estudio de Duda encuentra que los sitios web optimizados para IA generan un 320% más de tráfico a las empresas locales
Imagen destacada de Shutterstock/Preaapluem



