HomeMarketingLa orientación de LLM no se transfiere como lo hizo la orientación...
spot_img

La orientación de LLM no se transfiere como lo hizo la orientación de SEO

spot_img

Durante aproximadamente dos décadas, la disciplina SEO operó sobre una suposición silenciosa que resultó ser una de sus características más valiosas. Orientación de un motor de búsqueda viajó. Si Google dijo que los mapas de sitio importaban, Bing dijo que los mapas de sitio importaban. Si Bing dijo que los datos estructurados merecían un esfuerzo real, Google dijo lo mismo. Los profesionales optimizaron para Google con una confianza razonable en que el trabajo se trasladaría a los demás motores, y la mayor parte de las veces así fue. Esa portabilidad no fue suerte. Era el producto de una capa estructuralmente grande que los principales motores de búsqueda habían construido conjuntamente, ladrillo a ladrillo, durante veinte años.

Ese mundo no existe en LLM-land. Los principales proveedores entrenan en diferentes corpus, ejecutan diferentes rastreadores bajo diferentes políticas, enrutan diferentes consultas a través de diferentes sistemas de recuperación y aplican diferentes procesos de alineación que dan forma a la respuesta final en formas que las señales ascendentes no pueden predecir. La orientación de cualquier proveedor, incluida la orientación de Google sobre sus propios productos Gemini, es un dato. Los profesionales que sigan adelante con el hábito de SEO, el hábito de tratar la guía de un motor como si fuera el mapa completo, optimizarán con confianza para una plataforma y perderán las demás.

Barra lateral: mientras estaba finalizando este artículo, Google publicó nuevas pautas sobre cómo optimizar sus funciones de IA generativa. Su encuadre es explícito: desde la perspectiva de la Búsqueda de Google, optimizar para la búsqueda con IA sigue siendo SEO. Ese encuadre es preciso para la Búsqueda de Google. No se extiende a ChatGPT, Claude, Perplexity ni ningún otro LLM, y esa es precisamente la trampa de la que trata este artículo.

Los estándares compartidos que hicieron que la orientación SEO fuera portátil

La era de la guía portátil se basó en la colaboración real, no en la coincidencia. El protocolo Sitemaps se convirtió en propiedad conjunta de Google, Yahoo y Microsoft en noviembre de 2006, cuando los tres motores acordaron formalmente admitir un protocolo común en la versión 0.90, basándose en el anterior Sitemaps 0.84 de Google de junio de 2005. Cinco años después, el 2 de junio de 2011, los mismos tres motores lanzaron Schema.org, y Yandex se unió poco después, para crear un vocabulario común para el marcado de datos estructurados. Ese fue el anuncio que se hizo en el escenario de SMX Advanced. Yo estaba en el equipo de Bing en ese momento y lo que me llamó la atención en ese momento es lo que todavía importa ahora. Las locomotoras eran competidoras, pero habían decidido que un vocabulario compartido les servía a todas. Los webmasters tienen un conjunto de reglas. La web obtuvo datos más limpios. Los motores recibieron mejores señales. Todos ganaron.

El patrón se repitió con robots.txt, la convención de 1994 que se convirtió en RFC 9309 en el IETF en 2022, formalizando lo que todo rastreador serio ya respeta. Y se repitió nuevamente, más recientemente, con IndexNow, el protocolo que Microsoft Bing y Yandex lanzaron en octubre de 2021. IndexNow ahora es compatible con Bing, Yandex, Naver, Seznam y Yep. Google ha probado el protocolo desde 2021, pero no lo ha adoptado.

Leer  Los datos recientemente lanzados muestran que dominan las referencias de búsqueda de IA de escritorio

Esa capa de superposición es exactamente la razón por la que parecía seguro seguir la guía de Google, incluso si le importaba el tráfico de Bing. Las señales que utilizaban los motores no eran idénticas, pero sí las entradas que aceptaban, los protocolos que respetaban y los estándares que publicitaban. La optimización tenía un sustrato compartido.

Donde realmente divergen las pilas de LLM

El entorno LLM no tiene un sustrato compartido de tamaño comparable. Las diferencias no son cosméticas ni temporales. Están integrados en la forma en que se construyen los sistemas.

Comience con los datos de entrenamiento. OpenAI ha firmado acuerdos de licencia revelados con News Corp por un valor de hasta 250 millones de dólares durante cinco años, Axel Springer por aproximadamente 13 millones de dólares al año, Reddit por un valor estimado de 70 millones de dólares al año, además del Financial Times, Condé Nast, Hearst, Vox Media, The Atlantic, Associated Press, Le Monde y otros. Google tiene su propio acuerdo con Reddit, estimado en 60 millones de dólares al año, que otorga acceso a la API de datos en tiempo real. Anthropic no ha revelado públicamente acuerdos de licencia de editor equivalentes, y ese estado de no divulgación es en sí mismo el punto al que se enfrentan los profesionales. Los corpus que alimentaron estos modelos y que continúan actualizándolos no son los mismos documentos. Los profesionales no pueden saber qué ha pagado un determinado proveedor y qué no.

La infraestructura del rastreador diverge a continuación. OpenAI ejecuta tres bots separados: GPTBot para capacitación, OAI-SearchBot para indexación de búsqueda y ChatGPT-User para recuperación iniciada por el usuario. Anthropic ejecuta tres propios: ClaudeBot para capacitación, Claude-SearchBot para búsqueda y Claude-User para recuperación iniciada por el usuario. Perplexity ejecuta PerplexityBot y Perplexity-User. Google presentó Google-Extended en septiembre de 2023 como el agente de usuario que controla si Google puede usar el contenido de un sitio para entrenar a Gemini, completamente separado del robot de Google que maneja la indexación de búsqueda tradicional. No existe un único usuario-agente de IA. Cada proveedor requiere una regla separada, y las reglas no se traducen claramente entre proveedores porque los bots no realizan trabajos equivalentes de manera equivalente.

Las arquitecturas de recuperación divergen estructuralmente. ChatGPT históricamente ha utilizado el índice de Bing como su principal fuente de búsqueda web, y esa conexión parece seguir siendo principal, aunque OpenAI continúa construyendo infraestructura adicional junto con ella. Perplexity construyó su sistema de recuperación sobre una tubería basada en Vespa que trata documentos y fragmentos de subdocumentos como unidades recuperables de primera clase. Gemini de Google utiliza el propio índice de Google más la base de Knowledge Graph. Claude utiliza Brave Search como socio de recuperación. La misma consulta, cuatro sistemas de recuperación diferentes, cuatro puntos de vista diferentes sobre qué fuentes existen y qué fuentes vale la pena sacar a la luz.

Luego viene la capa de alineación, que es donde el SEO no tenía equivalente alguno. Después de entrenar un modelo en su corpus, los proveedores ejecutan un entrenamiento posterior para determinar cómo se comporta realmente el modelo: tono, patrones de rechazo, formato, postura de seguridad, qué se considera una buena respuesta. El enfoque principal de OpenAI ha sido RLHF, o aprendizaje por refuerzo a partir de la retroalimentación humana, donde los evaluadores humanos califican los resultados del modelo y el modelo aprende a producir respuestas altamente calificadas. Anthropic desarrolló la IA constitucional, que entrena modelos para criticar y revisar sus propios resultados en función de un conjunto de principios escritos. Estas metodologías producen comportamientos demostrablemente diferentes en los productos finales. El mismo contenido recuperado, introducido en dos modelos alineados mediante dos metodologías, puede generar dos respuestas materialmente diferentes sobre la misma marca.

Leer  Cómo la IA detecta la vacilación del cliente (y la convierte en ventas)

Cuando se demuestra que la orientación de un proveedor no se adapta

El ejemplo más claro de guía que no se porta es llms.txt. Jeremy Howard de Answer.AI propuso el archivo en septiembre de 2024 como un manifiesto de rebajas, colocado en la raíz de un sitio, que guiaría a los LLM hacia el contenido más importante. La propuesta fue aceptada en toda la comunidad SEO. Yoast construyó un generador. Las agencias agregaron la creación de llms.txt a sus catálogos de servicios. Los ponentes de la conferencia lo declararon esencial.

A mediados de 2026, ningún proveedor importante de LLM ha confirmado que consume el archivo. No OpenAI. No antrópico. No Google. Los análisis de registros del servidor en cientos de miles de dominios muestran que los principales rastreadores de IA no solicitan rutinariamente /llms.txt en absoluto. John Mueller de Google lo comparó públicamente con la etiqueta de meta palabras clave obsoleta. Gary Illyes confirmó en Search Central Live en julio de 2025 que Google no admite llms.txt y no planea hacerlo.

He escrito sobre esto en otra parte, así que no repetiré los tecnicismos aquí. Lo que importa para este argumento es la lección estructural. Schema.org tuvo éxito porque tres motores lo construyeron juntos y luego lo implementaron juntos. Llms.txt fue propuesto por un investigador, adoptado por proveedores de herramientas e ignorado por las plataformas para las que se suponía que debía servir. El modelo de estándares compartidos que dio al SEO su guía portátil no está disponible para los profesionales del LLM a la misma escala, porque las plataformas no construyen los estándares juntas. Están construyendo sus propios oleoductos.

La inversión de Géminis

El ejemplo más claro de hasta qué punto se ha degradado la portabilidad de la orientación se encuentra dentro de una empresa. Google publica su propia documentación de SEO en Search Central, la guía canónica que la industria ha seguido durante dos décadas. Esos documentos enfatizan las señales de clasificación tradicionales, EEAT, calidad del contenido, accesibilidad técnica y datos estructurados. Esa guía sigue siendo útil para la propia Búsqueda de Google.

Google también fabrica Gemini, el modelo que impulsa las descripciones generales de IA y la superficie separada del modo AI de Google. Y el comportamiento de las citas de esas superficies no parece seguir la guía que la misma empresa publica para sus propios resultados de búsqueda.

A finales de 2024, aproximadamente tres cuartas partes de las páginas citadas en AI Overviews también se ubicaron entre las 12 primeras de Google para la misma consulta. A principios de 2026, después de que Google actualizara AI Overviews a Gemini 3 en enero, Ahrefs analizó 4 millones de URL de AI Overview y descubrió que solo el 38% de las páginas citadas también aparecían entre las 10 primeras para la misma consulta. Un análisis independiente de BrightEdge sitúa la superposición más cerca del 17%. El trabajo posterior a la actualización de SE Ranking encontró que Gemini 3 reemplazó aproximadamente el 42% de los dominios citados anteriormente en versiones de modelos anteriores y genera un 32% más de fuentes por respuesta.

La brecha se amplía aún más cuando nos fijamos en el Modo AI de Google, que es una superficie de conversación separada que se ejecuta en la misma familia Gemini. Los datos de Semrush muestran que AI Mode y AI Overviews llegan a conclusiones semánticamente similares el 86% de las veces, pero citan las mismas URL solo el 13,7% de las veces. Sólo el 14% de las citas en modo IA se encuentran en el top 10 tradicional de Google.

Leer  ¿Puede funcionar una red de 300.000 influencers basada en contenido generado por IA?

Hasta ahora parece que la relación canónica ha cambiado. La guía de SEO publicada por Google sigue siendo el camino más limpio para posicionarse en la Búsqueda de Google. Pero esa clasificación ya no es un indicador confiable para ser citado por las propias superficies de inteligencia artificial de Google. La misma orientación, el mismo contenido, el mismo dominio, pueden producir tres resultados significativamente diferentes en la Búsqueda de Google, las descripciones generales de IA y el modo IA, aunque los tres vivan dentro de la misma empresa. El viejo manual de seguir las instrucciones del motor de búsqueda y confiar en que las otras superficies del motor se comportarían consistentemente no parece estar dando los mismos resultados que antes.

Qué todavía hay puertos y por qué es más pequeño de lo que parece

Sobrevive una capa universal. La accesibilidad del rastreador sigue siendo importante para todos los proveedores. El contenido fáctico de la fuente primaria aún obtiene más citas que la reformulación del agregador. Una estructura limpia y recuperable aún ayuda a todos los sistemas a comprender de qué se trata una página. La presencia en las fuentes de alta autoridad que todos los principales LLM citan desproporcionadamente, Wikipedia, YouTube, Reddit y los principales medios de comunicación, todavía funciona como un multiplicador de fuerza en todas las plataformas. Obtener visibilidad en esas fuentes brinda al contenido la oportunidad de aparecer en cualquier LLM que se base en ellas.

Pero la capa universal es mucho más pequeña que en la era del SEO. El análisis de Qwairy de 118.000 respuestas de IA en ChatGPT, Perplexity, Google AI Mode y Claude encontró que solo el 11% de los dominios citados aparecían en múltiples plataformas. El 89% restante eran específicos de la plataforma. Una marca que obtiene menciones en Perplexity puede resultar en gran medida invisible en Claude. Es posible que una marca que sea una referencia habitual en ChatGPT no aparezca en las descripciones generales de IA. El mismo contenido puede ser la respuesta correcta para un sistema y la respuesta incorrecta para el sistema contiguo.

Qué significa esto para el trabajo

La implicación práctica no es abandonar toda esperanza. Es que los profesionales deben dejar de tratar la orientación de un solo proveedor de LLM como el mapa universal y comenzar a tratarla como un insumo entre varios. Lea lo que cada proveedor importante publica sobre sus propios sistemas. Pruebe su visibilidad en todas las plataformas, no solo en la plataforma que utiliza con más frecuencia. Trate la divergencia como el valor predeterminado y la superposición como la excepción, y no al revés.

No es así como funciona el SEO y la diferencia importa. El viejo reflejo era optimizar para Google y confiar en la portabilidad. La nueva realidad es que seguir las instrucciones de un LLM, incluso las de Google sobre Géminis, te dejará optimizado para una parte del panorama y potencialmente ciego al resto. La disciplina se está reconstruyendo a partir de un trabajo específico de plataforma que no existía en la era del SEO, y los profesionales que lo reconozcan primero pasarán los próximos dos años estableciendo los estándares que todos los demás siguen.

La superposición se ha reducido. Ahora tienes más trabajo que nunca por realizar.

Si tiene alguna idea sobre dónde es más marcada la divergencia entre proveedores en su propio trabajo, comuníquese directamente. Realmente me gustaría escuchar qué aparece en los datos.

Más recursos:


Esta publicación se publicó originalmente en Duane Forrester Decodes.


Imagen de portada: Rawpixel.com/Shutterstock; Paul Poesía/Diario del motor de búsqueda

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img