HomeMarketingMedir cuándo los asistentes de IA y los motores de búsqueda no...
spot_img

Medir cuándo los asistentes de IA y los motores de búsqueda no están de acuerdo

spot_img

Antes de comenzar, es importante prestar atención a esta advertencia: ¡hay matemáticas por delante! Si hacer matemáticas y aprender ecuaciones te da vueltas la cabeza o te da ganas de sentarte y comer un pastel entero, prepárate (o toma un pastel). Pero si te gustan las matemáticas, si te gustan las ecuaciones y realmente crees que k=N (¡sádico!), este artículo te emocionará mientras exploramos la búsqueda híbrida con un poco más de profundidad.

(Crédito de la imagen: Duane Forrester)

Durante años (décadas), el SEO vivió dentro de un único circuito de retroalimentación. Optimizamos, clasificamos y realizamos un seguimiento. Todo tenía sentido porque Google nos dio el marcador. (Estoy simplificando demasiado, pero entiendes el punto).

Ahora, los asistentes de IA se encuentran encima de esa capa. Resume, cita y responde preguntas antes de que se produzca un clic. Su contenido puede aparecer, parafrasearse o ignorarse, y nada de él se muestra en los análisis.

Eso no hace que el SEO sea obsoleto. Esto significa que ahora corre paralelamente a él un nuevo tipo de visibilidad. Este artículo muestra ideas sobre cómo medir esa visibilidad sin código, acceso especial o un desarrollador, y cómo permanecer firme en lo que realmente sabemos.

Por qué esto importa

Los motores de búsqueda todavía generan casi todo el tráfico medible. Sólo Google maneja casi 4 mil millones de búsquedas por día. En comparación, el volumen total de consultas anuales reportado por Perplexity es de aproximadamente 10 mil millones.

Entonces sí, los asistentes todavía son pequeños en comparación. Pero están dando forma a cómo se interpreta la información. Ya puedes verlo cuando ChatGPT Search o Perplexity responde una pregunta y enlaza a sus fuentes. Esas citas revelan en qué bloques de contenido (fragmentos) y dominios confían actualmente los modelos.

El desafío es que los especialistas en marketing no tienen un panel nativo que muestre con qué frecuencia sucede esto. Google agregó recientemente datos de rendimiento del modo AI en Search Console. Según la documentación de Google, las impresiones, los clics y las posiciones del modo AI ahora se incluyen en el tipo de búsqueda “Web” general.

Esa inclusión es importante, pero está integrada. Actualmente no hay forma de aislar el tráfico del modo AI. Los datos están ahí, simplemente plegados en el cubo más grande. Sin división porcentual. Sin línea de tendencia. Aún no.

Hasta que esa visibilidad mejore, sugiero que podamos utilizar una prueba de proxy para comprender en qué coinciden y en qué divergen los asistentes y la búsqueda.

Dos sistemas de recuperación, dos formas de encontrarlo

Los motores de búsqueda tradicionales utilizan la recuperación léxica, donde relacionan palabras y frases directamente. El algoritmo dominante, BM25, ha impulsado soluciones como Elasticsearch y sistemas similares durante años. También se utiliza en los motores de búsqueda comunes de hoy en día.

Leer  Transformación de estrategias de creación de contenido: el impacto de la IA generativa

Los asistentes de IA se basan en la recuperación semántica. En lugar de palabras exactas, mapean el significado a través de incrustacioneslas huellas matemáticas del texto. Esto les permite encontrar pasajes conceptualmente relacionados incluso cuando las palabras exactas difieren.

Cada sistema comete errores diferentes. La recuperación léxica omite sinónimos. La recuperación semántica puede conectar ideas no relacionadas. Pero cuando se combinan, producen mejores resultados.

Dentro de la mayoría de los sistemas de recuperación híbridos, los dos métodos se fusionan mediante una regla llamada Fusión de rango recíproco (FRR). No es necesario que pueda ejecutarlo, pero comprender el concepto le ayudará a interpretar lo que medirá más adelante.

RRF en inglés sencillo

La recuperación híbrida fusiona varias listas clasificadas en una lista equilibrada. La matemática detrás de esa fusión es RRF.

La fórmula es simple: la puntuación es igual a uno dividido por k más el rango. Esto se escribe como 1 ÷ (k + rango). Si un elemento aparece en varias listas, suma esas puntuaciones.

Aquí, “clasificación” significa la posición del elemento en esa lista, comenzando con 1 como el primero. “k” es una constante que suaviza la diferencia entre los elementos de clasificación superior e intermedia. La mayoría de los sistemas suelen utilizar algo cercano a 60, pero cada uno puede ajustarlo de forma diferente.

Vale la pena recordar que un modelo vectorial no clasifica los resultados contando las coincidencias de palabras. Mide qué tan cerca está cada documento. incrustar es la incrustación de la consulta en un espacio multidimensional. Luego, el sistema ordena esas puntuaciones de similitud de mayor a menor, creando efectivamente una lista clasificada. Parece una clasificación de motor de búsqueda, pero está impulsada por matemáticas a distanciano frecuencia del término.

(Crédito de la imagen: Duane Forrester)

Hagámoslo tangible con números pequeños y dos listas clasificadas. Uno de BM25 (relevancia de palabras clave) y otro de un modelo vectorial (relevancia semántica). Usaremos k = 10 para mayor claridad.

Documento A ocupa el puesto número 1 en BM25 y el número 3 en la lista de vectores.
De BM25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
De la lista de vectores: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
Súmelos: 0,0909 + 0,0769 = 0.1678.

Documento B ocupa el puesto número 2 en BM25 y el número 1 en la lista de vectores.
De BM25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
De la lista de vectores: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909.
Sumarlos: 0,0833 + 0,0909 = 0,1742.

Documento C ocupa el puesto número 3 en BM25 y el número 2 en la lista de vectores.
De BM25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769.
De la lista de vectores: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833.
Sumarlos: 0,0769 + 0,0833 = 0.1602.

Documento B gana aquí ya que ocupa un lugar destacado en ambas listas. Si aumenta k a 60, las diferencias se reducen, produciendo una mezcla más suave y menos pesada.

Este ejemplo es puramente ilustrativo. Cada plataforma ajusta los parámetros de manera diferente y ninguna documentación pública confirma qué valores k utiliza cada motor. Piense en ello como una analogía de cómo se promedian múltiples señales.

Dónde vive realmente esta matemática

Nunca necesitará codificarlo usted mismo, ya que RRF ya forma parte de las pilas de búsqueda modernas. A continuación se muestran ejemplos de este tipo de sistema de sus proveedores fundamentales. Si lee todo esto, tendrá una comprensión más profunda de cómo plataformas como Perplexity hacen lo que hacen:

Leer  Google comparte detalles detrás del desarrollo del modo AI

Todos siguen el mismo proceso básico: recuperar con BM25, recuperar con vectores, puntuar con RRF y fusionar. Las matemáticas anteriores explican el concepto, no la fórmula literal dentro de cada producto.

Observando la recuperación de híbridos en la naturaleza

Los especialistas en marketing no pueden ver esas listas internas, pero podemos observar cómo se comportan los sistemas en la superficie. El truco consiste en comparar lo que clasifica Google con lo que cita un asistente y luego medir la superposición, la novedad y la coherencia. Esta matemática externa es una heurística, una representación de la visibilidad. No son las mismas matemáticas que las plataformas calculan internamente.

Paso 1. Reúna los datos

Elija 10 consultas que sean importantes para su negocio.

Para cada consulta:

  1. Ejecútelo en la Búsqueda de Google y copie las 10 URL orgánicas principales.
  2. Ejecútelo en un asistente que muestre citas, como Perplexity o ChatGPT Search, y copie cada URL o dominio citado.

Ahora tienes dos listas por consulta: Google Top 10 y Assistant Citations.

(Tenga en cuenta que no todos los asistentes muestran citas completas y no todas las consultas las activan. Algunos asistentes pueden resumir sin enumerar las fuentes. Cuando eso suceda, omita esa consulta, ya que simplemente no se puede medir de esta manera).

Paso 2. Cuente tres cosas

  1. Intersección (I): cuántas URL o dominios aparecen en ambas listas.
  2. Novedad (N): ¿Cuántas citas de asistentes no aparecen en el top 10 de Google?
    Si el asistente tiene seis citas y tres se superponen, N = 6 − 3 = 3.
  3. Frecuencia (F): con qué frecuencia aparece cada dominio en las 10 consultas.

Paso 3. Convierta los recuentos en métricas rápidas

Para cada conjunto de consultas:

Tasa de visibilidad compartida (SVR) = I ÷ 10.
Esto mide cuánto del top 10 de Google también aparece en las citas del asistente.

Tasa única de visibilidad del asistente (UAVR) = N ÷ total de citas de asistente para esa consulta.
Esto muestra cuánto material nuevo introduce el asistente.

Recuento de citas repetidas (RCC) = (suma de F para cada dominio) ÷ número de consultas.
Esto refleja la coherencia con la que se cita un dominio en diferentes respuestas.

Ejemplo:

Top 10 de Google = 10 URL. Citas de asistente = 6. Tres se superponen.
I = 3, N = 3, F (por ejemplo.com) = 4 (aparece en cuatro respuestas del asistente).
RVS = 3 ÷ 10 = 0,30.
Uavr = 3 ÷ 6 = 0,50.
CCR = 4 ÷ 10 = 0,40.

Ahora tiene una instantánea numérica de qué tan cerca los asistentes reflejan o divergen de la búsqueda.

Paso 4. Interpretar

Estos puntajes no son puntos de referencia de la industria de ninguna manera, simplemente son puntos de partida sugeridos para usted. Siéntase libre de realizar ajustes según sienta la necesidad:

  • Un SVR alto (> 0,6) significa que su contenido se alinea con ambos sistemas. La relevancia léxica y semántica están sincronizadas.
  • SVR moderado (0,3 – 0,6) con RCC alto sugiere que sus páginas son semánticamente confiables, pero necesitan un marcado más claro o enlaces más fuertes.
  • RVS baja (
  • Un RCC alto para los competidores indica que el modelo cita repetidamente sus dominios, por lo que vale la pena estudiar las señales de diseño de esquema o contenido.

Paso 5. Actuar

Si la SVR es baja, mejore los títulos, la claridad y la capacidad de rastreo. Si el RCC es bajo para su marca, estandarice los campos de autor, el esquema y las marcas de tiempo. Si el UAVR es alto, realice un seguimiento de esos nuevos dominios, ya que es posible que ya tengan confianza semántica en su nicho.

Leer  Los datos recientemente lanzados muestran que dominan las referencias de búsqueda de IA de escritorio

(Este enfoque no siempre funcionará exactamente como se describe. Algunos asistentes limitan el número de citas o las varían regionalmente. Los resultados pueden diferir según la geografía y el tipo de consulta. Trátelo como un ejercicio de observación, no como un marco rígido).

Por qué estas matemáticas son importantes

Esta matemática brinda a los especialistas en marketing una forma de cuantificar el acuerdo y el desacuerdo entre dos sistemas de recuperación. Es matemática de diagnóstico, no matemática de clasificación. No te dice por qué el asistente eligió una fuente; le dice que lo hizo y con qué consistencia.

Ese patrón es el borde visible de la lógica híbrida invisible que opera detrás de escena. Piense en ello como observar el clima observando el movimiento de los árboles. No estás simulando la atmósfera, solo leyendo sus efectos.

Trabajo en la página que ayuda a la recuperación híbrida

Una vez que vea cómo se desarrollan la superposición y la novedad, el siguiente paso es reforzar la estructura y la claridad.

  • Escriba en bloques cortos de afirmaciones y pruebas de entre 200 y 300 palabras.
  • Utilice títulos claros, viñetas y anclajes estables para que BM25 pueda encontrar términos exactos.
  • Agregue datos estructurados (Preguntas frecuentes, procedimientos, productos, artículos técnicos) para que los vectores y los asistentes comprendan el contexto.
  • Mantenga las URL canónicas estables y las actualizaciones de contenido con marca de tiempo.
  • Publique versiones canónicas en PDF para temas de alta confianza; Los asistentes suelen citar primero los formatos fijos y verificables.

Estos pasos son compatibles tanto con los rastreadores como con los LLM, ya que comparten el idioma de estructura.

Informes y encuadre ejecutivo

A los ejecutivos no les importa tanto el BM25 ni las incorporaciones como la visibilidad y la confianza.

Sus nuevas métricas (SVR, UAVR y RCC) pueden ayudar a traducir lo abstracto en algo mensurable: qué parte de su presencia de SEO existente se traslada al descubrimiento de IA y dónde se cita a los competidores en su lugar.

Combine esos hallazgos con los totales de rendimiento del modo AI de Search Console, pero recuerde: actualmente no se pueden separar los datos del modo AI de los clics web habituales, así que trate cualquier estimación específica de AI como direccional, no definitiva. También vale la pena señalar que es posible que todavía existan límites regionales en la disponibilidad de datos.

Sin embargo, estos límites no hacen que las matemáticas sean menos útiles. Ayudan a mantener las expectativas realistas y, al mismo tiempo, le brindan una forma concreta de hablar con el liderazgo sobre la visibilidad impulsada por la IA.

Resumiendo

La brecha entre la búsqueda y los asistentes no es un muro. Es más una diferencia de señal. Los motores de búsqueda clasifican las páginas después de conocer la respuesta. Los asistentes recuperan fragmentos antes de que exista la respuesta.

Las matemáticas de este artículo son una idea de cómo observar esa transición sin herramientas de desarrollo. No son las matemáticas de la plataforma; es un proxy del marketing que ayuda a hacer visible lo invisible.

Al final, los fundamentos siguen siendo los mismos. Aún optimiza para lograr claridad, estructura y autoridad.

Ahora puedes medir cómo viaja esa autoridad entre los sistemas de clasificación y los sistemas de recuperación, y hacerlo con expectativas realistas.

Esa visibilidad, contada y contextualizada, es la forma en que el SEO moderno se mantiene anclado en la realidad.

Más recursos:


Esta publicación fue publicada originalmente en Duane Forrester decodifica.


Imagen de portada: Roman Samborskyi/Shutterstock

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img