Al SEO se le han dado diferentes nombres en los últimos años, generalmente en función de lo que se intenta optimizar en ese momento: LEO (optimización de motor LLM), AEO, GEO, etc.
Es decir, antes de que Google presentara una nueva guía de búsqueda de IA y dijera la parte tranquila en voz alta: todo sigue siendo solo SEO.
Con todas estas siglas, una cosa que todavía parece escapar a nuestros objetivos es, como siempre, el usuario detrás de todo. Una cosa que la gente suele pasar por alto es que deberíamos optimizar la atención, no sólo las etiquetas y los nuevos términos de tres letras.
A menudo se dice que la atención es el principal bien del marketing. Si bien tengo reservas al respecto (la confianza es el motor fundamental y, sin ella, es difícil realizar una transacción), la atención es la primera puerta de entrada para que nuestro contenido sea considerado y una parte clave del recorrido del cliente, particularmente en un mundo que está saturado con resultados que son todos potencialmente relevantes.
Tenemos muchas formas de llamar la atención en diferentes etapas del viaje (lo cubrí brevemente en mi artículo anterior), y la mayoría de ellas son generalmente “universales”, como asegurarse de que su contenido sea relevante y esté alineado con la intención.
Sin embargo, cuando oímos hablar de “escalar internacionalmente”, las empresas operan bajo el supuesto (erróneo) de que lo que funciona para las personas en un mercado funcionará automáticamente para una audiencia similar en otro lugar. Esto difícilmente hace que la estrategia internacional sea reflexiva o eficiente.
¿Por qué deberíamos preocuparnos por captar la atención?
Llamar la atención es primordial porque lo que no se ve no se consume, y lo que no se consume no es atendido por el algoritmo.
Los seres humanos tienen una atención limitada a su disposición y parece haber disminuido significativamente en los últimos años. La investigación realizada por Gloria Mark, por ejemplo, sugiere que la capacidad promedio de atención en una pantalla es de alrededor de 47 segundos (frente a varios minutos en décadas anteriores). Y probablemente sea incluso menor en los canales de marketing, especialmente los que ofrecen contenido de formato breve.
De hecho, existen estudios experimentales que muestran que ciertos tipos de contenido breve pueden alterar activamente nuestra capacidad de recordar lo que se suponía que debíamos hacer después de un descanso. En un experimento que comparó contenido en diferentes plataformas, las personas que vieron TikTok durante una pausa tenían muchas más probabilidades de olvidar su tarea o intención original después, mientras que aquellos que vieron YouTube mostraron poco o ningún deterioro de ese tipo.
Esto apunta a un desafío aún mayor: incluso cuando somos inherentemente relevantes para el usuario, esto a menudo no es suficiente para asegurarnos de que nos preste atención temprana, especialmente si ya está involucrado en una tarea que ya está consumiendo algunos de sus recursos cognitivos. En resumen, no podemos dar por sentado la atención.
Esto hace que “llamar la atención” sea vital no sólo para el algoritmo, que utiliza el tiempo de permanencia y las señales de participación para determinar qué mostrar a continuación, sino también para los humanos, quienes podrían necesitar ser reorientados rápidamente hacia lo que estaban buscando después de abrir una aplicación y desviarse.
Y más allá del algoritmo, la atención es también la primera puerta de entrada a la persuasión humana. Entonces, a medida que los presupuestos se reducen y las expectativas siguen siendo las mismas, comprender cómo captar y dirigir la atención se convierte en el primer paso para optimizar el rendimiento del contenido.
¿Cómo difiere la atención entre localidades?
Cuando localizas una experiencia, tu objetivo debe ir más allá de las traducciones básicas: también quieres adaptarla al trasfondo cultural del país, que incluye preferencias de formato de contenido, conocimientos y referencias compartidos, y patrones de atención. Y diferentes patrones de atención dan forma a diferentes comportamientos.
Los lectores de habla inglesa aprenden a leer de izquierda a derecha, y esto determina la forma en que escanean el texto y los diseños visuales. Tendemos a ingresar a una página desde el lado izquierdo y superior, luego nos movemos hacia la derecha y hacia abajo, a menudo hojeando más a medida que avanzamos.
En la práctica, esto significa que los primeros elementos de la izquierda y de la parte superior reciben más atención visual, mientras que los elementos colocados hacia el borde derecho y de la parte inferior tienen más probabilidades de pasarse por alto cuando las personas navegan rápidamente.
Esto a menudo resulta en la “esquina de la muerte”, donde es menos probable que los logotipos colocados en la parte inferior derecha sean vistos (y, por lo tanto, recordados).
Y la dirección de lectura natural occidental se refleja en el patrón de exploración “F” con el que muchos de nosotros estamos familiarizados.
Sin embargo, hay más patrones de escaneo de texto, dependiendo del objetivo del usuario y el diseño de la página, desde un “patrón manchado” hasta un “patrón de capas” y varios otros que describen cómo las personas saltan entre puntos de interés en lugar de seguir cada línea en orden.
Por lo tanto, está claro que si diferentes páginas requieren diferentes patrones de atención, diferentes lugares (y diferentes direcciones de lectura) definitivamente también lo harán.
Un estudio rápido que realicé como prueba de concepto me mostró cómo, en promedio, los lectores de izquierda a derecha (por ejemplo, España) y los lectores de derecha a izquierda (por ejemplo, Egipto) consumen contenido visual de manera muy diferente. Los datos promediados de 30 participantes arrojaron mapas de calor donde la cohorte española muy a menudo se centraba en el lado izquierdo del anuncio, mientras que la egipcia ignoraba en gran medida la esquina inferior izquierda.
¿Por qué es esto importante?
No sólo para aislar elementos importantes que una audiencia diferente podría no ver en absoluto, sino también porque nos ayuda a enmarcar la página para el objetivo que queremos lograr.
Por ejemplo, a menudo utilizamos la primera opción de una serie de elementos como punto de partida para realizar todos los juicios posteriores. Piénselo: cuando llegamos a una página de categoría y el primer artículo es el más caro, todo lo demás parece una buena oferta.
Este es un fenómeno llamado “anclaje”, que se usa ampliamente para dirigir comportamientos de persuasión, como en este ejemplo del comercio electrónico Noon.

¿Y sabes qué hace Noon particularmente bien? Cuando cambia la configuración regional a EAU, los elementos cambian de página, de modo que el teléfono más caro ahora está en el lado derecho. Este es un gran ejemplo de localización correcta, ya que el primer elemento que verá un lector de habla árabe será el de la derecha, no el de la izquierda.

Más allá de los patrones de lectura, vale la pena señalar que ciertas culturas también tienden a centrarse en diferentes elementos de una página; por ejemplo, algunas audiencias se sienten más atraídas por las imágenes en negrita, mientras que otras dedican relativamente más tiempo al texto y los detalles contextuales. Y aunque me he centrado aquí en los lectores de izquierda a derecha y de derecha a izquierda, también hay sistemas de escritura vertical en los que la gente lee de arriba a abajo, añadiendo otro patrón de escaneo habitual a la mezcla y reforzando que no se puede asumir que un único diseño “universal” funcionará en todas partes. El seguimiento ocular le ayuda a ver estos sesgos en la práctica, de modo que pueda decidir si debe guiarse con imágenes, textos o contexto de apoyo para cada lugar en lugar de adivinarlo.
¿Cómo funciona el seguimiento ocular?
Los análisis tradicionales pueden decirnos algo sobre la atención, pero normalmente son un sustituto de otras métricas. Piense en los mapas de calor que puede obtener de Microsoft Clarity. Son realmente buenos para mostrar dónde el usuario se desplaza, hace clic y dónde falla el recorrido, pero todo esto es una medida de comportamiento explícito. Los patrones de atención a menudo no dejan rastro en nuestros análisis. Podemos inferir que lo que no se desplaza no se ve y que, a la inversa, lo que recibe un clic es algo que ha llamado la atención.
El seguimiento ocular va más allá y aísla datos que pueden darnos una comprensión de lo que se ve y lo que no, así como algunas indicaciones sobre el compromiso emocional y la carga cognitiva (que a menudo es un motivo de abandono).
Produce rutas de escaneo y mapas de calor basados en métricas como:
- Fijaciones: Momentos en los que los ojos se detienen brevemente y se centran en un punto específico, indicando dónde está realmente aterrizando la atención.
- Sacádicas: Los rápidos saltos que hacen los ojos entre fijaciones, muestran cómo las personas mueven su mirada a través de la página o pantalla.
- Dilatación de la pupila: Cambios en el tamaño de las pupilas que pueden reflejar excitación o esfuerzo mental mientras alguien mira su contenido.
- Coeficiente K: Una medida combinada de la duración de la fijación y la duración de la sacada que indica si alguien está escaneando ampliamente (ambiente) o centrándose de cerca (focal) en lo que ve.

Esta información se puede utilizar para optimizar la posición de elementos y mensajes, y guiar la atención en páginas de destino y creatividades.
Las opciones de nivel de investigación son muy precisas (y muy costosas), pero existen rastreadores oculares livianos basados en la web que puede aprovechar para realizar estudios de atención a una fracción del costo y de forma remota. Herramientas como GazeRecorder registran dónde miran las personas en una página o pantalla en tiempo real, luego lo convierten en rutas de escaneo y mapas de calor para que pueda ver qué elementos llaman la atención primero y cuáles se ignoran.
RealEye combina el seguimiento ocular basado en cámara web con codificación facial, etiquetando expresiones como sonrisas o sorpresa, para que puedas ver no sólo hacia dónde miran las personas, sino también si su respuesta emocional es más positiva o negativa, lo que puede resultar útil al probar anuncios o páginas de destino.
Y si no desea recopilar datos de mirada “reales” de los participantes en absoluto, también puede utilizar predicciones de atención sintéticas. Plataformas como EyeQuant utilizan modelos entrenados para simular cómo un espectador típico podría mirar una página y generar mapas de calor previstos en cuestión de segundos. Estos no sustituyen a los estudios de seguimiento ocular reales, pero pueden ser una forma rápida y que requiere poco esfuerzo de detectar problemas importantes de atención antes de invertir en pruebas completas.
Aprovechar los conocimientos de seguimiento ocular para optimizar el contenido a nivel internacional
Los conocimientos que se obtienen sobre la atención a partir de los estudios de seguimiento ocular superan en gran medida lo que podemos obtener de las métricas de comportamiento explícitas y pueden guiar cómo diseñamos experiencias mucho más allá de dónde colocamos logotipos y llamados a la acción.
A continuación se muestran algunas formas prácticas de utilizarlos:
- Identificar elementos en competencia. Utilice mapas de calor y rutas de escaneo para detectar partes de la página que desvían la atención de lo que importa (por ejemplo, imágenes de fondo ocupadas que roban la atención del producto o un botón secundario grande que eclipsa la llamada a la acción principal). Luego puedes simplificar, cambiar el tamaño o reposicionar esos elementos para que la atención fluya más claramente hacia tus objetivos clave.
- Fortalecer la jerarquía visual. Compruebe si las personas realmente ven el contenido en el orden previsto (por ejemplo, título → beneficio clave → producto → CTA). Si su mirada salta u omite información crucial, ajuste el diseño, la tipografía, el color y los espacios en blanco hasta que la ruta de escaneo coincida con la historia que desea que cuente la página.
- Refinar la creatividad por mercado. Ejecute el mismo diseño en diferentes países y compare dónde miran primero las personas y cuánto tiempo permanecen allí. Intercambie imágenes, colores o copie direccionalmente (p. ej., de izquierda a derecha, de arriba a abajo) para que coincidan con los patrones de lectura y los hábitos visuales locales, luego vuelva a realizar la prueba para ver si mejora la atención en los elementos clave.
- Iterar sobre mensajes y elementos visuales. Pruebe variaciones de titulares, imágenes destacadas y etiquetas de CTA mientras realiza un seguimiento no solo de los clics, sino también de la rapidez con la que los ojos llegan a ellos y cuánto tiempo permanecen allí. Si las personas solo hojean su mensaje principal, mejore la copia y ajuste su posición hasta que consiga una fijación más prolongada.
Incluso puede utilizar estos conocimientos para crear modelos predictivos simples para pronosticar el éxito inicial de las campañas en diferentes mercados y culturas. Por ejemplo, es posible que descubras que las fijaciones tempranas en la marca o el logotipo predicen un mejor recuerdo, que un mayor tiempo de permanencia en las CTA se correlaciona con una mayor intención de conversión o que las caras emocionales impulsan constantemente el compromiso intercultural.
Tenga siempre en cuenta que una talla única no sirve para todos, ni para todas las culturas, ni para todos los tipos de páginas ni para los objetivos de los usuarios. La página de un producto se escaneará de manera muy diferente a una página de ayuda o una publicación de blog, y su diseño debe respetar esas diferencias de intención.
Entonces, la próxima vez que le pidan escalar internacionalmente, esté atento (sin juego de palabras) a dónde va la atención, porque puede indicarle más de docenas de pruebas A/B y ayudarlo a ofrecer experiencias que funcionen con la percepción humana en lugar de contra ella.
Más recursos:
Imagen de portada: RobinRmD/Shutterstock



