HomeMarketingMt. Stupid tiene una página de precios
spot_img

Mt. Stupid tiene una página de precios

spot_img

“Ahora existe amplia evidencia, recopilada en los últimos años, de que los sistemas de IA son impredecibles y difíciles de controlar”. Ese es Dario Amodei en enero, escribiendo sobre la tecnología que vende su empresa.

Compárelo con lo que aparece en su cronograma de LinkedIn esta semana. Aquí está el guión: El marcado de esquema garantiza que los motores de IA analicen su contenido. La primera oración de cada sección debe ser la respuesta. Optimice para la recuperación a nivel de fragmentos. Hay un aumento de citas del 13% disponible si haces X, una mejora de conversión de 2,8 veces si haces Y.

Es uno de los patrones más limpios que existen en este momento y la industria ha decidido no darse cuenta. Las personas más cercanas a estos sistemas son cada vez más cautelosas ante las afirmaciones de control. Las personas más alejadas de él están cada vez más seguras de saber cómo funciona… lo han descifrado. Ese gradiente corre en dirección equivocada.

Lo que realmente dicen las personas que lo construyeron

Anthropic publicó su principal artículo de investigación sobre interpretabilidad en mayo de 2024. Se abre:

“En general, tratamos los modelos de IA como una caja negra: algo entra y sale una respuesta, y no está claro por qué el modelo dio esa respuesta particular en lugar de otra”.

Anthropic, escribiendo sobre su propio modelo, hace dos años.

Las cosas no se han vuelto más seguras desde entonces. Neel Nanda, que dirige el equipo de interpretabilidad mecanicista de Google DeepMind, concedió una entrevista a 80.000 horas en septiembre de 2025 en la que el hallazgo principal fue que la versión más ambiciosa de Mech Interp probablemente esté muerta. No ve un mundo realista en el que la disciplina ofrezca “el tipo de garantías sólidas que algunas personas quieren de la interpretabilidad”. Vale la pena volver a leerlo.

La persona cuyo trabajo es leer las mentes de la IA está admitiendo públicamente que el proyecto, tal como se concibió originalmente, no llegará allí.

En NeurIPS 2024, Ilya Sutskever, cofundador de Safe Superintelligence y ex científico jefe de OpenAI, aceptó su premio Test of Time y usó la plataforma para decir algo que la sala no esperaba de él:

“Cuanto más razona, más impredecible se vuelve”.

La carrera de Sutskever es esencialmente la hipótesis de la escala con cara. Escucharle decir que la siguiente fase produce resultados menos predecibles es en sí mismo una admisión.

Ahora regresa a tu línea de tiempo. El gradiente es un rediseño de Dunning-Kruger a escala industrial: Mt. Stupid con una página de precios y el valle de calibración donde ocurre el trabajo real.

Crédito de la imagen: Pedro Días

Lo que realmente dicen las personas que lo venden

Un profesional publica un marco de cuatro pilares para el “GEO técnico”. Un consultor garantiza la inclusión en AI Overviews. Una agencia comercializa un aumento del 13% en la probabilidad de citación, derivado de los datos que la propia agencia produjo sobre sus propias recetas. Una publicación ampliamente compartida promete que mantener un límite de párrafos de 300 caracteres dicta cómo una base de datos vectorial divide su contenido. Un proveedor reclama una “participación del modelo” del 78%. Una cifra de alto nivel en su bandeja de entrada describe una mejora de 2,8 veces en la conversión desde que se cita en SGE.

Leer  OpenAI, Meta y ByteDance lideran el tráfico de bots de IA en el sector editorial

El vocabulario es determinista: “garantiza”, “garantiza”, “dicta”, porcentajes precisos hasta el decimal, marcos nombrados con seguridad. Nada de esto se parece en nada al lenguaje que utilizan las personas que construyeron estos sistemas cuando describen cómo se comportan los sistemas.

Esta es la parte en la que sigo estancado. Los consultores confían en las tácticas que han comparado con ellos mismos. Ejecute el mismo libro de jugadas en algunos clientes, observe cómo se mueve alguna métrica, llámelo evidencia. No hay grupos de control, ni hipótesis preregistradas, ni medición de lo que realmente se dice que cambia la táctica. Ése es el listón que debe superar una prueba real; todo lo demás ha sido confirmación disfrazada. El problema es el nivel de confianza, que es erróneo en un orden de magnitud independientemente de si la táctica subyacente tiene algún efecto. El mismo modelo que Anthropic públicamente dice que no puede explicar completamente está siendo optimizado por personas que afirman con confianza saber exactamente lo que están haciendo.

O Anthropic se ha mostrado sospechosamente modesto en público, o alguien más está sospechosamente seguro.

Cuando alguien prueba

El lunes de la semana pasada, Ahrefs publicó un estudio de Louise Linehan y Xibeijia Guan con un título que idealmente debería ser imposible: Realizamos un seguimiento de 1885 páginas agregando esquemas. Las citas de IA apenas se han movido.

La metodología es el tipo de trabajo que uno esperaría que fuera estándar, si la disciplina se preocupara por los estándares. 1885 páginas que agregaron el esquema JSON-LD entre agosto de 2025 y marzo de 2026. 4000 páginas de control coincidentes. Los cambios en las citas se midieron 30 días antes y 30 días después de que se agregara el esquema, en Google AI Overviews, Google AI Mode y ChatGPT. Diferencias en diferencias en los grupos emparejados.

El hallazgo: No hubo un aumento significativo en las citas en ninguna plataforma. Las descripciones generales de IA en realidad mostraron una disminución pequeña pero estadísticamente significativa. El informe señala que las probabilidades de que una brecha tan grande sea una probabilidad son de aproximadamente 1 entre 2.500. La tesis de que el esquema hace que los LLM comprendan su contenido, probada a escala frente a una línea de base controlada, no sobrevivió a la prueba.

Ésta es la confirmación empírica del argumento técnico que presenté hace una semana en El punto fue el desastre: que los LLM leen lenguaje no estructurado y que las prescripciones de esquemas y fragmentaciones son razonamientos sobre una arquitectura que no existe. De los primeros principios, hace dos semanas. De medición controlada, el pasado lunes.

Vale la pena sentarse con eso. La categoría prescriptiva dominante en todo el manual de GEO ha sido falsificada empíricamente bajo condiciones controladas, por un proveedor con una audiencia sustancial, abiertamente. Y los marcos siguen vendiéndose.

Entonces el propio Google respondió

El 15 de mayo de 2026, Google publicó documentación oficial sobre la optimización de funciones de IA generativa en la búsqueda. La página rompe los mitos por escrito con las prescripciones de GEO: los archivos llms.txt no son necesarios; no es necesario fragmentar el contenido; no es necesario reescribir contenido para sistemas de IA; no se requiere marcado de esquema especial; buscar menciones no auténticas no ayuda. El encuadre es inusualmente directo para una página de desarrollador de Google:

“Muchos de los ‘trucos’ sugeridos no son efectivos ni están respaldados por el funcionamiento real de la Búsqueda de Google”.

Google nombra Answer Engine Optimization y Generative Engine Optimization según sus términos completos y rechaza el manual de estrategias de plano.

Leer  Por qué importa más que nunca

Crédito de la imagen: Pedro Días

Ese es el motor de búsqueda que los consultores afirman estar optimizando, diciéndole a su propia audiencia de desarrolladores que las optimizaciones no funcionan. De los primeros principios, hace dos semanas. De medición controlada, el pasado lunes. Del propio Google, el pasado viernes. Tres fuentes independientes de la misma respuesta, todas en quince días. Todo ignorado por la gente que vende lo contrario.

El costo de preguntar

Aquí es donde el diagnóstico deja de ser cortés.

Las afirmaciones seguras se acumulan en estas plataformas de una manera que no lo hacen las correcciones escépticas. La diferencia está en quién paga. Publicar un reclamo seguro no le cuesta nada. Obtiene participación, crea una audiencia, genera entrada y hace que la presentación de diapositivas mire hacia el futuro. Si resulta que está mal, no pasa nada. Cuando alguien se da cuenta, todos han pasado al siguiente acrónimo.

Publicar la corrección le cuesta. Busca pelea. Te marca como un contrario, o peor aún, como alguien que no lo entiende. En LinkedIn, donde sucede la mayor parte de esto, va en contra de su marca profesional. El algoritmo no lo recompensará. El autor original es propietario de la sección de comentarios y puede ignorar su pregunta sobre metodología mientras escucha las respuestas de felicitación. Tu respuesta se encuentra en un hilo colapsado.

Hay un movimiento específico que vale la pena nombrar aquí. Pídale a un consultor de GEO que le explique, en términos sencillos, qué hace realmente su metodología, sobre qué mecanismo actúa, qué se consideraría evidencia y qué lo falsearía. La respuesta se convierte en jerga. “Alineación del espacio vectorial”. “Optimización de consultas T1”. “Recuperación semántica a nivel de fragmento”. Términos reales de la investigación del aprendizaje automático, pegados en combinaciones que suenan rigurosas y resisten la verificación en lenguaje sencillo. El patrón funciona porque puede. Preguntar “¿qué significa eso realmente?” parece ingenuo, y los observadores sin conocimientos técnicos específicos no pueden decir qué combinaciones son reales y cuáles se improvisan en el acto.

Lea los comentarios en cualquier publicación GEO de alto compromiso. Quince respuestas, 12 son acuerdos o “aquí hay otra habilidad para agregar a su lista”. Dos o tres ofrecen escepticismos enmarcados diplomáticamente: “Me encantaría ver más datos” o “la lista es correcta, pero…” El autor aborda sustancialmente la objeción filosófica porque es fácil rechazar “esto es demasiado técnico”. La objeción metodológica de que las habilidades prescritas producen una especulación segura sin una capa de medición subyacente recibe el más cortés entierro.

Lo que esto significa es iluminación de gas a escala industrial. Las personas que leen correctamente la tecnología quedan posicionadas como las que no se han puesto al día; las recetas que las pruebas controladas acaban de falsificar se venden como prospectivas. GEO ha descubierto cómo hacer que la calibración parezca la deficiencia.

Leer  Cómo usar LLMS para redireccionamientos 301 a escala

Un experimento X reciente capturó la dinámica fuera del SEO. Alguien publicó una pintura de Monet y afirmó que fue generada por IA, pidiendo a las respuestas que explicaran su inferioridad con respecto a un Monet real. Cientos de personas respondieron, catalogando con confianza los “indicios de la IA”. Pincelada plana, composición sin alma, sin cohesión, sin alma. Estaban analizando un Monet. El marco determinó lo que vieron.

Captura de pantalla de X, Mi 2026

La publicación original, donde muchas de las respuestas iniciales ahora han sido eliminadas.

Captura de pantalla de X, mayo de 2026

Es el mismo truco. Sustitutos de vocabulario para sustancia; el encuadre activa el sesgo de confirmación antes de que comience cualquier examen; la realización del análisis se convierte en lo que se compra y no en el análisis en sí; “Esto es X” llega antes de que nadie compruebe si lo es. Una vez establecido el marco, sigue el análisis.

Entonces, las personas más equipadas para contraatacar, los profesionales que realmente han intentado probar cosas, los SEO técnicos que saben qué hace y qué no hace el esquema, aquellos que pueden detectar un número de ascensor inventado desde el otro lado de la sala, se quedan callados.

El resultado, según los cronogramas que lee la alta dirección, es un mercado unilateral.

El costo recae en las personas que compran el reclamo. Los clientes pagan por auditorías de esquemas que el estudio de Ahrefs acaba de falsificar. Los profesionales jóvenes construyen carreras con metodologías que no sobrevivirán a una prueba controlada. Y la disciplina quema la credibilidad que necesitará más adelante, cuando la búsqueda tradicional se desplace aún más y se espera que los SEO se sienten en salas con equipos de ingeniería que acaban de pasar dos años observando el campo con confianza y malinterpretan la tecnología.

El conocimiento avanza al intentar refutar su hipótesis, no confirmarla. GEO hace lo contrario: realiza estudios diseñados para validar lo que ya vende. Si los profesionales que afirman tener esta experiencia ni siquiera intentan falsificarse, ¿quién esperamos que nos crea?

La ausencia son los datos

Despojamos el discurso y lo que queda es la ausencia.

Un campo técnico serio observa cómo una prueba controlada contradice sus prescripciones dominantes, y las prescripciones siguen vendiéndose. En ese momento, preguntarse si las recetas son incorrectas deja de ser la pregunta interesante. Eso ha sido respondido. La pregunta más difícil es qué le pasa a un campo que observa y no corrige.

Lo mismo con el gradiente. Cuando las personas que construyeron los sistemas protegen y las personas que optimizan esos sistemas garantizan, preguntar quién tiene razón deja de ser interesante. Los investigadores y los constructores tienen razón. Nadie que haya trabajado en la atribución de inferencias piensa lo contrario. La pregunta más difícil es por qué el campo permite que las garantías viajen sin oposición.

La respuesta honesta es que los incentivos no conducen a la corrección. La confianza vende de una manera que la precaución no puede vender. El marco reportable gana el presupuesto; la evaluación sensata pierde. Y el lenguaje confuso no cabe en una página de precios donde una garantía encaja perfectamente.

Nada de esto necesita villanos. El mercado de la atención siempre premia la confianza más que la calibración.

Puedes seguir viendo cómo el gradiente se ejecuta en la dirección incorrecta. O puede leer lo que realmente es: una industria parada en Mt. Stupid, cobrando por la vista.

Más recursos:


Esta publicación se publicó originalmente en The Inference.


Imagen de portada: Roman Samborskyi/Shutterstock

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img