OpenAI dice que GPT-5.5 Instant, el modelo predeterminado para usuarios gratuitos de ChatGPT, ahora tiene un rendimiento comparable a sus modelos de pensamiento de vanguardia en cuestiones de salud. La afirmación se basa en las propias evaluaciones de salud de la empresa.
La salud es una de las categorías que suscita más escrutinio sobre las respuestas generadas por la IA. Por ejemplo, una investigación de The Guardian informó que algunas descripciones generales de IA de Google proporcionaban orientación médica inexacta y, posteriormente, Google eliminó las descripciones generales de IA para determinadas consultas médicas. La actualización de OpenAI cae en esa misma categoría de alto riesgo, pero con una afirmación de mejora en lugar de retroceso.
Para los editores y SEO en salud, eso significa que una audiencia grande y gratuita puede obtener respuestas médicas en ChatGPT en lugar de hacer clic para acceder a una fuente.
Lo que informó OpenAI
OpenAI apunta a ganancias en HealthBench y HealthBench Professional, la versión clínica. Dice que GPT-5.5 Instant obtiene puntuaciones más altas que GPT-5.3 Instant, el modelo al que reemplazó.
La compañía también informó de una caída en los problemas de factualidad en el tráfico en vivo. Dice que la tasa de respuestas de salud señaladas por al menos un posible problema de factibilidad cayó un 71% en dos meses. Esa cifra proviene de los monitores que OpenAI ejecuta en el tráfico de producción.
OpenAI realizó una tercera comparación con los médicos. Pidió a los médicos que escribieran respuestas a conversaciones de salud representativas y luego un panel separado de médicos las comparó con respuestas modelo. En esa comparación, el panel calificó las respuestas de GPT-5.5 Instant por encima de las escritas por los médicos en criterios que incluyen precisión, comunicación e integridad, en 3500 respuestas revisadas.
OpenAI dice que el modelo mostró menos modos de falla que los modelos más antiguos y los médicos. Señaló que hubo menos casos en los que se pasó por alto una señal de alerta o no se pidió más contexto al usuario.
Cómo lo midió OpenAI
HealthBench es un punto de referencia que la compañía construyó con su red de médicos, utilizando rúbricas escritas por médicos en lugar de preguntas estilo examen.
OpenAI dice que trabaja con más de 260 médicos en 60 países y que los médicos han revisado más de 700.000 respuestas de ejemplo hasta la fecha. La compañía ha citado la cifra de 260 médicos desde que lanzó ChatGPT Health en enero. Ninguno de los resultados ha sido publicado para revisión externa.
La salud ya es uno de los casos de uso más importantes de ChatGPT
OpenAI ha dicho que más de 230 millones de personas hacen preguntas sobre salud y bienestar a ChatGPT cada semana, una de las razones más comunes por las que la gente usa el chatbot.
La salud también se encuentra en una categoría protegida en las políticas de OpenAI. Cuando la compañía comenzó a probar anuncios en ChatGPT, dijo que no los publicaría en conversaciones sobre salud, salud mental o política.
Por qué esto importa
Las consultas médicas ya atraen una gran exposición a las respuestas de IA, con la tasa más alta de cualquier categoría en un análisis reciente de Ahrefs de las descripciones generales de IA de Google. Una mayor parte de esa demanda que se traslade al nivel gratuito de ChatGPT podría aumentar la presión de cero clics sobre los editores.
Es más difícil actuar sobre las afirmaciones de exactitud. OpenAI realizó las pruebas internamente, por lo que se enfrenta a la misma brecha de medición que con otras respuestas de IA en el ámbito de la salud. La compañía dice que sus respuestas de salud mejoraron, pero las afirmaciones no están verificadas por un tercero independiente.
Mirando hacia el futuro
La publicación no especifica cómo los cambios afectan las citas. Si más plataformas trasladan las respuestas de salud a niveles gratuitos, verificar las respuestas y manejar la pérdida de tráfico se convierte en responsabilidad de los profesionales.



