HomeMarketingLas indicaciones de "usted es un experto" pueden dañar la precisión de...
spot_img

Las indicaciones de “usted es un experto” pueden dañar la precisión de los hechos

spot_img

Las indicaciones personales de “eres un experto” pueden perjudicar el desempeño tanto como ayudar. Un nuevo estudio muestra que las indicaciones personales mejoran la alineación con las expectativas humanas, pero pueden reducir la precisión objetiva en tareas con mucho conocimiento, con efectos que varían según el tipo de tarea y el modelo. La conclusión es que las indicaciones personales funcionan mejor en algunos tipos de tareas que en otras.

Indicación de persona

Las indicaciones personales son una forma común de dar forma a cómo responden los modelos de lenguaje grandes, especialmente en aplicaciones donde el tono y la alineación con las expectativas humanas son importantes. Se utiliza ampliamente porque mejora la lectura y sensación de las salidas. Dado lo extendido que está el estímulo personal, puede resultar sorprendente que su efecto real en el rendimiento aún no esté claro, ya que investigaciones anteriores muestran resultados inconsistentes, lo que pone en duda si la técnica está ayudando o perjudicando.

Los investigadores concluyeron que las indicaciones personales no son ni beneficiosas ni perjudiciales en general, y que su eficacia depende del tipo de tarea.

Encontraron:

  • Mejora los resultados relacionados con la alineación, como el tono, el formato y el comportamiento de seguridad.
  • Las indicaciones personales degradan el rendimiento en tareas que dependen de la precisión y el razonamiento de los hechos.

En base a esto, los autores introducen un método llamado PRISM (Persona Routing via Intent-based Self-Modeling), que aplica personas de forma selectiva, utilizando enrutamiento basado en intenciones en lugar de tratar a las personas como una configuración predeterminada. Sus hallazgos muestran que las indicaciones personales funcionan mejor como herramienta condicional y proporcionan una mejor comprensión de cuándo las indicaciones personales ayudan y cuándo deben evitarse.

Manejo de señales de comportamiento

En la sección tres del artículo, los investigadores dicen que las personas expertas tienen “señales de comportamiento útiles”, pero que el uso ingenuo de la persona que provoca daños tanto como ayuda. Dicen que esto plantea la cuestión de si esos beneficios pueden separarse de los daños y aplicarse sólo cuando mejoren los resultados.

Leer  Google patente sobre el uso de señales contextuales más allá de la semántica de consultas

Las señales de comportamiento influyen en el resultado del LLM. Estas señales son la razón por la que funcionan las indicaciones personales. Impulsan mejoras en el tono, la estructura, el comportamiento de seguridad y en qué medida las respuestas coinciden con las expectativas. Sin ellos, las indicaciones personales no tendrían ningún beneficio.

Sin embargo, en una aparente paradoja, el artículo muestra que esas mismas señales interfieren con tareas que dependen de la exactitud de los hechos y el razonamiento. Es por eso que el documento los trata como algo que hay que gestionar, no maximizar.

Estas señales incluyen:

  • Adaptación estilística y combinación de tonos: Adopción de una voz profesional o creativa.
  • Formato estructurado: Proporcionar diseños técnicos o paso a paso.
  • Cumplimiento del formato: ayudar al modelo a seguir estructuras complejas, como correos electrónicos profesionales o explicaciones STEM paso a paso.
  • Intención siguiente: centrar el modelo en el objetivo subyacente del usuario, especialmente en tareas como la extracción de datos.
  • Rechazo de seguridad: identificar y rechazar solicitudes dañinas de manera más efectiva mediante la adopción de una función de “Monitor de seguridad”.

El mensaje de persona gana

El artículo encontró que las indicaciones personales fueron beneficiosas en cinco de ocho categorías de tareas:

  1. Extracción: +0,65 de aumento de puntuación.
  2. STEM: +0,60 de aumento de puntuación.
  3. Razonamiento: aumento de puntuación de +0,40.
  4. Escritura: Mejorada mediante una mejor adaptación estilística.
  5. Interpretación de un experto en el dominio: mejorado gracias a una mejor combinación de tonos.

Las indicaciones personales ganaron en las categorías anteriores porque tienen más que ver con el estilo y la claridad que con si la respuesta es correcta para los hechos y el conocimiento. También descubrieron que cuanto más larga y detallada es la indicación de la persona, más fuertes se vuelven la alineación y los comportamientos de seguridad.

Leer  Tiktok Ban retrasó nuevamente, permanecerá activo hasta septiembre

Fallos de mensajes de persona

Por el contrario, la personalidad experta degradó consistentemente el desempeño en las tres categorías restantes (de ocho) porque se basan en la recuperación precisa de hechos o en una lógica estricta en lugar del estilo y la claridad. La razón de la caída del rendimiento es que agregar una persona experta detallada esencialmente “distrae” al modelo al activar un “modo de seguimiento de instrucciones” que prioriza el tono y el estilo.

La activación de personas expertas se logra a expensas del “recuerdo de hechos”. El modelo está tan concentrado en tratar de actuar como un experto que olvida la información que aprendió durante su entrenamiento inicial. Eso explica las caídas en la precisión de los hechos y las matemáticas.

Las indicaciones de expertos de Persona obtuvieron peores resultados en las siguientes tres categorías:

  1. Matemáticas
  2. Codificación
  3. Humanidades (conocimiento fáctico memorizado)

El documento señala que en uno de los puntos de referencia de conocimiento (MMLU), la precisión cayó de un 71,6% de referencia a un 68,0% incluso con la personalidad “mínima”, y cayó aún más hasta un 66,3% con la personalidad “larga”.

Explicaron las mejoras de seguridad:

“Las descripciones de personas más detalladas proporcionan información de alineación más rica, amplificando proporcionalmente los comportamientos de ajuste de instrucciones”.

Y mostró por qué la precisión objetiva se ve afectada:

“Persona daña las tareas de preentrenamiento
Durante el entrenamiento previo, los modelos de lenguaje adquieren capacidades tales como memorización de conocimientos fácticos, clasificación, reconocimiento de relaciones entre entidades y razonamiento de tiro cero. Se puede acceder a estas habilidades sin depender del ajuste de instrucciones y pueden verse dañadas por un contexto adicional de seguimiento de instrucciones, como indicaciones de personas expertas”.

Conclusiones alcanzadas

Los investigadores concluyen que las indicaciones personales mejoran constantemente las tareas que dependen de la alineación, como la escritura, los juegos de roles y el comportamiento de seguridad, al tiempo que degradan el rendimiento en tareas que dependen del conocimiento basado en el entrenamiento previo, incluidas las matemáticas, la codificación y los puntos de referencia de conocimiento general.

Leer  Casi 8 de cada 10 estadounidenses usan chatgpt para buscar, Adobe encuentra

También descubrieron que la sensibilidad de un modelo hacia las personas aumenta con su entrenamiento. Los modelos que están más optimizados para seguir instrucciones son más “dirigibles”, lo que significa que obtienen el mayor aumento en seguridad y tono, pero también sufren las mayores caídas en precisión.

Comidas para llevar

1. Sea selectivo al utilizar indicaciones personales:

  • No utilice de forma predeterminada las indicaciones “Usted es un experto”.
  • Trate las indicaciones personales como situacionales. Su uso en todas partes introduce riesgos ocultos de precisión.

2. Las indicaciones personales son efectivas para:

  • Calidad de escritura
  • Tono
  • Formato y organización
  • Legibilidad

3. Tareas que no se benefician de las indicaciones personales y, en su lugar, deberían utilizar indicaciones neutrales para preservar la precisión:

  • Verificación de hechos
  • Estadística
  • Explicaciones técnicas
  • Salidas con mucha lógica
  • Investigación
  • Análisis SEO

4. Recuerde estos tres hallazgos:

  • Utilice mensajes personales para generar contenido y luego cambie a un mensaje no personal (o un modo más estricto) para verificar los hechos.
  • Las indicaciones “expertas” muy detalladas fortalecen el tono y la claridad, pero reducen la precisión de los hechos y del conocimiento.
  • Las indicaciones de “Eres un experto” pueden hacer que un modelo dé prioridad a parecer correcto antes que a serlo realmente.

5. Haga coincidir sus indicaciones con la tarea:

  • Creación de contenido: Persona ayuda
  • Análisis y validación: La persona duele

El enfoque más eficaz no es un solo mensaje, sino un flujo de trabajo que cambia los mensajes dependiendo de la tarea, similar al enfoque PRISM del investigador.

Lea el trabajo de investigación:
Las personas expertas mejoran la alineación de LLM pero dañan la precisión: iniciando el enrutamiento de personas basado en la intención con PRISM

Imagen destacada de Shutterstock/ImageFlow

spot_img
ARTÍCULOS RELACIONADOS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Más popular

spot_img