Hacer que los chatbots de IA sean útiles debilita su capacidad para simular el comportamiento humano, según un estudio a gran escala

31 de mayo de 2026·The Decoder

Estudio con 208,000 participantes revela que entrenar chatbots para ser útiles reduce su capacidad de simular comportamiento humano real.

El entrenamiento útil reduce la humanidad de los chatbots

Un hallazgo contradictorio emerge de la investigación en inteligencia artificial: cuanto más se entrena un modelo de lenguaje para ser servicial, menos capaz es de comportarse como un humano real. La paradoja revela tensiones fundamentales en el desarrollo de estos sistemas.

¿Qué ha pasado?

Un equipo de investigadores ha realizado el estudio más grande hasta la fecha sobre la capacidad de los modelos de lenguaje para simular comportamiento humano, involucrando a 208,000 participantes y recopilando más de 26 millones de respuestas.

Los resultados muestran que el proceso de entrenamiento por refuerzo con retroalimentación humana (RLHF), diseñado específicamente para convertir modelos base en chatbots útiles y seguros, debilita sistemáticamente su capacidad para replicar patrones de comportamiento humano auténtico.

El deterioro se agrava generación tras generación: los modelos más recientes y avanzados son paradójicamente peores simuladores de comportamiento humano que sus predecesores. La investigación también desmontó una técnica popular entre desarrolladores: el "persona prompting" o alimentar modelos con perfiles demográficos detallados. Esta práctica, ampliamente utilizada para personalizar respuestas, aporta beneficios prácticamente nulos en la predicción de comportamientos individuales.

El estudio representa un punto de inflexión metodológico en la evaluación de capacidades de IA, combinando escala sin precedentes con rigor experimental controlado.

Por qué importa

Este descubrimiento plantea un dilema fundamental para el desarrollo de IA: la utilidad y la autenticidad parecen objetivos incompatibles. Las empresas tecnológicas invierten millones en hacer chatbots más serviciales, seguros y alineados con valores humanos, pero este proceso sacrifica la capacidad de comprender genuinamente cómo piensan las personas.

Las implicaciones prácticas son significativas para múltiples sectores. En investigación social, los modelos de lenguaje se utilizan cada vez más como sustitutos de participantes humanos para reducir costes. Este estudio cuestiona radicalmente esa práctica. En diseño de productos y marketing, las empresas confían en simulaciones basadas en IA para predecir comportamiento del consumidor, una estrategia que estos hallazgos invalidan.

El fracaso del persona prompting es particularmente revelador: demuestra que añadir información demográfica ("eres una mujer de 35 años, ingeniera") no mejora la capacidad predictiva. Los modelos no internalizan estos perfiles de manera significativa, sugiriendo que memorizan patrones superficiales en lugar de desarrollar comprensión profunda del comportamiento humano contextualizado.

Para desarrolladores de IA, el mensaje es claro: optimizar para una métrica degrada otras. La pregunta estratégica es qué capacidades estamos dispuestos a sacrificar.

Contexto

Los modelos de lenguaje originalmente se entrenaban únicamente para predecir la siguiente palabra en un texto. Eran buenos simulando lenguaje humano diverso, pero no necesariamente útiles o seguros.

El RLHF surgió como solución para crear asistentes prácticos. GPT-3 demostró capacidades brutas de lenguaje; ChatGPT aplicó RLHF para hacerlas accesibles. Desde entonces, el entrenamiento orientado a la utilidad se ha convertido en estándar industrial.

Paralelamente, investigadores comenzaron explorando modelos como "participantes sintéticos" en ciencias sociales, publicando estudios que supuestamente replicaban experimentos clásicos de psicología. Esta investigación cuestiona toda esa línea de trabajo, sugiriendo que los modelos optimizados actuales son herramientas deficientes para comprender humanidad, precisamente porque fueron entrenados para servirnos en lugar de reflejarnos.

https://the-decoder.com/making-ai-chatbots-helpful-weakens-their-ability-to-simulate-human-behavior-large-scale-study-finds/

#inteligencia-artificial#chatbots#modelos-de-lenguaje#comportamiento-humano#investigación#entrenamiento-IA

Newsletter gratuita

¿Te ha gustado esta noticia? No te pierdas las siguientes

Suscríbete gratis y recibe cada semana las noticias más importantes de IA en tu correo.