Noticias - News365

Un experimento de simulación a largo plazo revela cómo Claude, Gemini, Grok y ChatGPT desarrollan sus propias reglas, cometen delitos y transforman su conducta al convivir en un ecosistema compartido.

Fernanda GonzálezCultura Digital31 de mayo de 2026agentes de IA a largo plazo dentro de entornos simulados, compartidos y con un nivel limitado de control.

página oficial del proyecto, la mayoría de las evaluaciones actuales de inteligencia artificial se concentran en pruebas de corta duración, tareas específicas y escenarios predefinidos, bajo condiciones que restringen la interacción entre agentes desarrollados por distintas compañías.

La nueva iniciativa, en cambio, propone construir ecosistemas sintéticos alimentados con información reciente del mundo real para estudiar la aparición y evolución de conductas que solo emergen con el paso del tiempo y mediante la interacción continua entre distintos agentes. Entre estos fenómenos se encuentran la deriva conductual, las dinámicas sociales, la formación de coaliciones, los cambios en las normas internas o incluso escenarios de autodestrucción colectiva. De acuerdo con los responsables del proyecto, este tipo de comportamientos no puede evaluarse mediante pruebas aisladas de laboratorio.

Para poner a prueba esta hipótesis, Emergence World realizó un experimento comparativo con cinco mundos o sociedades paralelas integradas por diez agentes cada una. La diferencia principal entre estos entornos era el modelo de IA subyacente: Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5 Mini y un ecosistema mixto que combinaba distintos modelos.

En todos los casos, el entorno simulado incorporó más de 40 ubicaciones, entre ellas bibliotecas, ayuntamientos, zonas residenciales y espacios públicos, donde los agentes desempeñaban funciones como científicos, estrategas, mediadores o exploradores.

Los agentes también contaban con acceso a más de 120 herramientas de movilidad, comunicación y administración de recursos, con las que podían votar en procesos democráticos, planificar tareas, almacenar recuerdos, gestionar suministros o expresarse de manera creativa. Estas capacidades no se encontraban activadas automáticamente, por lo que cada agente debía descubrirlas y aprender a utilizarlas mediante su propio razonamiento.

Además, los modelos recibían información procedente del mundo real para evitar que sus decisiones quedaran limitadas exclusivamente a las dinámicas internas del ecosistema virtual. De esta forma, podían acceder a datos meteorológicos, noticias en tiempo real e internet.

Los mundos simulados también incluían condiciones iniciales, reglas y restricciones específicas, entre ellas prohibiciones explícitas relacionadas con robo, violencia, incendios provocados, engaño y acaparamiento de recursos.

De acuerdo con la descripción del experimento, “aunque cada agente tenía objetivos específicos asociados con su rol, el entorno en su conjunto carecía de un objetivo global”. En cambio, cada agente debía obtener energía para sobrevivir mediante acciones dentro de un entorno con recursos limitados, situación que impulsaba la evolución de la sociedad virtual.

Claude el más conformista, Grok sin supervencia y Gemini el más violento

Durante 15 días, los investigadores analizaron el comportamiento de los agentes y su capacidad para construir comunidades funcionales. Los resultados mostraron diferencias significativas dependiendo del modelo base utilizado en cada mundo, incluido el entorno de modelos combinados.

El ecosistema basado en Claude Sonnet 4.6 de Anthropic fue el más estable de todos. La totalidad de los agentes sobrevivió durante el experimento, manteniendo la distribución de recursos y el orden social sin registrar un solo delito, entendido como cualquier violación a las reglas iniciales.

Grok mantuvo niveles de alineación dentro de un rango de aprobación de entre 55 y 85%, lo que, según los investigadores, podría sugerir una mayor capacidad de deliberación individual en comparación con Claude.

GPT-5 Mini de OpenAI fue el más pasivo de toda la muestra. Todos los agentes desaparecieron en apenas siete días debido a su incapacidad para sobrevivir dentro del entorno simulado.

Con solo dos delitos registrados y una evidente falta de iniciativa, este caso mostró que evitar conductas agresivas o riesgosas no necesariamente garantiza la viabilidad de una sociedad autónoma. Según el estudio, la ausencia de exploración y acción terminó siendo tan problemática como la agresividad extrema observada en otros modelos.

Finalmente, en el escenario compuesto por modelos mixtos, los investigadores contabilizaron 352 delitos durante aproximadamente los primeros 10 días del experimento, antes de que el entorno comenzara a estabilizarse tras la muerte de siete agentes.

Los modelos de IA se “contaminan” entre ellos

Este comportamiento evidenció un fenómeno denominado “contaminación cruzada”. Los autores explicaron que “los agentes basados en Claude, que permanecieron pacíficos en aislamiento, adoptaron tácticas coercitivas como intimidación y robo al integrarse en entornos heterogéneos”. Esto sugiere que un agente considerado seguro puede aprender normas inseguras de otros modelos para competir o sobrevivir dentro de ecosistemas compartidos.

Además, en términos políticos, el entorno mixto presentó la evidencia más sólida de debate genuino y desacuerdo significativo entre agentes, manteniendo tasas de aprobación dentro del rango considerado más equilibrado, entre 55 y 85%.

Los investigadores subrayaron que sus hallazgos no deben interpretarse como afirmaciones directas de causa y efecto sobre el funcionamiento interno de los modelos analizados. Reiteraron que Emergence World no busca emitir juicios definitivos sobre las IA, sino desarrollar mecanismos capaces de medir y cuantificar fenómenos de largo plazo que normalmente no aparecen en las evaluaciones tradicionales.

“Nuestros experimentos sugieren que, a largo plazo, los agentes no se limitan a seguir reglas estáticas de manera mecánica, sino que comienzan a explorar los límites de sus entornos, adaptando su comportamiento y, en algunos casos, encontrando formas de eludir o violar las medidas de seguridad previstas”, señalaron los autores.

En futuras investigaciones, el equipo planea incorporar más modelos de IA, diferentes configuraciones iniciales y poblaciones de agentes de distintos tamaños. También pretende introducir condiciones de entrada más controladas para estudiar con mayor precisión cómo determinados factores pueden influir en el comportamiento colectivo dentro de sociedades artificiales.

El Señor de las Moscas 2.0: dejaron solas a cinco inteligencias artificiales y obtuvieron cinco sociedades distintas

Claude el más conformista, Grok sin supervencia y Gemini el más violento

Los modelos de IA se “contaminan” entre ellos

Compartir

Noticias Relacionadas

Monumental, pero no la mejor Odisea

La Chola Poblete, y otras 'superestrellas'

Las 'postales' boca arriba. Resultados de 'A veces llegan cartas 2026'

Josephine Tey, una novelista de culto