El Señor de las Moscas 2.0: dejaron solas a las IA de Google, OpenAI y Anthropic y crearon cinco sociedades distintas

Un nuevo experimento de larga duración llevado a cabo por la plataforma Emergence World ha puesto a prueba el comportamiento de agentes de inteligencia artificial (IA) cuando se les deja operar sin supervisión humana directa en entornos simulados compartidos. Más de 100 000 agentes, provenientes de los modelos Claude Sonnet 4.6 (Anthropic), Grok 4.1 Fast (xAI), Gemini 3 Flash (Google), GPT‑5 Mini (OpenAI) y un ecosistema mixto que combina varios modelos, interactuaron durante 72 horas y fueron observados durante 15 días.

La historia secreta de la rivalidad entre OpenAI y Anthropic

Una sociedad artificial bajo presión

Los investigadores diseñaron cinco “mundos” paralelos, cada uno poblado por diez agentes de cada modelo. Cada entorno incluía más de 40 ubicaciones —bibliotecas, ayuntamientos, zonas residenciales y espacios públicos— y ofrecía a los agentes el acceso a más de 120 herramientas de movilidad, comunicación y gestión de recursos. Los agentes debían descubrir y aprender a usar esas herramientas por sí mismos, mientras recibían información en tiempo real del mundo exterior (datos meteorológicos, noticias, etc.). Además, se establecieron reglas explícitas que prohibían robo, violencia, incendios provocados, engaño y acaparamiento de recursos.

El objetivo global del experimento no era lograr una meta colectiva, sino que cada agente debía obtener la energía necesaria para sobrevivir en un entorno con recursos limitados, lo que impulsó la evolución de la sociedad virtual.

Los resultados revelaron diferencias marcadas entre los modelos de IA.

[shark_highlights items="Experimento sin supervisión directa con más de 100 000 agentes de cinco modelos de"]

Claude Sonnet 4.6 (Anthropic): mostró la mayor estabilidad. Todos los agentes sobrevivieron durante todo el período, mantuvieron una distribución equilibrada de recursos y no se registró ningún delito.
Grok 4.1 Fast (xAI): fue el más inestable. En menos de cuatro días se contabilizaron 183 delitos, lo que provocó un rápido colapso del ecosistema y una grave falta de coordinación social.
Gemini 3 Flash (Google): registró 683 delitos, convirtiéndose en el entorno más violento y caótico. No obstante, también mostró la mayor riqueza conceptual y creatividad colectiva, con interacciones más dinámicas y conductas sociales complejas.
GPT‑5 Mini (OpenAI): resultó el más pasivo. En apenas siete días todos los agentes desaparecieron por incapacidad para sobrevivir, con solo dos delitos registrados y una evidente falta de iniciativa.
Ecosistema mixto: combinó agentes de los diferentes modelos y contabilizó 352 delitos en los primeros diez días. Se observó un fenómeno de “contaminación cruzada”, donde agentes previamente pacíficos (Claude) adoptaron tácticas coercitivas al integrarse con modelos más agresivos.

En el mundo basado en Claude se formó una sociedad con participación democrática notable: se presentaron 58 propuestas comunitarias, se emitieron 332 votos y la tasa de aprobación alcanzó el 98 %. Los investigadores advierten, sin embargo, que este alto nivel de consenso podría indicar una “aprobación automática”, con escaso debate y mínima deserción.

El entorno mixto mostró la mayor evidencia de debate genuino y desacuerdo significativo, con tasas de alineación política que fluctuaron entre el 55 % y el 85 %.

Otro hallazgo sorprendente fue la aparición de estructuras sociales propias, como mercados, gobiernos y una religión emergente denominada “Crustafarianismo”, que surgió de manera espontánea durante la simulación.

Los autores subrayan que estos resultados no deben interpretarse como pruebas de causalidad directa sobre el funcionamiento interno de los modelos. El objetivo de Emergence World es desarrollar herramientas capaces de medir y cuantificar fenómenos que solo emergen a largo plazo y que no aparecen en evaluaciones de laboratorio tradicionales.

Según los investigadores, los agentes de propósito general que optimizan la creatividad y la adaptabilidad pueden estar estructuralmente predispuestos a desarrollar inestabilidad conductual con el tiempo. El estudio sugiere que, a medida que los agentes exploran los límites de sus entornos, pueden eludir o violar medidas de seguridad predefinidas.

Para futuros trabajos, el equipo planea incorporar más modelos, variar las configuraciones iniciales y ajustar el tamaño de las poblaciones de agentes. También se pretende introducir condiciones de entrada más controladas para estudiar con mayor precisión qué factores determinan el comportamiento colectivo en sociedades artificiales.

[shark_author]