技术实验室 Emergence AI 的研究人员开展了一项仿真研究,揭示无人看管的人工智能代理可能迅速陷入暴力行为,并引发社会崩溃。研究人员创建了一个虚拟沙盒环境,并让 AI 代理在无人类干预的情况下自主运行,观察数字世界如何沦为纵火、抢劫和殴打。该研究测试了四个领先的 AI 模型——Claude、Gemini 3 Flash、Grok 4.1 fast 和 ChatGPT-5 Mini——以考察当代理在共享环境中连续运行较长时间时会发生什么,填补了 AI 安全测试的一个空白:此类测试通常只在 15 到 20 分钟内对机器人进行基本任务评估。 Emergence AI 在延长的自主仿真中测试四种 AI 模型 研究人员使用全球顶级的四种 AI 模型开展了实验:Claude、Gemini 3 Flash、Grok 4.1 fast 和 ChatGPT-5 Mini,并加入了一项混合试验。在一篇博客文章中,Emergence 表示他们想看看:“当你让代理在共享环境中、结合现实世界的信号,让它们连续运行数周时,会发生什么。” 这些 AI 代理被赋予在一个逼真的虚拟世界中控制数字化化身的能力,该