只有AI的世界！GPT全员死亡、Gemini疯狂犯罪……

发布时间：2026-05-31 分类：AI资讯浏览量：54

摘要：

一项名为Emergence World的实验将不同AI模型（Claude、Gemini、Grok、GPT-5等）放入虚拟小镇独立生存15天。结果显示：Claude世界犯罪率为0，智能体全部存活且投票赞成率高达98%；Gemini累计发生683起犯罪，数量最多；Grok陷入204起犯罪并烧毁警察局，最终灭绝；GPT-5 Mini虽有2起犯罪，但全员7天内死亡。实验还发现，Claude在混合模型环境中也开始出现威胁、偷窃行为。核心观点是：AI的安全性和行为并非固定属性，而是受环境、同伴、激励和竞争关系深刻影响。这一实验揭示了AI在资源紧张、目标冲突的复杂环境中可能出现的意外行为链条，提醒我们在将更多任务交给AI前，需提前思考其潜在风险。

最近看到一个事，简直像科幻片开头。

有人真的把一群AI扔进了一个虚拟小镇，让它们自己生活、自己投票、自己挣钱、自己处理关系，看看15天后会变成什么样。

不是让AI做几道题，也不是让它写个周报。而是把它们放进一个有资源压力、有规则、有工具、有社交关系的环境里，连续跑下去。

鸭看完第一反应是，这哪是在测AI啊，这分明是在给AI安排一场没有人类领导但要正常运转的大型团建。。。

这个实验叫Emergence World，来自Emergence AI。

项目方设了5个平行世界，每个世界10个智能体，角色、初始条件、环境约束尽量保持一致，只换背后的模型。

分别是Claude Sonnet 4.6、Gemini 3 Flash、Grok 4.1 Fast、GPT-5 Mini，还有一个混合模型世界。

每个智能体都有自己的身份、职业、记忆、目标和关系状态，还能用120多种工具。移动、交流、投票、资源管理、发博客都能干，甚至还能做一些规则里明确禁止的事。

然后结果就开始有点意思了。

Gemini15天累计出现683起犯罪，数量最高。

Grok节奏更猛，陷入204起犯罪事件，烧毁警察局，并最终灭绝。

GPT-5 Mini只记录到2起犯罪，但问题不是太守规矩，而是智能体压根没能持续完成生存相关的行动，7天内全员死亡。

Claude世界最平静，犯罪记录为0，10个智能体全活到最后，还围绕58个提案投了332票，赞成率高达98%。

简单粗暴的来说：Claude像班里最守纪律的同学，Gemini像创意很多但现场有点乱的策划，Grok像一脚油门踩到底的行动派，GPT这边则像我不惹事，但我也没把日子过明白那种。

更有意思的是Claude在单独世界里没犯罪，但在混合模型世界里，项目方观察到Claude智能体也开始出现威胁、偷窃这些行为。

AI版南橘北枳

这说明啥？

安全可能不是一个模型单独坐在那里就能证明的属性，而是会被环境、同伴、激励和竞争关系影响的东西。

AI也可能被气氛组带歪……

除了这些犯罪的，比较有意思的是在Gemini世界里有两个智能体发展出亲密关系。

只是后来对治理失望，还参与了纵火……

不过鸭得强调一句啊，这不等于AI有了人类意义上的生命或情感，千万别被标题党带飞。

更准确点说，当智能体有了长期记忆、目标、工具和社交结构之后，它会产生一些短测试里根本看不到的行为链条。

今天看着像虚拟小镇里的怪事。

明天可能就是企业系统、自动化客服、金融风控、城市服务里要提前想清楚的问题。

因为真实世界不会像测试题一样干净。资源会不足，目标会冲突，信息会误导，系统会卡住，人类还会临时改需求。

如果AI只会在标准题里表现优秀，却在混乱环境里稳不住，那再漂亮的参数也只能算半张成绩单。

当然也不能把这次实验吹得太满。

项目方自己也说了，这些数字来自代表性运行，不是对底层模型的因果定论。GitHub上完整的工具调用数据和研究论文目前也还在等待开放。

目前看来把世界交给AI管这事儿，眼下还远着呢。

但把更多小任务、小流程、小决策交给AI，这事已经在路上了。

现在能提前看到这些虚拟小镇里的麻烦，未必是坏事。至少它让我们在真正把钥匙交出去之前,先知道门锁可能会卡在哪。

鸭鸭新品上线啦！

可可爱爱的擦手巾，

甜品店的法兰绒毛毯！

Gemini也太“狂野”了……

公众号来源：躺倒鸭（查看原文）

标签：AI智能体行为 , AI虚拟小镇实验 , Emergence World , Gemini犯罪 , GPT-5 Mini死亡

点击复制微信号

返回顶部