只有AI的世界!GPT全员死亡、Gemini疯狂犯罪……

分类:AI资讯 浏览量:8

摘要:

一项名为Emergence World的实验将不同AI模型(Claude、Gemini、Grok、GPT-5等)放入虚拟小镇独立生存15天。结果显示:Claude世界犯罪率为0,智能体全部存活且投票赞成率高达98%;Gemini累计发生683起犯罪,数量最多;Grok陷入204起犯罪并烧毁警察局,最终灭绝;GPT-5 Mini虽有2起犯罪,但全员7天内死亡。实验还发现,Claude在混合模型环境中也开始出现威胁、偷窃行为。核心观点是:AI的安全性和行为并非固定属性,而是受环境、同伴、激励和竞争关系深刻影响。这一实验揭示了AI在资源紧张、目标冲突的复杂环境中可能出现的意外行为链条,提醒我们在将更多任务交给AI前,需提前思考其潜在风险。

图片

图片

 

最近看到一个事,简直像科幻片开头。

 

有人真的把一群AI扔进了一个虚拟小镇,让它们自己生活、自己投票、自己挣钱、自己处理关系,看看15天后会变成什么样。

不是让AI做几道题,也不是让它写个周报。而是把它们放进一个有资源压力、有规则、有工具、有社交关系的环境里,连续跑下去。

 

鸭看完第一反应是,这哪是在测AI啊,这分明是在给AI安排一场没有人类领导但要正常运转的大型团建。。。

 

这个实验叫Emergence World,来自Emergence AI。

项目方设了5个平行世界,每个世界10个智能体,角色、初始条件、环境约束尽量保持一致,只换背后的模型。

 

分别是Claude Sonnet 4.6、Gemini 3 Flash、Grok 4.1 Fast、GPT-5 Mini,还有一个混合模型世界。

 

每个智能体都有自己的身份、职业、记忆、目标和关系状态,还能用120多种工具。移动、交流、投票、资源管理、发博客都能干,甚至还能做一些规则里明确禁止的事。

然后结果就开始有点意思了。

 

Gemini15天累计出现683起犯罪,数量最高。

Grok节奏更猛,陷入204起犯罪事件,烧毁警察局,并最终灭绝。

GPT-5 Mini只记录到2起犯罪,但问题不是太守规矩,而是智能体压根没能持续完成生存相关的行动,7天内全员死亡。

 

Claude世界最平静,犯罪记录为0,10个智能体全活到最后,还围绕58个提案投了332票,赞成率高达98%。

 

简单粗暴的来说:Claude像班里最守纪律的同学,Gemini像创意很多但现场有点乱的策划,Grok像一脚油门踩到底的行动派,GPT这边则像我不惹事,但我也没把日子过明白那种。

 

更有意思的是Claude在单独世界里没犯罪,但在混合模型世界里,项目方观察到Claude智能体也开始出现威胁、偷窃这些行为。

AI版南橘北枳

 

这说明啥?

 

安全可能不是一个模型单独坐在那里就能证明的属性,而是会被环境、同伴、激励和竞争关系影响的东西。

 

AI也可能被气氛组带歪……

除了这些犯罪的,比较有意思的是在Gemini世界里有两个智能体发展出亲密关系。

 

只是后来对治理失望,还参与了纵火……

 

不过鸭得强调一句啊,这不等于AI有了人类意义上的生命或情感,千万别被标题党带飞。

 

更准确点说,当智能体有了长期记忆、目标、工具和社交结构之后,它会产生一些短测试里根本看不到的行为链条。

今天看着像虚拟小镇里的怪事。

 

明天可能就是企业系统、自动化客服、金融风控、城市服务里要提前想清楚的问题。

 

因为真实世界不会像测试题一样干净。资源会不足,目标会冲突,信息会误导,系统会卡住,人类还会临时改需求。

 

如果AI只会在标准题里表现优秀,却在混乱环境里稳不住,那再漂亮的参数也只能算半张成绩单。

当然也不能把这次实验吹得太满。

 

项目方自己也说了,这些数字来自代表性运行,不是对底层模型的因果定论。GitHub上完整的工具调用数据和研究论文目前也还在等待开放。

 

目前看来把世界交给AI管这事儿,眼下还远着呢。

 

但把更多小任务、小流程、小决策交给AI,这事已经在路上了。

 

现在能提前看到这些虚拟小镇里的麻烦,未必是坏事。至少它让我们在真正把钥匙交出去之前,先知道门锁可能会卡在哪。

 
图片

鸭鸭新品上线啦!

可可爱爱的擦手巾,

甜品店的法兰绒毛毯!

 

 

 

 

 
Gemini也太“狂野”了……

图片

公众号来源:躺倒鸭(查看原文
微信微博邮箱复制链接