Anuttacon研究模拟多智能体社会系统Agentopia:让AI更有人味儿,但仍面临挑战

01 2026年了,AI小镇还能怎么玩?

自蔡浩宇创办AI公司Anuttacon以来,团队动态不断。从去年8月上线的游戏《Whispers from the Star》、年底推出的AI聊天软件AnuNeko,到今年4月的首个视频模型LPM 1.0等,Anuttacon涉足诸多方面。前一阵,Anuttacon在Arxiv上发布论文,介绍最新研究成果之一模拟多智能体社会系统Agentopia。

论文作者栏第一位的王鑫涛是复旦大学博士,主要研究自然语言处理、角色扮演AI等方向,喜欢ACG文化,还曾在漫展上COS钟离。研究团队构建了一个AI社会,让100个智能体在其中生活10个模拟年,观察社会现象与反应,优化大模型的角色扮演能力。

此前著名的斯坦福虚拟小镇启发了很多类似项目,但不少AI小镇项目有局限性,大多只模拟几天,且大量算力用于基础操作,难以让智能体发展社会关系和个人成长。Agentopia研究团队定义了生活奖励映射人类幸福感,引导智能体追求美好生活。

团队构建了合租公寓、魔法学院和中国高中三个虚拟场景。10年里,这个小社会发生了各种涌现式事件。在社交方面,公寓场景的软件工程师Leo是社交中心,但社交奖励下降41%;高中女生Jun朋友少但关系深,获得更高社交满足感。Jun早期是社交狂魔,活力值从70崩到0,之后转向深度关系。在性格演变方面,高中女生Linyu原本社恐,经过心理辅导和社交暴露,自信属性暴涨50点,内向下降30点。在社会经济层面,虚拟世界基尼系数缩小,但阶层固化明显。比如Sebastian辞掉高薪工作转行,情绪值大幅提升,还理智存钱后享受生活。

02 让AI过家家,很有必要

有人好奇研究AI小镇的用处,在Agentopia项目里,目的是让AI更有人味儿。目前很多AI靠投喂人类对话数据微调,但存在高质量数据不足和难以学会思考抉择的问题。

Agentopia通过抽象系统和奖惩机制让AI模拟生活,提取前25%进步最大的智能体数据喂给底层大模型(Qwen3.5 - 397B - A17B)重新微调训练。新一代智能体在虚拟小镇变化明显,受尊重程度提升24.2%,被喜欢程度提升15.9%,主观幸福感全面上涨,物质满足感暴跌14.8%。团队将训练后的大模型拉到外部测试,拟人化程度上升23.7%,角色忠诚度上升16.4%,总成绩超越Claude - 4.5 - Sonnet。

03 结语

Agentopia项目虽有趣,但目前无法模拟人类实时感知和反应,存在AI幻觉。由于角色、世界和评分都由Qwen驱动,AI陷入封闭循环,所有角色10年后有一致变化。

团队也清醒认识到,Agentopia是智能体社会,与人类现实交互差距大,训练后的大模型能否对齐人类认知和心理模式仍是问题。不过,这个研究方向贴合米哈游和蔡浩宇团队打造酷虚拟世界的愿景,结合AI研究强化角色扮演等体验是优先探索方向之一。