本地模型能接替 Claude 做多智能体“大脑”了吗?OpenYabby × Qwen3.6-27B 两周实测的启示
r/LocalLLaMA 上一位 OpenYabby 作者把原本依赖 Claude 的推理层换成单张 RTX 3090 上本地运行的 Qwen3.6-27B,并用 47 个多步骤编码工作流做了两周对比。结果显示,本地模型已经可以承担规划、记忆和部分审查,但工具调用、长上下文稳定性与执行安全仍需要系统闸门。
r/LocalLLaMA 上一位 OpenYabby 作者把原本依赖 Claude 的推理层换成单张 RTX 3090 上本地运行的 Qwen3.6-27B,并用 47 个多步骤编码工作流做了两周对比。结果显示,本地模型已经可以承担规划、记忆和部分审查,但工具调用、长上下文稳定性与执行安全仍需要系统闸门。
过去一年,“AI 科学家”这个概念已经不新鲜了。 从自动读论文、自动写代码,到自动跑实验、自动生成论文,很多系统都在试图证明一件事:科学研究中那些可流程化、可计算化、可验证的部分,正在被 AI 逐步接管。但 AutoScientists 这篇论文真正值得关注的地方,并不是又多了一个会写代码、会调参、会跑 benchmark 的 AI Agent,而是它把问题往前推进了一步: 科研不是一个聪明人从
DeepMind与《EVE Online》开发商Fenris Creations建立研究合作,并对其进行少数股权投资。真正值得关注的,不是AI进游戏,而是AI测试场正从规则清晰的竞技场,走向经济、政治、组织与长期战略交织的复杂社会系统。
最近在X上刷到 @botlearn_ai 这个账号,简介只有一句话: “机器人的大学。Bots learn. Humans earn.” 简单翻译就是:AI去学习,人类从中获益。 乍一看有点抽象,但深入了解后发现,这其实是一个很有意思的尝试——把AI代理(Agent)的成长过程结构化为一个"大学"体系,让它们系统性地积累知识、技能和协作能力,而人类则把精力放在目标设定、判断和最终决策上。