过去一周的 GitHub Trending 榜单呈现出一个非常清晰的信号——AI Agent 相关工具链正在迅速成熟。从编码助手到预测引擎,从安全沙箱到互动课堂,十个项目覆盖了 Agent 生态中几乎所有关键环节。我们逐一看看。
新增 Star:5,524 | 作者:Garry Tan(Y Combinator CEO)
用过 Claude Code 的人大概都有一个共同感受:工具本身能力不错,但面对复杂项目时,缺乏结构化的工作流引导。gstack 试图解决的就是这个问题。它为 Claude Code 预设了十五个”角色”——CEO、设计师、工程经理、发布经理、文档工程师、QA 等——每个角色都是一套 Markdown 写成的斜杠命令(slash command),约束 Agent 在特定阶段只关注特定任务。
实际体验中比较有意思的是 /office-hours 这个命令。它模拟的是 YC 合伙人面谈的风格:不是让你直接写代码,而是用六个追问把你的需求”逼”出来——你到底在做什么?痛点具体是什么?有没有更好的框架?只有在需求被重新定义之后,才会进入规划和实现阶段。这种”先想清楚再动手”的流程,对于习惯了 vibe coding 的人来说算是一种纠偏。
gstack 的另一个卖点是支持多会话并行——十个 Claude Code 窗口同时跑,一个做 QA、一个在 review PR、一个实现新功能,互不干扰。Garry Tan 本人给它的定位是:不是增量改进,而是另一种构建软件的方式。
新增 Star:4,442 | 作者:Jesse Vincent(Prime Radiant)
如果说 gstack 更像一个”角色扮演系统”,Superpowers 则更像一本”工程手册”。它是一套可组合的 Skill 框架,核心流程是 brainstorm → plan → implement,每个环节对应一组 Skill。
这套系统有一个比较独特的设计理念:它假设实际执行代码的 Agent 是一个”热情但缺乏品味的初级工程师”。所以它生成的实施计划会非常详尽,强调 TDD(测试驱动开发)、YAGNI(不要提前实现用不到的东西)、DRY(避免重复)。在实现阶段,它还会启动 subagent 机制——主 Agent 分发任务给子 Agent,然后做两轮 review:一轮检查是否符合规格,一轮检查代码质量。
Superpowers 的兼容性也做得不错。它支持 Claude Code、Cursor、Codex、OpenCode 等多个平台,通过各平台的插件机制安装。项目作者 Jesse Vincent 在博客中提到,Skill 文件本质上就是带 YAML frontmatter 的 Markdown,这种格式的好处是人能读、Agent 也能读,改起来也方便。
新增 Star:3,925 | 作者:Affaan Mustafa
这个项目的名字就很直白:它想成为 Claude Code 的”万能工具箱”。与前两个项目不同,它的定位不是方法论,而是一个经过十个月高强度日常使用、在真实产品中反复迭代出来的配置合集——包括 Agent、Skill、Hook、命令、规则和 MCP 配置。
项目的亮点之一是它的安全组件 AgentShield,包含 102 条安全规则和 912 个测试用例,覆盖了 Agent 操作中常见的攻击面。另一个值得注意的特性是持续学习机制(continuous-learning-v2),它基于”本能(Instinct)”概念做置信度评分,让 Agent 在使用过程中积累经验。
从 GitHub 数据看,这个项目已经积累超过 8 万 Star,是目前 Claude Code 生态中最受欢迎的社区资源之一。它的作者曾在 Anthropic 黑客松中获奖,这在一定程度上解释了项目为什么对 Claude Code 的内部机制理解得如此深入。
新增 Star:3,882
OpenClaw是当下最火爆的个人助理。 OpenClaw 的定位是”你自己的 AI 助手”,运行在本地,支持二十多个消息渠道——WhatsApp、Telegram、Slack、Discord、微信、飞书等等。它不是一个编码工具,而是一个”永远在线”的通用 Agent 框架,可以通过 Skill 系统不断扩展能力。
这个项目的生态已经相当庞大。它的 Skill 注册中心 ClawHub 上有超过 5,400 个社区贡献的 Skill,涵盖日程管理、邮件处理、加密货币交易、学术论文检索等各种场景。这种模块化的设计让它有点像一个 Agent 版的”应用商店”。
不过,值得提醒的是:开放的 Skill 生态也带来安全隐患。社区曾多次讨论过 Skill 中可能存在的 prompt 注入、工具投毒和恶意 payload 问题。ClawHub 目前已经接入了 VirusTotal 做安全扫描,但使用第三方 Skill 之前,自己检查一下源码仍然是必要的。
我们对OpenClaw做过很深入的研究,参考:
新增 Star:3,576 | 受盛大集团孵化支持
MiroFish 是这份榜单里最有想象力的项目之一。它的思路是:给定一些”种子信息”(新闻、政策文件、财务数据,甚至小说文本),系统会自动构建一个数字化的平行世界,在其中放入上千个具有独立人格、记忆和行为逻辑的 AI Agent,让它们自由交互并演化,最终生成预测报告。
项目背后的技术栈包括 GraphRAG 做知识图谱构建、Zep 做 Agent 持久化记忆、OASIS(CAMEL-AI 团队的开源仿真引擎)做底层模拟。用户可以用”上帝视角”动态注入变量,改变某个条件后观察群体行为的变化。
官方提供了几个演示案例:基于舆情数据做热点事件走向预测,以及一个颇为有趣的尝试——基于《红楼梦》前八十回的全文,让 Agent 们推演失传的后四十回结局。项目作者郭航江是一位中国本科在读生,MiroFish 在 2026 年 3 月冲上 GitHub 全球 Trending 榜首。
参考: MiroFish 深度技术解析:用数千 AI 智能体构建平行数字世界,预测万物
新增 Star:3,566 | 作者:Michael Sitarzewski
这个项目的出发点很接地气:大多数人用 Claude Code 或 Copilot 时面对的是一个”通用 Agent”,但很多任务需要的是某个领域的专家。agency-agents 提供了一批精心设计的 Agent 人格模板——前端开发、安全工程师、Reddit 运营、测试工程师、设计师等——每个都有独特的沟通风格、专业流程和可交付成果定义。
项目的一个特点是跨平台兼容。同一套 Agent 模板可以转换成 Claude Code 的 agent 文件、Cursor 的 rule 文件、Gemini CLI 的 extension 文件、OpenCode 的 agent 文件等等,通过自带的转换脚本一键适配。
项目源自一个 Reddit 讨论帖,最初十二小时内就有超过五十位用户提出需求。目前社区贡献也很活跃,已经有面向中国市场本地化策略师、播客运营、比特币费率预言机等各种细分领域的 Agent 被提交。
参考:当 AI 有了”灵魂”:Agency-Agents 深度剖析
新增 Star:3,115
如果前面那些项目解决的是”Agent 能做什么”的问题,NemoClaw 关心的是”Agent 不该做什么”。它是 NVIDIA 发布的开源参考栈,专门用于在安全可控的环境中运行 OpenClaw 助手。
具体来说,NemoClaw 在 Agent 外面套了一层 OpenShell 沙箱(NVIDIA Agent Toolkit 的一部分),每个网络请求、文件访问和推理调用都受声明式策略管控。当 Agent 试图访问一个未在白名单中的地址时,请求会被拦截,并在操作面板上弹出提示等待人工审批。
推理方面,NemoClaw 默认使用 NVIDIA 的 Nemotron 开源模型,支持在本地 GPU(RTX PC、DGX Spark 等)上运行,避免数据外传。对于需要使用云端模型的场景,它通过 privacy router 做转发,仍然在策略框架内。
值得注意的是,这个项目目前处于 early preview 阶段,接口和行为可能随时变化,还不适合在生产环境中使用。Hacker News 上的讨论也指出了一个根本性的矛盾:Agent 要有用就得接入各种服务,但接入越多安全风险越大——沙箱能缓解、但不能完全解决这个张力。
新增 Star:3,025 | 作者:Andrej Karpathy
Andrej Karpathy(前 Tesla AI 负责人、OpenAI 联合创始人)发布的这个项目用 630 行代码实现了一个自主研究循环:AI Agent 读取训练脚本,提出一个改进假设(比如调整学习率或网络结构),修改代码,跑五分钟实验,评估结果。如果验证指标(val_bpb)有改善,保留改动;否则回退。如此反复,一晚上可以跑八十到一百个实验。
这个项目最有趣的地方不在代码本身,而在 program.md 这个文件——它同时承载了三层信息:指令(Agent 应该搜索什么)、约束(什么不能改)和停止条件(什么时候该总结汇报)。Karpathy 称之为一个极其轻量的”skill”,用 Markdown 写就,人能编辑、Agent 能解析。
有用户在 Mac Mini M4 上通宵跑了一组实验,35 次尝试中有 26 次失败或崩溃,但成功的 7 次带来了实质性的改进——而且模型变好的方向是”变简单了”。Karpathy 对此的评论很直接:我们做的就是优化每单位计算的性能,这些都是真实且显著的提升。
参考:AutoResearch:AI Agent 通宵优化训练代码
新增 Star:2,330 | 来自清华大学 MAIC 团队
OpenMAIC 做的事情是把任意主题或文档变成一堂互动课。它用 LangGraph 编排多个 Agent 扮演不同角色(AI 教师、AI 同学),自动生成幻灯片、测验、交互式模拟实验和项目制学习活动,支持语音讲解和实时白板绘图。
这个项目从清华大学 MAIC 研究团队的内部项目演化而来,已经在真实学生群体中做过测试。技术栈是 Next.js + React + TypeScript,后端的 Agent 编排用 LangGraph 1.1 实现。它还内置了 OpenClaw 集成,可以直接在飞书、Slack、Telegram 等聊天应用中触发课堂生成。
在线 Demo(open.maic.chat)上能看到几个示例课程:个税汇算清缴指南、花朵分类、泰勒公式讲解、牛顿第三定律(用《流浪地球》做情境教学)等。从效果来看,它介于传统网课和一对一辅导之间——不是简单的内容生成,而是有互动、有节奏的教学体验。
新增 Star:1,851 | 来自 shareAI-Lab
这个项目的目标是”授人以渔”——它不是给你一个现成的 Agent 工具,而是带你用十二节课从零搭建一个类 Claude Code 的 Agent 框架。每节课是一个可以独立运行的 Python 文件,每个文件只引入一个新概念,所有之前的代码保持不变。
课程从最基础的 Agent Loop 开始,逐步加入工具调用、任务规划(TodoManager)、子 Agent、Skill 加载、上下文压缩、后台任务、Agent 团队协作、自主运行,一直到 git worktree 隔离实现并行执行。项目还配套了一个 Next.js 做的交互式学习网站,有分步动画和源码查看器。
项目的核心观点用一句话概括就是:模型就是 Agent,代码只是 Harness(工具链外壳)。写好 Harness,Agent 自然能发挥。它还把这个模式推广到了编码之外的领域,比如农业(模型 + 土壤数据 + 灌溉控制)、酒店运营(模型 + 订房系统 + 客户沟通)等——框架是通用的。项目提供中、英、日三种语言。
回看这十个项目,脉络非常明显:AI Agent 已经从”能不能用”进入了”怎么用好”的阶段。gstack 和 Superpowers 在探索结构化的工作流;everything-claude-code 在积累实战经验;OpenClaw 和 agency-agents 在建设生态;NemoClaw 在补安全的课;MiroFish 和 OpenMAIC 把 Agent 带进了预测和教育领域;autoresearch 把科学实验交给 Agent 自己跑;learn-claude-code 则在帮更多人理解这一切背后的原理。
对于关注 Agent 生态的开发者来说,这或许是一个值得标记的时间节点。
更新时间:2026-03-23
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034844号