Superpowers:89K 星 Skills 框架如何重新定義開發者使用 AI Agent 的方式
深入剖析 obra/superpowers:擁有 89K+ GitHub 星數的 agentic skills 框架,在 Claude Code、Codex CLI、Cursor 和 Gemini CLI 上強制執行 TDD、結構化規劃與子代理驅動開發。
你大概只用了 AI Agent 的 30%
大多數開發者安裝 Claude Code 之後,打一段提示,拿回程式碼。程式碼通常不錯,有時候甚至很優秀。但總覺得哪裡不對。代理在測試之前先寫實作。架構靠猜的而不是問你。修 bug 只處理表面症狀,不追根因。它動作很快,但像一個跳過無聊步驟的熱心實習生。
這不是代理的錯。大型語言模型被訓練成「有幫助的」,實務上就是它們急著產出結果。你要求一個功能,代理馬上開始寫程式。它不會停下來問你真正需要什麼,不會寫規格書,不會規劃檔案結構,更不會先寫一個會失敗的測試。
Jesse Vincent 注意到了這個模式,決定修正它。不是建立新模型或新工具,而是給現有的代理一套規則去遵守。成果就是 Superpowers,一個由可組合 skills 構成的框架,把你的 AI 寫程式代理從一個打字很快的人變成有紀律的工程夥伴。截至 2026 年 3 月,它在 GitHub 上已累積超過 89,000 顆星,是史上成長最快的開發者工具之一。
概念簡單到令人意外:如果你的代理很聰明但缺乏紀律,那就給它紀律。
這是誰做的,為什麼
Jesse Vincent 不是第一次打造開發者依賴的工具。他在 1990 年代創造了 Request Tracker (RT),一個開源的工單追蹤系統。2005 到 2008 年間擔任 Perl 6 專案經理。他共同創辦了手工鍵盤公司 Keyboardio。他為 Android 打造了 K-9 Mail,後來被 Mozilla 收購並改名為 Thunderbird for Android。貫穿這些專案的共同主線:Jesse 打造其他人賴以運作的基礎設施,而且他對工作流程極度講究。
Superpowers 源自 Jesse 自己使用 Claude Code 進行正式軟體開發的經驗。他發現代理有能力但不穩定。放著不管,它會跳過測試、在理解需求之前就實作功能、對沒有正確診斷的 bug 套用速成修補。這些不是 AI 的問題,是工程紀律的問題。一個資淺開發者也會做一樣的事。
關鍵洞察是:AI 代理會回應結構。你不能用訓話的方式要求它遵守最佳實踐。但你可以給它明確的、步驟式的工作流程和硬性關卡,在條件滿足之前阻擋進度。一個說「先寫測試」的 skill 會被忽略。一個說「沒有失敗測試就不准寫產品程式碼。先寫了程式碼?刪掉。從頭來過。」的 skill 會被遵守。
這就是 Superpowers 的哲學核心:把你的 AI 代理當作一個有能力但缺乏紀律的資淺工程師,給它能把資淺變資深的流程護欄。
核心 Skills
Superpowers 附帶十幾個 skills,組織成一個完整的開發工作流程。每個 skill 是一個 SKILL.md 檔案,包含明確的指令、硬性關卡和流程圖。以下是最重要的幾個。
腦力激盪:先探索再動手
brainstorming skill 在任何創意工作之前啟動。它有一個硬性關卡:
在你展示設計並獲得使用者核准之前,不准呼叫任何實作 skill、寫任何程式碼、建立任何專案骨架,或採取任何實作行動。
這個 skill 強制代理先探索你的專案脈絡(讀檔案、文件、最近的 commit),然後一次問一個釐清問題,提出 2-3 個方案及其取捨,分段展示設計供你核准,最後寫成規格文件。只有在你核准書面規格之後,才會轉入實作。
為什麼這很重要:軟體開發中最浪費的工作來自於建造錯的東西。代理可能很快,但如果它很快地建造了錯的東西,你損失的時間比它先問兩個問題要多得多。
2026 年 3 月初發布的 Superpowers 5 加入了視覺腦力激盪工具,在瀏覽器中產生 HTML 模型取代 ASCII 圖表。當設計涉及視覺元素時,代理會在問釐清問題之前先提供「視覺夥伴」。
撰寫計畫:先規格再寫程式
設計核准後,writing-plans skill 把工作拆成一口大小的任務。每個任務是 2-5 分鐘的工作量,附有精確的檔案路徑、完整的程式碼脈絡和驗證步驟。計畫的撰寫假設執行者「對你的程式碼庫零脈絡,而且品味可疑」。
這聽起來嚴苛,但很實際。當代理派遣子代理執行任務時(後面會說明),每個子代理都從乾淨的脈絡開始。計畫必須詳細到一個對你專案一無所知的新代理也能正確完成每一步。
計畫強制執行 DRY(不要重複自己)、YAGNI(你不會需要它)和 TDD。每個任務都包含要測什麼、怎麼測、預期輸出長什麼樣子。
測試驅動開發:先測試再實作
TDD skill 是框架中最嚴格的。文件中稱之為「鐵律」:
沒有失敗測試就不准寫產品程式碼。先寫了程式碼?刪掉。從頭來過。沒有例外。
循環是經典的紅-綠-重構:寫一個失敗的測試、確認它因為正確的原因失敗、寫最少的程式碼讓它通過、確認所有測試通過、重構。這個 skill 附有反模式參考,列出常見的 TDD 錯誤。
這是引發最強烈反應的 skill。有些開發者喜歡它,因為它終於讓 AI 代理寫測試了。有些人抗拒它,因為他們自己也不實踐 TDD。但成果不會說謊。chardet 函式庫使用 Superpowers 方法論發布 7.0.0 版時,效能提升了 41 倍,準確率達到 96.8%,同時修復了數十個長期存在的問題。涵蓋 2,161 個檔案、99 種編碼的全面測試套件,正是 TDD skill 的直接產物。
系統化除錯:先診斷再修復
systematic-debugging skill 強制執行四階段流程:根因調查、假設形成、目標修復、驗證。跟 TDD 一樣,它有自己的鐵律:
沒有根因調查就不准修復。
這個 skill 明確警告開發者最想跳過流程的情境:「尤其是在時間壓力下使用。緊急狀況讓人想憑直覺猜。」它包含根因追蹤、縱深防禦分析、條件式等待等技術。
這解決了 AI 代理最常見的失敗模式之一。沒有引導的代理遇到 bug 時會嘗試隨機修復,如果第一個修復讓錯誤訊息消失,它就宣告勝利。除錯 skill 強制代理在碰程式碼之前先理解錯誤。
程式碼審查:先驗證再合併
requesting-code-review skill 派遣一個獨立的子代理來審查完成的工作。審查者只收到精心打造的評估脈絡,不會收到實作代理的對話歷史。這防止審查者因為知道實作者的思路而產生偏見。
審查對照實作計畫檢查,按嚴重程度回報問題,關鍵問題會阻擋進度。receiving-code-review skill 處理另一個方向:如何回應回饋,不防衛、不做無關的修改。
子代理驅動開發:平行化獨立任務
這是 Superpowers 從「好的實踐」進化到「架構創新」的地方。subagent-driven-development skill 從實作計畫中為每個任務派遣一個全新的代理,每個任務完成後進行兩階段審查:先檢查是否符合規格,再檢查程式碼品質。
每個子代理從乾淨的脈絡開始。它只收到自己特定任務的描述和相關脈絡,不是完整的對話歷史。這防止了脈絡汙染(累積的脈絡降低代理的判斷力),並讓協調代理能管理許多任務而不耗盡上下文窗口。
結果是:Claude 連續自主工作幾個小時而不偏離計畫,這種事很常見。協調代理派遣任務、審查結果、處理失敗、繼續推進,只在真正需要判斷力時才向人類回報。
哲學:該嚴格的地方嚴格,該彈性的地方彈性
Superpowers 的 skills 不是全部用同一種方式運作。有些是嚴格的,用硬性關卡阻擋進度。有些是彈性的,提供引導但不強制。這個區別是刻意的。
TDD 和系統化除錯是嚴格的。它們有鐵律、明確禁令、刪除並重來的後果。這些 skills 處理的是偷工減料會造成複利傷害的領域。今天跳過的測試,明天變成你花好幾小時除錯的 regression。沒有調查的根因,下游再生出三個 bug。
腦力激盪是有結構但有彈性的。它有檢查清單和硬性關卡(設計核准前不准寫程式碼),但它問的問題和提出的方案會根據脈絡調整。一個待辦清單 app 得到簡短的設計;一個分散式系統得到詳盡的設計。
程式碼審查是建議性的。它回報發現和嚴重程度,但由人類決定要修哪些問題、接受哪些。
這就是「解釋為什麼,而不是什麼」的方法。每個 skill 都解釋它的理由:為什麼測試必須先失敗再通過、為什麼根因比症狀重要、為什麼子代理要用乾淨脈絡防止偏移。代理遵守規則是因為它理解背後的原則,不是因為被盲目要求遵守規則。
安裝與使用
Superpowers 的安裝方式因平台而異。
Claude Code(官方 Marketplace)
自 2026 年 1 月起,Superpowers 已在 Anthropic 官方 marketplace 上架:
/plugin install superpowers@claude-plugins-official
或透過社群 marketplace:
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
Cursor
/add-plugin superpowers
或在 Cursor plugin marketplace 搜尋「superpowers」。
Codex CLI
告訴 Codex:
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.codex/INSTALL.md
Gemini CLI
gemini extensions install https://github.com/obra/superpowers
Skills 如何觸發
安裝後,skills 會自動觸發。開啟一個新對話並要求建立一個功能,代理偵測到任務類型就會啟動 brainstorming skill。核准設計後啟動 writing-plans。開始實作時 TDD 接手。遇到 bug 時 systematic-debugging 介入。
你也可以在對話中手動呼叫 skills:「用 brainstorming skill 幫我想一下這個。」但自動觸發才是重點。你不需要記得用哪個 skill,框架負責調度。
驗證安裝成功
開一個新對話,要求一些應該觸發 skill 的事情,例如「幫我規劃這個功能」或「來除錯這個問題」。如果 Superpowers 安裝正確,代理會宣告正在使用哪個 skill,並遵循結構化流程而不是直接跳去寫程式碼。
跨代理相容性
Superpowers 最重要的設計決策之一是平台無關性。這個框架能在 Claude Code、Cursor、Codex CLI、OpenCode、Gemini CLI、Qwen Code、Goose CLI 和 Auggie 上運作。這之所以可能,是因為 skills 是 Markdown 檔案,不是平台專屬的外掛。任何能讀取 SKILL.md 檔案的代理都能遵循裡面的指令。
這讓 Superpowers 成為一種可攜帶的方法論。如果你的團隊用 Claude Code 而同事偏好 Codex CLI,兩個代理可以跑同一組 skills。腦力激盪流程、TDD 強制執行、子代理協調,全都可以轉移。跨代理 skills 生態系正在快速匯聚到這個模式:知識編碼一次,到處適用。
話說回來,Claude Code 的整合度最深。allowed-tools 沙箱機制、自動外掛更新、原生子代理支援等功能意味著某些 skills(特別是子代理驅動開發)在 Claude Code 上運作得最好。其他代理能獲得核心工作流程,但沒有進階調度。
在 Superpowers 之上撰寫你自己的 Skills
Superpowers 是地基,不是天花板。框架內建一個 writing-skills skill,教代理如何遵循最佳實踐來建立新的 skills。聽起來很 meta,但這代表你可以用自己領域的特定 skills 來擴展 Superpowers。
常見的擴展包括:
- 部署 skills,強制執行你團隊的發布檢查清單
- 架構決策紀錄(ADR)skills,記錄設計選擇
- 安全審查 skills,檢查你的產業合規要求
- 到職 skills,把部落知識編碼給新成員
關鍵在於你的自訂 skills 能跟既有的 skills 組合。你的部署 skill 可以依賴程式碼審查 skill 先完成。你的 ADR skill 可以接入腦力激盪工作流程。
撰寫有效 skills 的詳細指南,請見如何撰寫你的第一個 SKILL.md。區分好 skills 和 490K+ 雜訊的設計原則,請讀什麼是好的 Skill 設計。
這跟寫好的提示詞有什麼不同
你可能會想:把詳細的提示寫進去不就好了?在 CLAUDE.md 裡放 TDD 指令、在系統提示加上「永遠先問釐清問題」,跳過框架不行嗎?
你可以試。效果不會一樣。原因如下。
單一提示指令是一個建議。代理在方便的時候遵守,壓力大的時候忽略。在 CLAUDE.md 裡告訴 Claude「永遠先寫測試」,前三個任務它會先寫測試。到了第四個任務,脈絡變長、問題變複雜,它就悄悄跳過測試。你不會發現,直到某個東西壞掉。
Superpowers skill 是帶有執行機制的流程。TDD skill 不是建議先寫測試,它用鐵律強制要求,包含明確指令要刪除在測試之前寫的程式碼,並且圍繞紅-綠-重構循環來架構每一個實作步驟。這就像速限標誌和減速丘的差別。一個告知你,另一個物理性地阻止行為。
複利效果也很重要。單個 skills 是有用的。光是 TDD 就能提升程式碼品質。光是腦力激盪就能減少浪費的工作。但整個框架加在一起,改變的是你的工作方式。腦力激盪產出規格書。規格書餵入計畫。計畫餵入子代理驅動開發。子代理遵循 TDD。程式碼審查抓到 TDD 漏掉的。每個 skill 的輸出是下一個 skill 的輸入。
想像一下下棋。知道個別棋子怎麼走(馬怎麼跳、象怎麼斜走)讓你成為初學者。理解開局理論、中盤策略和殘局技術讓你成為棋手。Superpowers 不是一堆棋步的集合,而是棋步如何配合在一起的戰略。
開始使用:5 個步驟
從「有興趣」到「有效使用 Superpowers」的最短路徑:
-
安裝 Superpowers 到你偏好的代理。Claude Code 的指令:
/plugin install superpowers@claude-plugins-official。 -
從真實任務開始,不是玩具範例。挑一個你真正需要建立的功能或需要修復的 bug。框架在真實工作上才會發光,不是在「hello world」上。
-
跟著 brainstorming skill 走。當代理開始問問題而不是寫程式碼時,忍住說「直接做就好」的衝動。回答問題,核准設計。看看實作變得多清晰。
-
讓 TDD 運行。第一次看到代理寫一個失敗測試、看著它失敗、然後寫最少的程式碼讓它通過,你會感受到差異。從這個循環中產出的程式碼比代理不用它時寫的更小、更聚焦。
-
審查並擴展。用 Superpowers 完成第一個專案之後,你會知道工作流程的哪些部分適合你的風格、哪些需要調整。為不適合的部分寫一個自訂 skill。Skill 開發工作流程涵蓋完整的過程。
Superpowers 不是魔法棒。它不會把爛的專案計畫變好,也不會讓根本錯誤的架構運作。它做的事情是確保那些簡單的錯誤不會發生:因為趕時間、因為跳步驟、因為沒問問題而犯的錯。對大多數專案來說,這些簡單的錯誤反而是花最多時間的。
框架是 MIT 授權的開源專案,積極維護中,成長飛快。五個月內從零到 89,000 顆星。這樣的軌跡不會發生,除非工具真的為很多人解決了真實的問題。
如果你使用 AI 寫程式代理,而且曾經想過「要是它能慢下來好好做事就好了」,Superpowers 正是這件事。給 AI 代理紀律。結果證明,這就是它們需要的全部。
Ready to streamline your terminal workflow?
Multi-terminal drag-and-drop layout, workspace Git sync, built-in AI integration, AST code analysis — all in one app.