2026年3月23日1 分鐘閱讀ai-first-projects

用 AI CLI 做更好的決策:結構化比較框架

別再用瀏覽器分頁淹沒自己了。用 AI CLI 建立可重複使用的決策框架 — 定義標準、設定權重、讓 AI 研究每個選項,產出加權比較表和透明推理的建議。

DH
Danny Huang

十二個分頁,零個答案

星期三晚上十一點。你已經研究筆電三個小時了。你開了十二個瀏覽器分頁 — 四個評測網站、兩個 Reddit 討論串、一個用兩倍速看完的 YouTube 比較影片、三個規格表、一個定價頁、還有一個二十分鐘前打開但已經忘記為什麼要開的分頁。你現在比剛開始的時候更混亂。

這個場景很熟悉。不只是筆電。租屋也是。工作 offer 也是。團隊該用哪個專案管理工具也是。租車還是買車也是。模式永遠一樣:你開始查資料、你累積資訊,然後某個時刻資訊開始跟你作對。每一個新數據引入一個新的取捨。每一篇評測和另一篇評測矛盾。每多開一個分頁,你就更不確定。

問題不是你缺乏資訊。問題是你從來沒有定義過你到底在乎什麼。

想像一下不知道目的地就開始打包行李。你丟進涼鞋和雪靴、防曬乳和羽絨外套、泳衣和發熱衣。最後你有一個十八公斤的行李箱,涵蓋地球上所有氣候。如果有人告訴你「你一月要去冰島」,你十分鐘就能打包完畢。目的地 — 也就是那組你在乎的事情 — 消滅了百分之九十的決策。

這就是這個框架做的事。在看任何選項之前,你先定義你的標準以及每個標準有多重要。然後把研究工作交給 AI agent,讓它針對每個標準評估每個選項。回來的不是一堆分頁。是一張表。分數、權重、推理過程、還有一個你真的可以據此行動的建議。

框架:三個步驟

整個決策框架濃縮成三步。你會建立一個可重複使用的 prompt 模板,適用於任何決策 — 科技產品採購、職涯選擇、SaaS 工具、租屋、任何有多個選項和多個標準的情境。

步驟一: 定義你的標準並指派權重。 步驟二: 把標準和選項餵給 AI agent 進行研究。 步驟三: 檢視加權比較表和建議。

就這樣。力量在步驟一。大多數人完全跳過它,直接跳去瀏覽。這就是為什麼他們最後有十二個分頁卻沒有答案。

步驟一:定義你到底在乎什麼

這是最難的部分。不是因為複雜,而是因為它強迫你誠實。你必須回答一個大多數人迴避的問題:我在這件事上真正看重的是什麼?

打開一個檔案。叫它 decision-criteria.md。寫下你要做的決定、列出每個重要的標準、然後給每個標準一個 1 到 5 的權重。

以下是一個範例 — 選筆電:

## Decision: 買哪台筆電做軟體開發

## Options
- MacBook Pro 14" M4 Pro
- ThinkPad X1 Carbon Gen 12
- Framework Laptop 16

## Criteria (weight 1-5,5 = 一票否決)

- 做工品質與耐用度:4
- 編譯與本地 AI model 效能:5
- 電池續航(真實世界,非官方數字):4
- 鍵盤手感:3
- 可維修性與可升級性:2
- 連接埠配置(不想靠轉接器過活):3
- 價格(含配件總成本):4
- Linux 相容性:3
- 螢幕品質:3
- 重量與攜帶性:2

注意寫完這張清單時發生了什麼。決策開始自己做自己。如果「編譯效能」是 5 而「可維修性」是 2,你已經告訴自己一件重要的事:你不是那種真的會打開筆電換 RAM 的人 — 你只是喜歡這個概念。權重強迫你承認這一點。

再看一個範例 — 在工作 offer 之間做選擇:

## Decision: 接受哪個工作 offer

## Options
- 新創 A(B 輪,40 人,全遠端)
- 大公司 B(上市,10,000 人,混合辦公)
- 顧問公司 C(精品型,200 人,到辦公室)

## Criteria (weight 1-5)

- 總薪酬(底薪 + 股權 + 福利):5
- 技術成長機會:4
- Work-life balance:4
- 團隊品質與工程文化:5
- 遠端工作彈性:3
- 工作穩定性(runway / 財務狀況):4
- 產品領域興趣:3
- 職涯品牌價值:2
- 通勤時間:2

標準檔案就是你的指南針。接下來的一切,只是 AI 往你指的方向走。

步驟二:讓 AI 研究每個選項

現在把標準檔案和 prompt 一起交給 Claude Code。以下是 prompt 模板:

claude --prompt "$(cat <<'EOF'
You are a structured decision analyst. I need to make a decision and I want
a rigorous, weighted comparison.

## The Decision

[貼上 decision-criteria.md 的內容,或引用該檔案]

## Your Task

For each option, research and evaluate it against every criterion listed above.

For each (option, criterion) pair:
1. State the relevant facts (cite specifics: numbers, dates, sources)
2. Assign a score from 1-10 (1 = worst, 10 = best for this criterion)
3. Write one sentence explaining the score

Then:
4. Multiply each score by the criterion weight
5. Sum the weighted scores for each option
6. Output a comparison table: rows = criteria, columns = options, cells = score
7. Output a final ranking with total weighted scores
8. Write a recommendation (2-3 sentences) explaining why the top option wins
   and what tradeoffs the person is accepting

## Rules

- Be specific. "Good performance" is not acceptable. "Compiles a 500K-line
  C++ project in 47 seconds (benchmarked by Phoronix, Jan 2026)" is.
- If you cannot find reliable data for a criterion, say so explicitly.
  Do not invent numbers.
- The recommendation must acknowledge the second-place option's strengths.
  A good decision requires understanding what you are giving up.
EOF
)"

在 terminal 裡執行這個。Claude Code 會花幾分鐘針對每個標準研究每個選項。回來的東西大概長這樣(簡化版):

## Weighted Comparison: 筆電決策

| 標準(權重)                  | MacBook Pro M4(分數) | ThinkPad X1(分數)  | Framework 16(分數) |
|-------------------------------|------------------------|----------------------|----------------------|
| 做工品質(4)                 | 9 (36)                 | 8 (32)               | 6 (24)               |
| 編譯效能(5)                 | 10 (50)                | 7 (35)               | 8 (40)               |
| 電池續航(4)                 | 9 (36)                 | 8 (32)               | 5 (20)               |
| 鍵盤手感(3)                 | 7 (21)                 | 9 (27)               | 7 (21)               |
| 可維修性(2)                 | 2 (4)                  | 4 (8)                | 10 (20)              |
| 連接埠(3)                   | 7 (21)                 | 8 (24)               | 9 (27)               |
| 價格(4)                     | 5 (20)                 | 6 (24)               | 7 (28)               |
| Linux 相容性(3)             | 6 (18)                 | 9 (27)               | 9 (27)               |
| 螢幕品質(3)                 | 10 (30)                | 8 (24)               | 7 (21)               |
| 重量(2)                     | 7 (14)                 | 9 (18)               | 4 (8)                |
|-------------------------------|------------------------|----------------------|----------------------|
| **加權總分**                  | **250**                | **251**              | **236**              |

## 建議

ThinkPad X1 Carbon 以一分之差領先 MacBook Pro,靠的是鍵盤、
Linux 支援和攜帶性的分數。但差距極小。如果編譯效能真的是你的
最高優先級 — 而你確實給了它 5 的權重 — MacBook Pro 的 M4 Pro
晶片可測量地更快。真正的問題是你到底會不會跑 Linux。如果答案
是「大概不會」,把那個標準的權重降到 1 然後重跑一次。MacBook
會贏 12 分。

最後一段是關鍵。AI 不只給你一個數字。它告訴你哪些標準正在左右結果,然後邀請你壓力測試自己的權重。

步驟三:壓力測試與迭代

第一次跑出來的永遠不是最終答案。它是初稿。跟所有初稿一樣,它揭示你之前沒看到的東西。

也許你發現「職涯品牌價值」給 2 是不誠實的 — 你其實比自己承認的更在乎。改成 4。重跑。

也許 AI 給新創的「工作穩定性」打了 4/10,你覺得太嚴苛了,因為你認識創辦人而且 runway 有 24 個月。覆蓋那個分數。重跑。

這個框架不是黑箱。它是你和你自己的優先順序之間的對話。AI 負責研究和算術。你負責誠實。

claude --prompt "$(cat <<'EOF'
Re-run the laptop comparison with these updated weights:
- 可維修性:1(我老實說 — 我永遠不會打開它)
- Linux 相容性:1(我會留在 macOS)
- 鍵盤手感:5(我每天打字八小時,這比我以為的重要)

Keep all other criteria and scores the same. Show the new totals and
whether the recommendation changes.
EOF
)"

這就是迭代循環。定義、研究、檢視、調整、重跑。每個循環花幾分鐘。三個循環下來,你對決策空間的探索程度,會比十二小時的分頁瀏覽徹底得多。

做成可重複使用的模板

你會不只做一次這種決策。把 prompt 存成可重複使用的模板:

# decision-template.md

You are a structured decision analyst.

## Decision
{{DECISION_DESCRIPTION}}

## Options
{{OPTIONS_LIST}}

## Criteria (weight 1-5)
{{CRITERIA_WITH_WEIGHTS}}

## Task
For each (option, criterion) pair:
1. State relevant facts with specifics
2. Score 1-10
3. One sentence justification

Then:
4. Weighted score table (score x weight)
5. Final ranking by total weighted score
6. 2-3 sentence recommendation acknowledging tradeoffs

## Rules
- Cite specifics. No vague qualitative assessments.
- If data is unavailable, state "No reliable data found."
- Recommendation must acknowledge second-place strengths.

現在任何決策都是十分鐘的事:

# 填好模板,然後:
claude --prompt "$(cat decision-criteria.md)"

要幫團隊選 SaaS 工具?同一個模板,不同的標準 — 聚焦在 API 品質、每人定價、資料匯出選項、SSO 支援。要決定租屋還是買房?標準變成每月成本、彈性、稅務影響、維護負擔、鄰里環境。結構永遠一樣。只有內容在換。

為什麼有效:決策癱瘓的心理學

十二個瀏覽器分頁讓你更混亂而不是更清楚,是有原因的。心理學家稱之為選擇的弔詭。更多選項和更多資訊不會帶來更好的決策 — 它們帶來決策逃避。你持續研究,因為做選擇感覺有風險,而研究感覺有生產力。其實沒有。那是穿著白袍的拖延症。

這個框架用三種方式打破循環。

第一,它強迫你在看到選項之前宣告你的價值觀。這跟大多數人的決策方式相反。大多數人先看選項,然後試圖根據眼前有什麼來推斷自己想要什麼。這就像走進一家餐廳然後決定你想吃義大利菜,因為那是一家義大利餐廳。先定義你的飢餓感。

第二,它把比較外部化。當取捨存在你腦子裡的時候,它們感覺壓倒性。當它們存在一張有數字的表裡的時候,它們感覺可控。決策沒有變簡單 — 你對它的視角變了。

第三,加權評分讓取捨變得明確。你不可能在每個標準上都給同一個選項最高分。你必須承認便宜的房子通勤時間長,或者高薪的工作 work-life balance 有疑慮。數字強迫你面對那些靠感覺瀏覽時可以迴避的事實。

再一件事:團隊決策

當多人需要達成共識時,這個框架的價值更大。不要在會議上繞圈爭論,讓每個人獨立填寫自己的標準權重。然後用每個人的權重各跑一次比較,看看分歧到底在哪裡。

通常不是選項的問題。是權重的問題。一個人給成本 5 給彈性 2。另一個人給彈性 5 給成本 2。現在你們在進行真正的對話 — 不是「哪個工具比較好」而是「這個團隊到底重視什麼」。這才是值得開的會。

claude --prompt "$(cat <<'EOF'
Run this decision comparison three times with different weight sets.
Show each result and then a summary of where the rankings diverge.

## Decision: 專案管理工具

## Options: Linear, Jira, Notion

## Weight Set A (Engineering Lead):
- GitHub integration: 5, API quality: 5, speed: 4, price: 2, customization: 3

## Weight Set B (Product Manager):
- Roadmap views: 5, stakeholder reporting: 4, customization: 5, price: 3, speed: 3

## Weight Set C (CEO):
- Price: 5, scalability: 4, vendor stability: 4, speed: 2, integration: 3

For each weight set, score all options on all criteria. Then show where
the three weight sets produce different winners and why.
EOF
)"

輸出顯示 Linear 在 engineering lead 的權重下勝出、Notion 在 PM 的權重下勝出、Jira 在 CEO 的權重下勝出。現在團隊知道了,分歧不在工具 — 在優先順序。那是一場四十分鐘的會議,而不是四小時的。

你已經做了的那個決策

這個框架有一件事很妙。等你定義完標準和權重的時候,你往往已經知道答案了。研究只是確認它。表格只是量化它。建議只是驗證它。但真正的決策發生在步驟一,你坐下來承認你到底在乎什麼的時候。

這就是核心洞察。決策癱瘓很少是因為資訊不足。是因為標準未定義。你不需要更多瀏覽器分頁。你需要十分鐘的誠實、一份空白文件、一個有編號的清單。

AI 不替你做決定。它搭建鷹架,讓你看見你已經做了的那個決定。

完整的 AI CLI 工具入門,從初學者指南開始。如果你想把同樣的結構化方法應用到帶有即時網頁資料的競品分析,看競品分析自動化完整教學

DH
Free Download

Ready to streamline your terminal workflow?

Multi-terminal drag-and-drop layout, workspace Git sync, built-in AI integration, AST code analysis — all in one app.

Download Termdock →
#ai-cli#decision-making#claude-code#framework#productivity#structured-output#vibe-coding

相關文章