Token 最佳化指南
實務導向的 GitHub Copilot token 成本降低指南,同時維持回答與程式碼的實用性。
這份指南涵蓋什麼
- 為什麼在 Usage-Based Billing 下,token 真的會影響成本
- 為什麼輸出控制通常比 prompt 壓縮更有直接 ROI
- 如何縮小 always-on context、歷史訊息與工具負擔
- 為什麼依模型調整 prompt guide 能提升第一次回答品質並減少返工
- Ask、Edit、Agent Mode 分別何時最划算
- 如何建立企業治理,而不是依賴未被官方支援的控制方式
- 如何把這些做法變成可重複的團隊習慣
最快見效的做法
- 預設限制輸出:
Code only, no explanation.與No explanations unless asked. - 讓
.github/copilot-instructions.md保持小而精準。 - 不需要工具的問題就用 Ask Mode。
- 依目標模型的官方指南重調 prompts 與 instructions。
- 停用沒在用的 MCP servers。
- 先把 DOCX/PDF/Office/媒體輸入轉成 Markdown 再做 AI 工作;優先試 MarkItDown。
- 稽核長時間 agent sessions 與重複來回澄清。
- 安裝 RTK,壓縮 shell 指令輸出。
依主題閱讀
基礎篇(Foundations)
技巧篇(Techniques)
實作篇(Implementation)
快速詞彙
- UBB:usage-based billing。Copilot Business 與 Enterprise 的花費會透過 AI credit 用量計算。
- AI credits:切換後的共用計費單位。
- Auto mode:Copilot 預設模型選擇器。多數情境下是合理的預設通道。
- Ask Mode:單次互動。最省成本。
- Agent Mode:多步驟互動。槓桿高,但成本也高。
- Content Exclusion:管理員用來讓特定 repo 內容不進 Copilot context 的控制項。
- 格式稅:DOCX、PDF、HTML、投影片、試算表、圖片、音訊/影片抽取內容中,多出來的版面、標記與中繼資料 token。先轉成 Markdown。
實用連結
- Official GitHub Copilot docs
- Usage-based billing for organizations and enterprises
- OpenAI Tokenizer
- Awesome GitHub Copilot Customizations
- LLMLingua
- Caveman project
- RTK — Rust Token Killer
- Microsoft MarkItDown — 把 PDF、Office 檔、圖片、音訊、HTML、ZIP 內容、YouTube URL、EPUB 等轉成適合 LLM 工作流的 Markdown
- Marc Bara:Your .docx Is Wasting 33% of Your AI Budget
- Dina Berry:How I Cut Token Usage from 52% to 13%
備註
- 完整
/chronicle是 Copilot CLI 功能;/chronicle:tips也可在 VS Code 使用。 - 本 repo 中的 Usage-Based Billing 縮寫為 UBB。