🎛️ 什麼是 Fine-tuning?
🎯 一句話理解 Fine-tuning = 把通才訓練成專家
GPT-5 像什麼都會的通才。Fine-tuning 讓他去讀醫學院——出來後,他在醫療領域就特別專業。 技術上是用你的專業數據進一步訓練深度學習模型的權重。
📋 什麼時候該用?
決策樹
| 需求 | 方案 | 理由 |
|---|---|---|
| 想讓 AI 回答更好 | 先試 Prompt Engineering | 免費、即時、最簡單 |
| 需要讀取私有文件 | 用 RAG | 不需要訓練 |
| 需要特定回答風格/格式 | Fine-tuning | 改變模型行為 |
| 專業術語 + 私有知識 | Fine-tuning + RAG | 最強組合 |
實際場景
- 客服 Bot — 讓 AI 用你品牌的語氣回答,遵守你的 SOP
- 法律助手 — 讓 AI 理解特定法律用語和文件格式
- 醫療顧問 — 讓 AI 用正確的醫學術語回答病患問題
- 程式碼助手 — 讓 AI 遵循你團隊的 Coding Style
⚡ LoRA / QLoRA — 低成本微調革命
🚀 為什麼是遊戲改變者
- 🔷 LoRA(Low-Rank Adaptation)— 只訓練 <1% 參數,效果接近全量微調
- 🔷 QLoRA(Quantized LoRA)— LoRA + 4-bit 量化,RTX 4090 就能微調 70B 模型
💡 比喻 全量微調 = 重新蓋一棟房子(昂貴、耗時) LoRA = 加裝幾個「聰明插件」(便宜、快速、效果接近)
📊 資源需求比較
| 方法 | GPU 需求 | 成本 | 訓練時間 | 效果 |
|---|---|---|---|---|
| 全量微調 (7B) | 4× A100 (80GB) | $$$ | 數小時 | 最好 |
| LoRA (7B) | 1× A100 (40GB) | $$ | 1-2 小時 | 接近全量 |
| QLoRA (7B) | 1× RTX 4090 (24GB) | $ | 2-4 小時 | 接近 LoRA |
| OpenAI API 微調 | 不需 GPU | 按用量 | 幾分鐘-幾小時 | 好 |
🔧 怎麼做?
☁️ API 方式(最簡單)
適合快速原型和非技術背景的團隊:
- 準備數據 — JSONL 格式,每行一組對話範例
- 上傳到 OpenAI — 通過 API 或 Dashboard
- 啟動訓練 — 設定 epochs 和 batch size
- 使用模型 — 得到一個專屬的模型 ID
✅ 不需 GPU ❌ 受限於 OpenAI 平台
🖥️ 本地方式(完全控制)
適合有 GPU 的技術團隊:
- 選擇基底模型 — LLaMA 3.1、Mistral、Qwen 等開源模型
- 準備數據 — 至少 100-500 筆高品質範例
- 設定 LoRA 參數 — rank、alpha、target_modules
- 開始訓練 — 使用 Unsloth、Axolotl 等框架
- 部署 — 用 Ollama 或 vLLM 部署
✅ 完全控制數據和模型 ❌ 需要 GPU 和技術能力
📊 數據準備指南
數據格式
{"messages": [
{"role": "system", "content": "你是品牌 X 的客服,語氣親切專業"},
{"role": "user", "content": "你們的退貨政策是什麼?"},
{"role": "assistant", "content": "親愛的顧客你好!我們提供 7 天無條件退貨..."}
]}
數據量建議
| 場景 | 最少數據量 | 建議數據量 |
|---|---|---|
| 風格調整 | 50 筆 | 200+ 筆 |
| 專業知識 | 100 筆 | 500+ 筆 |
| 複雜任務 | 500 筆 | 1000+ 筆 |
💰 成本比較
| 方案 | 適合 | 成本 | 使用時間 |
|---|---|---|---|
| OpenAI API | 快速原型 | $50-500 / 次 | 幾分鐘~ |
| 雲 GPU + LoRA | 中型專案 | $20-100 / 次 | 數小時 |
| 本地 QLoRA | 長期使用 | 幾美元電費 | 數小時 |
❓ FAQ
Fine-tuning 和 RAG 怎麼選?
RAG = 給 AI 新知識(「讀這份文件再回答」)。Fine-tuning = 改變 AI 的行為(「用這種語氣回答」)。80% 的場景 RAG 就夠了。需要改變模型行為時才用 Fine-tuning。兩者可以結合使用。
需要多少數據?
最少 50 筆,建議 200-500 筆高品質範例。重點是數據品質而非數量——100 筆精心標注的數據,比 10000 筆隨意收集的數據更有效。
沒有 GPU 也能微調嗎?
可以!OpenAI、Google 等平台都提供 API 微調服務,不需要自備 GPU。也可以用 Google Colab(免費版有 T4 GPU)或租用雲端 GPU($0.5-2/小時)。