📦 RAG 檢索增強生成

Q: 不會寫程式能用嗎？

可以！[ChatGPT](/tools/chatgpt-guide/) GPTs 和 Claude Projects 本質上就是簡化版 RAG。上傳文件即可使用，不需要寫程式。進階需求可用 Dify/Coze 等 [No-Code 平台](/tech/no-code/)。

讓 AI 先查資料再回答——大幅減少幻覺的關鍵技術。

中級 rag retrieval vector-database

📦 RAG 是什麼？

RAG（Retrieval-Augmented Generation）檢索增強生成，是目前企業 AI 應用的第一架構選擇。

🎯 一句話理解 RAG

RAG = AI 回答前先查資料

想像你是學生，老師問你一個問題：

❌ 沒有 RAG：只靠記憶回答（可能記錯 → AI 幻覺）

✅ 有 RAG：先翻書找到相關段落，再根據書的內容回答（更準確！）

RAG 就是給 AI 一本可以翻的參考書。

💡 為什麼需要 RAG？

🔥 RAG 解決的三大問題

問題	沒有 RAG	有 RAG
AI 幻覺	AI 可能自信地回答錯誤資訊	基於真實文件回答，幻覺減少 50-80%
過時知識	AI 只知道訓練截止日期前的資訊	隨時更新知識庫，AI 就有最新資訊
私有數據	AI 不知道你的公司文件	上傳公司文件，AI 就能回答內部問題

🔧 RAG 怎麼運作？

📝 RAG 五步流程

準備知識庫 — 收集文件（PDF、網頁、資料庫…）
切割和嵌入 — 把文件切成小段，用 Embedding 模型轉成語意向量
存入向量資料庫 — 把向量存進 Pinecone / Chroma 等
檢索 — 用戶提問時，先在向量資料庫中搜尋最相關的段落
生成 — 把檢索到的段落 + 用戶問題一起給 AI，生成有根據的回答

🗄️ 向量資料庫

向量資料庫是 RAG 的核心組件，它能根據語意而非字面來搜尋資料。

🏆 熱門向量資料庫比較

工具	特色	適合
Pinecone	全託管、最易上手	快速原型、中小規模
Weaviate	開源、功能豐富	進階用戶
Chroma	輕量開源、Python 友善	本地開發、學習
Milvus	高效能、大規模	企業級應用
pgvector	PostgreSQL 擴充	已用 PostgreSQL 的團隊

⚡ RAG vs Fine-tuning

📊 選擇指南

特色	RAG	Fine-tuning
原理	外掛知識庫（推論時搜尋）	重新訓練模型權重
更新速度	⚡ 即時（改知識庫就好）	🐢 需要重新訓練
成本	💰 較低	💰💰💰 需要 GPU
準確度	取決於檢索品質	特定領域更自然
適合	客服、知識問答、文件搜尋	改變回答風格、專業術語

💡 **最佳實踐：**80% 的企業 AI 場景先用 RAG 就夠了。只在 RAG 不夠時再考慮 Fine-tuning，或兩者結合。

🛠️ 不寫程式也能用的 RAG

🆓 免程式碼 RAG 方案

💬 ChatGPT GPTs — 上傳文件，AI 就能根據文件回答（最簡單的 RAG）
🔵 Claude Projects — 上傳知識庫文件，200K tokens 容量
📝 Notion AI — 自動對你的 Notion 知識庫做 RAG
🌊 Coze / Dify — 視覺化 RAG 搭建平台（No-Code）

🏢 實戰案例：企業客服 RAG

假設你經營一家電商，客服每天收到 200 封產品問題。用 RAG 建立 AI 客服：

步驟拆解

1. 準備知識庫
   ├── 商品目錄.pdf（500 個產品規格）
   ├── 退換貨政策.docx
   ├── 常見問題 FAQ.xlsx（300 條 Q&A）
   └── 歷史客服對話紀錄.csv

2. 建置 RAG（用 Dify 免費版）
   ├── 上傳所有文件 → 自動切割+嵌入
   ├── 設定 System Prompt：
   │   「你是 XX 品牌的客服助理，用親切的繁體中文回答。
   │     只根據知識庫回答，不確定的說『我幫您轉接真人客服』。」
   └── 嵌入到官網聊天視窗

3. 結果
   ├── 80% 的問題 AI 自動回答
   ├── 回答時間從 24 小時 → 10 秒
   └── 客服人力需求減少 60%

🔬 進階 RAG 技術

基礎 RAG 有時候檢索不精確。進階技術可以大幅提升品質：

Multi-Query RAG（多查詢）

用 AI 把用戶的單一問題改寫成 3-5 個不同角度的查詢，然後合併搜尋結果。

用戶問：「MacBook 適合寫程式嗎？」

AI 自動改寫成：
- "MacBook 程式開發效能"
- "macOS 開發環境優缺點"
- "MacBook vs Windows 筆電寫程式比較"
- "MacBook 推薦型號 軟體工程師"

→ 四個查詢的結果合併 → 回答更全面

Hybrid Search（混合搜尋）

結合語意搜尋和關鍵字搜尋，取兩者的優點：

搜尋方式	優點	缺點
語意搜尋	理解「意思相近」的不同說法	精確的產品編號可能失準
關鍵字搜尋	精確匹配編號、名稱	不理解同義詞
混合搜尋	兩者的優點結合	設定稍複雜

Re-Ranking（重排序）

先粗檢索 20 筆結果，再用更精確的小模型重新排序，只留前 5 名最相關的送給 AI。

Contextual Chunking（上下文切割）

切割文件時保留前後段的摘要，讓每個小段落都知道自己在原文中的位置。

📏 怎麼評估 RAG 效果？

指標	衡量什麼	目標
Recall	檢索到的段落中是否包含正確答案	> 90%
Precision	檢索結果中有多少是真正相關的	> 70%
Faithfulness	AI 回答是否忠實於檢索到的內容（不瞎掰）	> 95%
Answer Relevancy	AI 回答是否真正回答了用戶的問題	> 85%

推薦評估工具：Ragas（開源 RAG 評估框架）

❓ FAQ

什麼是 RAG？

RAG（檢索增強生成）讓 AI 在回答前先搜尋外部知識庫，再根據搜尋結果生成回答。可大幅減少 AI 幻覺，也能回答私有或最新資訊。

RAG 和 Fine-tuning 怎麼選？

80% 場景用 RAG 就夠（成本低、即時更新）。Fine-tuning 適合需要改變模型行為風格的場景。可兩者結合。

不會寫程式能用嗎？

可以！ChatGPT GPTs 和 Claude Projects 本質上就是簡化版 RAG。上傳文件即可使用，不需要寫程式。進階需求可用 Dify/Coze 等 No-Code 平台。

向量資料庫是什麼？

專門存儲和搜尋語意向量的資料庫，能根據「意思相近」而非字面搜尋。熱門選擇：Pinecone（最易用）、Chroma（學習用）、Weaviate（進階）、Milvus（大規模）。

RAG 能減少 AI 幻覺嗎？

研究顯示可減少 50-80% 幻覺。但無法完全消除，需搭配高品質知識庫和良好 Prompt 設計。搭配 Re-Ranking 和 Faithfulness 評估可進一步改善。

RAG 的知識庫可以多大？

取決於向量資料庫的能力。Pinecone 免費版支援 100K 筆向量（約數千頁文件），付費版可擴展到數百萬筆。大部分中小企業的文件量都在免費版範圍內。