回到頂部

ClaudeBot 該封鎖嗎?2026 AI 爬蟲對 SEO 的影響與防禦策略

ClaudeBot 是什麼、對 SEO 的影響、robots.txt 跟 Nginx 設定、Cloudflare WAF 防禦——2026 AI 爬蟲管理完整指南。

ClaudeBot 是什麼?跟 Google Bot 差在哪?

ClaudeBot 是 Anthropic 開發的網頁爬蟲,用於:

  • 收集網頁內容訓練 Claude 模型
  • 即時檢索(Claude 在回答用戶時可能 fetch 網頁)
  • 建立網頁知識圖譜

跟 Google Bot 的本質差別:

維度Google BotClaudeBot
目的索引並把流量導回原網站吸收內容到 AI 訓練集
流量回饋高(SERP → 用戶點進原網站)(用戶在 Claude 介面拿答案)
遵守 robots.txt是(Anthropic 公開承諾)
行為規律、可預期、頻率穩定突發、有時密集
辨識 User-AgentGooglebotClaudeBot

User-Agent 字串:

Mozilla/5.0 (compatible; ClaudeBot/1.0; +https://www.anthropic.com/claudebot)

對 SEO 的影響:三個層次

短期(< 6 個月):看不到流量損失

ClaudeBot 爬你的網站不會直接影響 Google 搜尋排名——Google 的演算法跟 Anthropic 的爬蟲沒關係。短期感覺不到差別

中期(6-18 個月):Zero-Click Search 風險

重要的是「用戶行為改變」。當用戶習慣用 Claude / Perplexity / ChatGPT 找答案,且這些 AI 已經吸收你網站內容:

  • 用戶問「Mason AI 實驗室介紹——AI 直接給答案,用戶不點 masonailab.com**
  • 用戶問「怎麼用 Ollama——AI 從你的 Ollama 教學文整理答案,用戶不點原文

這就是 Zero-Click Search 的真實影響。對「內容站、教學站」的傷害最大。

長期(2-5 年):商業模式變化

最壞情況:AI 把全網內容免費化,內容創作者的廣告 / 訂閱 / 工商模式崩盤。 最好情況:AI 引用流量(AI 在回答時引用源網站)成為新型曝光通道,引用次數可能比 Google 搜尋更有商業價值。

目前(2026)趨勢:介於兩者之間,Anthropic、Perplexity 開始把「引用源網站」做成主要功能,提供原網站「新型流量」。

三層防禦選項

1. robots.txt 軟封鎖(信譽好的爬蟲會遵守)

最簡單。在你網站根目錄的 robots.txt 加:

完全禁止 ClaudeBot:

User-agent: ClaudeBot
Disallow: /

只禁某些路徑:

User-agent: ClaudeBot
Disallow: /premium/
Disallow: /paid-content/
Crawl-delay: 30

Crawl-delay: 30 表示「每 30 秒最多爬 1 頁」——避免突發密集爬取。

注意:robots.txt 是「請求」不是強制,只有「有信譽的爬蟲」(Google、Anthropic、Microsoft)會遵守。惡意爬蟲完全不理

2. Nginx 速率限制(技術防禦)

對「不遵守 robots.txt 的爬蟲」用 Nginx 強制限速:

http {
    limit_req_zone $http_user_agent zone=claudebot:10m rate=10r/m;

    server {
        # 對 ClaudeBot 限速:每分鐘最多 10 次請求
        if ($http_user_agent ~* "ClaudeBot") {
            limit_req zone=claudebot burst=5 nodelay;
        }
        
        # ...其他設定
    }
}

超過頻率回 429 Too Many Requests,正常用戶不受影響。

3. Cloudflare WAF Managed Challenge(最強)

Cloudflare 提供「AI Scrapers and Crawlers」管理規則。在 Dashboard:

  1. Security → WAF
  2. 加規則:Field: AI Crawler / Identified Bot → Action: Managed Challenge
  3. 啟用後 ClaudeBot 訪問會遇到 JavaScript challenge(自動驗證,真實爬蟲過不了)

進階用法:用 IP 範圍精準辨識(Anthropic 公開):

160.79.104.0/21

對「這個 IP 範圍允許 100 req/min」,其他 IP 標 ClaudeBot User-Agent 直接擋(可能是冒名的爬蟲)。

我的建議:速率限制 + 觀察

不要全面封鎖——理由:

  1. AI 搜尋產品 2026 起會帶來「AI 引用流量——被引用 = 新型曝光
  2. 完全擋 AI 爬蟲 = 自我邊緣化——未來搜尋路徑會包含 AI,擋了等於從這個通道消失
  3. Anthropic 在 AI 倫理上比同業積極——封鎖 ClaudeBot 但放 GPTBot、ByteSpider 邏輯怪異

Mason 推薦的設定:

# robots.txt
User-agent: ClaudeBot
Crawl-delay: 30

User-agent: GPTBot
Crawl-delay: 30

User-agent: anthropic-ai
Crawl-delay: 30

User-agent: PerplexityBot
Crawl-delay: 30

User-agent: ByteSpider
Disallow: /

User-agent: facebookexternalhit
Crawl-delay: 60

邏輯:

  • 對 OpenAI、Anthropic、Perplexity:速率限制但允許——保留 AI 引用流量
  • 對 ByteDance(ByteSpider):完全封鎖——SEO 上幾乎無回饋
  • 對 Facebook crawler:重度限速——常常爬太兇

加 Nginx 速率限制 + Cloudflare Managed Challenge,保護伺服器資源、保留 AI 引用機會

監控建議

  • 每月查 Cloudflare Analytics → Security → Bot,看 ClaudeBot 流量比例
  • Search Console → Insights(Google 2026 推出):看「AI search referral」流量趨勢
  • Server log analysis(GoAccess、AWStats):看實際 ClaudeBot 訪問量

如果 ClaudeBot 占伺服器流量 > 10%,考慮加強速率限制。如果 ClaudeBot 帶來實質引用流量(可從 Claude.ai 點過來的 referrer 看),調整成「鼓勵爬取」。

❓ FAQ

封鎖 ClaudeBot 會影響我的內容被 Claude 引用嗎?

會,直接相關。Claude 訓練資料 + 即時檢索都用 ClaudeBot 抓的內容。全封鎖 = Claude 用戶問你領域的問題時,引不到你的網站。對「個人品牌、思想領袖、新創」打造識別度的場景,這是負面影響。對「新聞媒體、付費內容」要保護商業模式的場景,封鎖是合理的

怎麼確認 ClaudeBot 真的有抓我的網站?

看 server log(/var/log/nginx/access.log 或對應路徑),grep 找 ClaudeBot:

grep -i "ClaudeBot" /var/log/nginx/access.log | head -20

看到的 IP 應該在 160.79.104.0/21 範圍內,User-Agent 含 ClaudeBot/1.0如果有 User-Agent 是 ClaudeBot 但 IP 不在 Anthropic 範圍——很可能是冒名,可以放心擋。

我用 Cloudflare 全部 AI Bot 都擋了,有什麼風險?

短期沒事,中長期會錯失 AI 搜尋曝光具體風險:(1) Claude.ai 用戶問你領域問題時,Claude 引不到你網站,可能引到競爭對手(2) Perplexity、SearchGPT、ChatGPT Search 等 AI 搜尋產品爆發後,你的網站「AI 引用流量」會是 0(3) 你的個人品牌在 AI 知識圖譜中「不存在——對顧問、講師、創作者長期是負面。建議:速率限制而非全封鎖,除非你有強烈商業理由保護內容。

№ · further reading

延伸閱讀