免费AI爬虫检查器

检查您的网站是否屏蔽了 GPTBot、ClaudeBot 和 Google-Extended 等AI爬虫。我们将即时分析您的 robots.txt、meta 标签和头部信息。

无需注册即时扫描即时结果

什么是AI爬虫?

AI爬虫是 OpenAI、Anthropic 和 Google 等公司用来为其AI模型索引内容的网络机器人。当这些爬虫被屏蔽时,您的品牌对AI助手来说就变得不可见——它们无法引用它们读不到的内容。

为什么 robots.txt 很重要

  • 控制哪些机器人可以访问您的网站内容
  • 屏蔽AI爬虫是导致AI不可见的首要原因
  • 许多网站在不知情的情况下通过通配符规则屏蔽了AI机器人

我们检查什么

  • robots.txt 中针对8种主要AI爬虫的规则
  • Meta robots 标签(noindex、noai、noimageai)
  • X-Robots-Tag HTTP 头部

常见问题

AI爬虫是AI公司(OpenAI、Anthropic、Google、Perplexity 等)用来为其语言模型索引网页内容的机器人。如果您的 robots.txt 屏蔽了这些爬虫,您的内容将不会出现在 ChatGPT、Claude、Gemini 和其他AI助手的AI生成回答中。这是品牌对AI不可见的首要原因。

您的 robots.txt 文件控制哪些机器人可以访问您的网站。许多网站在不知情的情况下屏蔽了 GPTBot、ClaudeBot 和 Google-Extended 等AI爬虫,无论是通过特定的 Disallow 规则还是广泛的通配符屏蔽。这意味着AI助手无法读取您的内容,永远不会引用或推荐您的品牌。

我们检查所有主要AI爬虫:GPTBot 和 ChatGPT-User(OpenAI)、ClaudeBot 和 anthropic-ai(Anthropic)、Google-Extended(Google AI)、PerplexityBot(Perplexity)、Bytespider(ByteDance/TikTok)以及 CCBot(Common Crawl,被许多AI训练数据集使用)。

除了 robots.txt 之外,页面还可以通过 HTML 中的 <meta name="robots"> 标签和 X-Robots-Tag HTTP 头部来限制爬虫访问。noindex、nofollow、noai 和 noimageai 等指令告诉爬虫不要索引或使用您的内容。我们的工具检查所有三层爬虫访问控制。

是的。GeoVector 的AI爬虫检查器完全免费,无需注册。您可以扫描任何URL并即时获取结果,显示您的 robots.txt AI爬虫状态、meta robots 标签和 X-Robots-Tag 头部。如需更深入的全站审计和持续监测,GeoVector 提供付费方案。

免费AI爬虫检查器 | GeoVector