Spider.es クローラーアクセス FAQ

よくある質問

Spider.es がクローラーアクセスの監査、テクニカル SEO の課題診断、新しい AI ボットへの対応をどう支援するかご紹介します。

トピックを選ぶと該当する回答にスクロールします。

Spider.es で任意の URL を分析すると、Googlebot に影響する robots.txt ルール、メタタグ、X-Robots-Tag ヘッダー、そして発火した Allow / Disallow を数秒で確認できます。

決定テーブル内の Bingbot と Googlebot 行を比較して、許可状況・クロールディレイ・例外の差を把握しましょう。

Spider.es は GPTBot、ChatGPT-User、Claude、Perplexity、Google-Extended など多数の AI User-Agent を監視し、ブロックされているか、その根拠となるディレクティブを表示します。

重要な URL が disallow や noindex の対象だと、サイトマップに含まれていてもインデックスされません。レポートで主要セクションがクロール可能か確認し、Search Console にサイトマップを再送信しましょう。

Robots.txt はサイト全体のクロールルールです。Spider.es は対象 URL に一致したディレクティブをハイライトし、ファイル全体を解析しなくても影響を理解できるようにします。

商品ページや記事など任意の URL を送信すると、Spider.es がそのパスの robots.txt、メタタグ、ヘッダーを確認し、きめ細かなディレクティブを検証できます。

Spider.es は検索エンジンや LLM ボットから SEO オーディター、ソーシャル、セキュリティ、研究スクレイパーまで、クローラーを分類して提供します。

Spider.es が監視するエコシステムの一端を紹介し、クローラビリティ・セキュリティ・パフォーマンスを管理できるようにします。

検索エンジン: Googlebot、Bingbot、YandexBot、Baiduspider、DuckDuckBot、Applebot、Qwantbot、SeznamBot、Sogou。
AI & LLM クローラー: ChatGPT-User、GPTBot、Google-Extended、ClaudeBot、Claude-Web、PerplexityBot、Cohere、Anthropics、OAI-SearchBot、Quillbot、YouBot、MyCentralAIScraperBot。
SEO ツール: AhrefsBot、SemrushBot、MJ12bot、DotBot、DataForSeoBot、Awario Bot、SEOkicks、Botify、Jetslide、peer39。
ソーシャル・共有: facebookexternalhit、FacebookBot、Twitterbot (X)、Pinterestbot、Slackbot、Meta 外部フェッチャー。
セキュリティ & クラウド: AliyunSecBot、Amazonbot、Google-CloudVertexBot など。
スクレイパー & 研究: BLEXBot、Bytespider、CCBot、Diffbot、DuckAssistBot、EchoboxBot、FriendlyCrawler、ImagesiftBot、magpie-crawler、NewsNow、news-please、omgili、Poseidon Research Crawler、Quora-Bot、Scrapy、SeekrBot、SeznamHomepageCrawler、TaraGroup、Timpibot、TurnitinBot、ViennaTinyBot、ZoomBot、ZoominfoBot。

Spider.es のレポートをチェックリスト化し、検索エンジンが価値あるコンテンツに集中するようにしましょう。

オーガニックトラフィックが減少する前に、これらの警告サインに注意してください：

Spider.es は robots.txt、メタロボットタグ、X-Robots-Tag ヘッダーを並べてチェックし、どのボットがクロール可能か、誰がブロックされているか、理由は何かを示します。

Robots.txt は URL 取得前に準拠ボットを止めます。公開情報なので正当なクローラー向けのガイドとして使い、細かな制御にはメタタグやヘッダーと組み合わせましょう。

メタロボットタグは HTML 内に、X-Robots-Tag ヘッダーはすべてのファイルタイプに適用できます。両者を組み合わせると、クロールを通過したページやアセットのインデックス制御が可能です。

AI クローラーは帯域を消費し、独自コンテンツを再利用したり、法的議論を引き起こすことがあります。robots.txt やレスポンスヘッダーで明示的にブロックし、ポリシーを示しつつデータを保護しましょう。

プライベート領域、ステージングサイト、重複コンテンツ、攻撃的なスクレイパーをブロックするのは適切です。必要に応じて Disallow と noindex を併用し、頼りにするボットのホワイトリストを維持しましょう。