站点地图 vs 爬取量差异检测

首页
建议输入完整 https:// 域名,最多支持 300 个站点。
留空则默认 https://domain/sitemap.xml。
后台最多返回 1000 条,用于统计对比。
每站点最多爬取的页面,越大越耗时。
层级越深,能覆盖的页面越多。

使用说明
  • 工具会先读取 Sitemap 样本量,再按层级从首页开始爬取,比较两者的页面数量差异。
  • Sitemap 返回数量受接口限制(最多 1000 条),建议结合实际站点情况调节抽取量与爬取量。
  • 差异为 Sitemap 页数 - 爬取成功页数,差异率用于快速判断潜在缺页或索引不足。
  • 若站点启用防爬策略,可适当降低层级或页面限制,并延长间隔,避免触发安全策略。
提示
  • 差异为正代表 Sitemap 声明的页比实际爬取多,可能存在失效链接或需要排查的页面。
  • 若差异为负,说明实际爬取页面更多,可能是 Sitemap 未及时更新,可提醒研发/编辑维护。
  • 点击“详情”可查看单站的 Sitemap 列表与爬取样本,支持导出 CSV 归档。