建议输入完整 https:// 域名,最多支持 300 个站点。
站点差异概览
| 序号 |
站点 |
Sitemap页 |
已爬取 |
爬取成功 |
差值 |
差异率 |
失败页 |
状态 |
操作 |
使用说明
- 工具会先读取 Sitemap 样本量,再按层级从首页开始爬取,比较两者的页面数量差异。
- Sitemap 返回数量受接口限制(最多 1000 条),建议结合实际站点情况调节抽取量与爬取量。
- 差异为 Sitemap 页数 - 爬取成功页数,差异率用于快速判断潜在缺页或索引不足。
- 若站点启用防爬策略,可适当降低层级或页面限制,并延长间隔,避免触发安全策略。
提示
- 差异为正代表 Sitemap 声明的页比实际爬取多,可能存在失效链接或需要排查的页面。
- 若差异为负,说明实际爬取页面更多,可能是 Sitemap 未及时更新,可提醒研发/编辑维护。
- 点击“详情”可查看单站的 Sitemap 列表与爬取样本,支持导出 CSV 归档。