robots.txt 怎么写才能不让搜索引擎抓取测试页面？

❤玉楠提问于 2026-03-27 04:36:18 阅读 81

优化

我们网站上线前搞了个 /test/ 目录放临时页面，现在想通过 robots.txt 禁止爬虫抓取，但不确定写法对不对。我试过这样写：

User-agent: *
Disallow: /test/

但 Google Search Console 里还是显示有些测试页被索引了，是不是路径写法有问题？或者需要加结尾斜杠？

我来解答赞 12 收藏

反馈

1 条解答

UE丶东昇 Lv1

你的写法其实基本是对的，但为了确保万无一失，可以试试这样：

User-agent: *
Disallow: /test/

如果测试页面都在这个目录下，不需要特意加斜杠。不过有几点要注意：robots.txt 只能建议爬虫不要抓取，不能强制阻止。有些不太守规矩的小爬虫可能会无视它。

另外记得检查这几个问题：
1. robots.txt 是否正确上传到网站根目录
2. 文件权限设置是否正确，确保搜索引擎能看到
3. 等待一段时间，因为搜索引擎需要时间更新索引

如果已经生效了还是有问题，可以考虑在网页头部加上 noindex 标签作为双重保险。这招对 Google 特别管用。

<meta name="robots" content="noindex">

希望这些方法能帮你解决问题。有时候搜索引擎确实有点调皮，得多试几种办法才行。

2026-03-27 05:02