robots.txt 怎么写才能不让搜索引擎抓取测试页面?

❤玉楠 阅读 51

我们网站上线前搞了个 /test/ 目录放临时页面,现在想通过 robots.txt 禁止爬虫抓取,但不确定写法对不对。我试过这样写:

User-agent: *
Disallow: /test/

但 Google Search Console 里还是显示有些测试页被索引了,是不是路径写法有问题?或者需要加结尾斜杠?

我来解答 赞 12 收藏
二维码
手机扫码查看
1 条解答
UE丶东昇
你的写法其实基本是对的,但为了确保万无一失,可以试试这样:

User-agent: *
Disallow: /test/

如果测试页面都在这个目录下,不需要特意加斜杠。不过有几点要注意:robots.txt 只能建议爬虫不要抓取,不能强制阻止。有些不太守规矩的小爬虫可能会无视它。

另外记得检查这几个问题:
1. robots.txt 是否正确上传到网站根目录
2. 文件权限设置是否正确,确保搜索引擎能看到
3. 等待一段时间,因为搜索引擎需要时间更新索引

如果已经生效了还是有问题,可以考虑在网页头部加上 noindex 标签作为双重保险。这招对 Google 特别管用。

<meta name="robots" content="noindex">


希望这些方法能帮你解决问题。有时候搜索引擎确实有点调皮,得多试几种办法才行。
点赞
2026-03-27 05:02