robots文件禁止收录使页面质量更高

TONY · 发表于 2012-07-16 09:46:15

　　robots文件主要是为了防止搜索引擎收录和索引特定的页面。减小复制内容的出现。如seohu.net，同时具有动态URL和静态URL，它们同时指向相同的页面。如果搜索引擎同时收录就会造成复制页面。

　　1.robots文件放在哪里

　　robots文件放在网站根目录下，搜索引擎进入网站查看的第一个文件就是 robots文件。 robots文件是规定搜索引擎抓取范围的文件。如果我们希望网站某些页面不被抓取，只需要创建一个 robot.txt，写入禁止收录的页面并上传到网站根目录下。

　　2.robots文件怎么写

　　robots文件由记录组成，记录之间以空行分开，记录格式为：<域>可选空格><域值><可选空格>

　　如： User-agent

　　Disallow:/

　　这面的这个robots文件代表禁止任何搜索引擎抓取网站任何页面。只针对百度蜘蛛则用：

　　User-agent:Baiduspider

　　针对谷歌则用：

　　User-agentooglebot

　　如下面的robots代表禁止百度抓取动态URL和文件夹temp下的文件

　　User-agent:Baiduspider

　　Disallow?*

　　Disallow:/temp/

　　其中*为通配符，可以代表任何一段代码。详细匹配可以看：

　　Seohu:主流搜索引擎都支持robots文件禁止收录机制。但如果有外部链接指向禁止收录的页面，这个页面还是可能出现在搜索结果中。其表现形式一般为导入链接的锚文字显示为标题和描述。本文写的很简单，如果还想深入了解，请在后面回帖留言。我会给大家解答。

﹃錯愛 · 发表于 2012-07-16 10:23:20

很不错，感谢楼主的分享

TONY · 发表于 2012-07-16 10:28:04

﹃錯愛发表于 2012-7-16 10:23 $ k5 Z& @/ z, }% z& m: }3 \
很不错，感谢楼主的分享

有必要的好东西大家一起分享比如本站就屏蔽了动态的URL 因为最近才屏蔽所以收录一时间停止了不过有大家的支持,我相信,很快就会回来的哦!

畅速-阳仔 · 发表于 2026-02-08 01:34:12

学习到了，之前一直没注意过这个点，受教了

关不住的心 · 发表于 2026-04-28 07:00:45

说得很实在，没有夸大其词，这种真实分享太难得了

缘来是你 · 发表于 2026-05-24 17:49:39

分析得很透彻，很多细节都说到点子上了～

王学子 · 发表于 2026-06-11 14:41:35

刚好遇到类似问题，看完这个帖子心里有底了

qq564654 · 发表于 2026-06-12 18:04:32

完全赞同，我也是这么认为的，英雄所见略同～

坚固环球 · 发表于 2026-07-13 22:51:28

蹲了这么久，终于看到有价值的讨论，支持一下！

		自动登录	找回密码
密码			加入怎通

[站长八卦] robots文件禁止收录使页面质量更高

相关帖子