找回密码
 加入怎通
查看: 1476|回复: 2

[站长八卦] SEO教程之robots文件相关

[复制链接]
51socai 发表于 2012-05-15 18:02:35 | 显示全部楼层 |阅读模式
本文要介绍的是关于robots文件的一些信息。& Y6 l4 m6 T) T% ?  }) S
  robots.txt是一个纯文本形式的文件,例如我们的记事本,当每个搜索引擎蜘蛛访问我们的站点时,蜘蛛首先要检查的就是所在站点是否存在robots.txt文件,如果该文件存在,那么蜘蛛就会按照robots里的协议进行爬取。如果robots.txt不存在那么蜘蛛就会按照链接去爬取各个页面。如果没有配置robots.txt的站点,蜘蛛将被转到,如果没有设置404错误页面这是对搜索引擎不友好的。而robots文件必须是txt完全小写格式,必须放在网站的根目录下。
# P/ ]& E, B& [8 D3 o) Y  我们可以理解为,robots.txt是一个互联网协议,如果robots里禁止蜘蛛爬取那么蜘蛛就会遵循这个旨意。robots起到引导保护自己不想被蜘蛛爬取的页面。比如说私密文件。
' [0 N3 q, \+ [' o7 H' [5 v# q  那么其重要用途是什么呢?  我们可以合理利用蜘蛛这个特性,来有效的引导蜘蛛的爬行路径,减少蜘蛛的爬行深层页面的压力,从而叫蜘蛛搜索更大的信息,提高网站收录。而在进行网站优化的时候,很多站长都会使用robots来禁止蜘蛛爬取不相关,不利于网站优化的页面。如大量图片,后台,在线购物,在线支付等等。这样就可以提高蜘蛛的爬行能力,这也是网站优化的一个重要细节。
3 G/ u9 L# l: v% r$ ]  上面我们了解了,robots.txt能给搜索引擎蜘蛛减压,有效的利用robots.txt可以引导蜘蛛爬行路线,爬取更多的页面,提高收录。那么如何制作robots.txt呢。  指令表示搜索robots可以沿着该页面上的链接继续爬取下去。  那么如何设置网站中不想被爬取的部分呢?
% q! ]4 |# r; \  首先创建一个纯文本文件 robots.txt,在这个文件中声明该网站中不想被robot访问的部分。该文件必须放在网站根目录下。
4 K1 a+ n8 m- X/ E, A  robots.txt文件包含一条或更多的记录,这些记录通过空行分开(以cr、cr / nr、或nl作为结束符),每一条记录格式为:  ":"  在该文件中可以使用#进行注解。
  \4 P8 c' H  d: B/ c! j  robots.txt文件用法举例7 s- i" V$ e6 B7 l9 I2 F: T
  1.禁止所有搜索引擎访问网站的任何部分。
8 b' b) |' ?- q  User-agent:*5 ]2 Y2 X1 I9 ~' G. K: a
  Disallow:/+ t: K/ l6 X% ]; l9 B* w
  2.禁止某个搜索引擎的访问。  f2 W3 N- ?* O5 _' F0 m
  User-agent:  BadBot1 X! r8 D2 D# J0 j: N$ M8 j
  Disallow:/
) U6 o1 S  y3 z' }  3.允许某搜索引擎的访问1 v6 R, |& c5 Z
  User-agent:  baiduspider- R4 T0 N# {/ O
  Disallow:
9 d: b6 j- |1 {( M. B$ f  User-agent:*+ Y! Y( b8 k$ h7 J& H
  Disallow:/
" O7 t1 g7 ~  m: h  4.一个简单的例子8 X+ Z# Q7 g( ~4 r2 @5 W
  改网站又3个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这3个目录。. i" q# O. {* z+ e4 P- a
  User-agent:*3 R) T4 T: P* x9 \' ?- c2 l
  Disallow:  /cgi-bin/4 E& e7 S' f9 p* T7 {8 {: \) K
  Disallow:/tmp/
7 |$ C$ T% q3 p! B  @8 Y  Disallow:/admin/# L* ~5 T0 @' b0 J' m' p
  需要注意的是对每一个目录需要分开声明。
回复

使用道具 举报

gao136 发表于 2012-05-15 18:20:40 | 显示全部楼层
那么如何设置网站中不想被爬取的部分呢?
回复 支持 反对

使用道具 举报

浪浪SEO 发表于 2026-01-22 11:52:30 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 19:15 , Processed in 0.288702 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表