找回密码
 加入怎通
查看: 1481|回复: 2

[站长八卦] 百度蜘蛛状态码与百度快照是否有关系

[复制链接]
TONY 发表于 2012-04-03 19:58:42 | 显示全部楼层 |阅读模式
       做网站有大半年了,今天第一次写这类文章。至于为啥要写这篇文章,是由于 2009年下半年以来一直到此刻,百度往往不正常,引起很多站长的网站呈现快照不更新,快照回档,甚至被K的征象。于是在A5论坛和搜索引擎优化why论坛上往往看到有些站长说,希望百度能尽快更新自己的快照。实在快照第二天是否更新,不必然要寄希望于他人,只要自己查查web日记,就能了解。也就是我今天要跟大师说的话题。
- q4 j) _/ u# V9 K% t9 V1 a  _& }, e5 L
  下面我就简单的谈一下对于百度蜘蛛拜候网站后,web日记所返回的状态码与首页的百度快照是否会更新之间的关系,所谈到的都是小弟大半年以来天天察看自己网站的web日记里百度蜘蛛的爬行陈迹所摸索出来的规律,希望对大师有些帮助。
* V1 v% j) K+ n3 M2 T
2 H& c) ]1 e/ a1 L  大师能够测验测验着打开web日记的log文件,web日记的默认路径是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虚拟主机的伴侣能够找空间商索要。打开文件夹下的log文件,搜索百度蜘蛛,百度蜘蛛的名字为baiduspider。然后一直Enter,能够查出百度蜘蛛拜候网站后留下的所有萍踪。在查找中,留意一下百度蜘蛛名字前面的IP,还有整行最后的状态码。
9 j! i5 J( X8 E5 S  o3 C6 B, R
$ a( a" t9 t! E  一般环境下,蜘蛛抓取网页假如返回200 0 0代码,则呈现该网页已经获胜编入索引,200 0 64是指索引数据库已经存在,没有发现网页有更新的内容,不需要从头索引的看法。304 0 0是指本来缓冲的文档还能够继续应用,跟200 0 64看法应当差未几吧。 (值得一提的是:200 0 64并不是网上很多人说的会被K站或降权,是正常征象,动态网站抓取的期间大大都呈现200 0 0,即便是网站没有更新。)) k; i' y; }: v, j9 J

0 Z* [6 r) X- M  在说一下蜘蛛IP,我的web日记里查到的蜘蛛IP一般都是2201817*和12312566*比较多,还有一个61135162*,这三个段的IP是抓取网页的,12312568*这个段的是百度沙盒蜘蛛IP。61135168*这个段的蜘蛛是抓取图片的。不过百度蜘蛛应当还有很多,可能是按照网站的地区和线路发放蜘蛛的吧。具体环境还要具体对待。不过有一点能够必定的是,在网站没被降权的环境下,只要有两个IP段的蜘蛛(比如我的日记里的2201817*和12312566*这两个段)都抓取了网站首页且返回的状态码是200 0 0,那就不消天天比及零晨四点看百度更新首页的快照了(我以前往往比及凌晨四五点才就寝,呵呵,不过此刻一般都是在早上六七点才更新快照)。7 ~, M  D9 v# E6 u- F$ ^, c

; f. \1 K* y) f: V% ]  r  一般百度首页快照比较慢、网站权重比较低或者被降权的网站,蜘蛛一般都是返回的200 0 64的状态码。我有一个被K过的网站,那时天天都只有12312568*这个段的IP,且状态码都是返回的200 0 0。
' [% w, k) R+ q- H  d* p' K
回复

使用道具 举报

20120506 发表于 2026-01-17 21:02:08 | 显示全部楼层
内容很干货,没有多余的废话,值得反复看
回复 支持 反对

使用道具 举报

中国数科8016 发表于 2026-02-24 14:56:36 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 18:42 , Processed in 0.331885 second(s), 32 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表