找回密码
 加入怎通
查看: 1545|回复: 2

[关于百度] 百度蜘蛛状态码与百度快照是否更新有关系

[复制链接]
TONY 发表于 2012-03-21 11:33:13 | 显示全部楼层 |阅读模式
  做网站有大半年了,今天第一次写这类文章.至于为什么要写这篇文章,是因为2009年下半年以来一直到现在,百度 经常不正常,导致很多站长的网站出现快照不更新,快照回档,甚至被K的现象.所以在A5论坛和seowhy论坛上经常看到有些站长说,希望百度能尽快更新自己的快照.其实快照第二天是否更新,不一定要寄希望于他人,只要自己查查web日志,就能知道.也就是我今天要跟大家说的话题.: ~% _0 Y4 {: K5 g3 K" ?
* W, g4 e' H6 T0 c" R. t' {: r' K
  下面我就简单的谈一下关于百度蜘蛛访问网站后,web日志所返回的状态码与首页的百度快照是否会更新之间的关系,所谈到的都是小弟大半年以来每天观察自己网站的web日志里百度蜘蛛的爬行痕迹所摸索出来的规律,希望对大家有些帮助.
) I  P' u6 o6 _& C# q9 e/ a. K" s1 r+ P6 ^9 @! h" @$ j$ {
  大家可以尝试着打开web日志的.log文件,web日志的默认路径是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虚拟主机的朋友可以找空间商索要.打开文件夹下的.log文件,搜索百度蜘蛛,百度蜘蛛的名字为baiduspider.然后一直Enter,可以查出百度蜘蛛访问网站后留下的所有足迹.在查找中,注意一下百度蜘蛛名字前面的IP,还有整行最后的状态码.3 [* n' ~: t% q  S7 n( I$ I/ f
3 F1 r1 w: V# J" m/ I
  一般情况下,蜘蛛抓取网页如果返回200 0 0代码,则表示该网页已经成功编入索引,200 0 64是指索引数据库已经存在,没有发现网页有更新的内容,不需要重新索引的意思.304 0 0是指原来缓冲的文档还可以继续使用,跟200 0 64意思应该差不多吧. (值得一提的是:200 0 64并不是网上很多人说的会被K站或降权,是正常现象,动态网站抓取的时候大多数出现200 0 0,即便是网站没有更新.)1 a& u5 l: H9 w

: `+ z, M, p9 N% p7 k/ d  在说一下蜘蛛IP,我的web日志里查到的蜘蛛IP一般都是220.181.7.*和123.125.66.*比较多,还有一个61.135.162.*,这三个段的IP是抓取网页的,123.125.68.*这个段的是百度沙盒蜘蛛IP.61.135.168.*这个段的蜘蛛是抓取图片的.不过百度蜘蛛应该还有很多,可能是按照网站的地区和线路发放蜘蛛的吧.具体情况还要具体对待.不过有一点可以肯定的是,在网站没被降权的情况下,只要有两个IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*这两个段)都抓取了网站首页且返回的状态码是200 0 0,那就不用每天等到零晨四点看百度更新首页的快照了(我以前经常等到凌晨四五点才睡觉,呵呵,不过现在一般都是在早上六七点才更新快照).
' c4 `) w. P2 i' n& n4 n
  A% ^8 R( b: e) R  一般百度首页快照比较慢、网站权重比较低或者被降权的网站,蜘蛛一般都是返回的200 0 64的状态码.我有一个被K过的网站,当时每天都只有123.125.68.*这个段的IP,且状态码都是返回的200 0 0.; D8 {& e! R4 s

  z0 g' x7 u5 }  还有一些不知道怎么写了,暂且就这么多吧,等以后整理一下再继续写!
回复

使用道具 举报

缘来是你 发表于 2025-11-11 03:42:40 | 显示全部楼层
楼主太厉害了,整理得这么详细,必须支持
回复 支持 反对

使用道具 举报

love0509 发表于 2026-03-13 13:33:01 | 显示全部楼层
蹲了这么久,终于看到有价值的讨论,支持一下!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 14:32 , Processed in 0.127498 second(s), 26 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表