前不久百度官方发表了一篇关于百度快照的说明,大体的解释了百度快照更新与倒退原因,并直接指出“网站快照与网站权重没有任何关系”。- Q3 F9 R! ^" N
9 R5 p6 p* Q9 Z$ r2 T- x2 A2 ^3 h由于SEO基础知识的普及度不够,在交换友情链接的时候,还是有很多人拿网站快照作为主要参考标准之一,即使网站排名靠前、PR高,在把百度官方声明发给对方看,对方也很无奈的来了句上边领导要求没办法。
( J9 `9 Q0 L- c7 y
; E; r2 w% x& h B. S5 Z网站百度快照不更新与隔天更新
% L) `: {2 i6 y8 t: b: p* u% L: i- X2 @% o% R. u
观察一些企业网站,发现关键词排名差不多的网站,同样是网站内容不更新,但是有的百度快照一直是隔天,有的就固定停在了某一天。! m, W* d* b' C3 \6 u4 y
9 i, O( b$ \! `就此问题,笔者做了个测试,发现百度快照不更新并不代表百度没有抓取这个页面,通过网站日志分析出百度蜘蛛抓取首页的时候,一般情况下HTTP 状态代码会返回200或304:. F% q3 U. P$ g( f
- ^: A, p9 {8 K) O8 q如果是静态页面,百度蜘蛛第一次抓取一个URL地址的时候,服务器端返回的状态码会是200,同时会记录页面的Last-Modified属性标记(页面最后修改时间,可以用之前在Firefox SEO插件里介绍的HttpFox检测),如" p4 g4 o! V/ t* L2 W& f4 b" S* b
. l# l7 V/ X2 D- |9 c( ?在第二次百度抓取这个URL的时候,根据HTTP协议,服务器会先传送If-Modified-Since HTTP头信息给访问端,检查此文件有没有修改,如果未被修改则返回内容为空的304状态码,节省传输数据量。2 H9 R8 U6 q1 g
" ?$ a. ?8 C0 d8 S* `5 d
第一个快照隔天的网站首页是动态网页,即使内容不更新,没有Last-Modified属性,每回返回的也都是200状态码,所以百度快照会是隔天。; Q4 W+ K& {1 b" R7 r9 t
3 W9 |! W: Q7 j- }) `' t
第二个快照停滞的网站是静态首页,内容没有更新,百度蜘蛛第二次抓取的时候就会返回304状态码,代表网站没有更新,所以快照日期会停留在Last-Modified那个日期,这也就是为什么百度快照不更新的原因了。* q. K, L1 b5 v7 y. q# }
h# L8 q8 u' H s4 n W
7 i: g; L0 f6 v. F8 M) U. Q: C! v2 {目前而言,百度快照在SEO的作用主要体现在交换友情链接上,所以想让网站快照新,保持动态首页或者定期生成静态首页即可。0 p# C" f, N5 p' K- }: \
7 m1 a# R, n' L# B& q' A
|