记得去年笔者刚入门SEO时,在SeoWhy悬赏了一个关于网站IIS日志的问题,大概描述是:百度蜘蛛抓取网站,日志为什么会出现200 0 64代码?64表示什么?
* M6 W8 C- Z" x, l/ [4 C# h2 v/ I- \: }+ S9 f" O# ?
得到了蛮多人热心回复,大致有以下七种说法:
* @! U X7 W+ W8 S( H; S/ D: p) m
1、64表示64位系统;! `2 x( u( t8 ^( A8 x
& u U& Z+ B/ g) b9 x- [* j3 v; m2、64表示抓取次数;
0 |- l$ q- n/ Q O; o0 ~3 x3 b0 b7 N. K/ M( H" u* ?) Q
3、64表示正常,不需要理会;
) i( r0 {6 e9 ^; v k. Z% x# U4 {
4、64表示网页没有更新;- Z' g P1 @: m+ l( J4 n
4 {% M6 u- n' r1 h5、64表示k站的前兆;
- {! w. ~& H( A1 O/ [
2 _& @( w& j( k6、64表示网站处于考核期;
2 N! q3 ^# o8 i/ R
7 L0 K* F- ^& }% c6 Z* g' I8 U, G7、64表示蜘蛛对网站Gzip压缩解密失败;$ a+ `9 a% r) p
, F0 }; `9 b" c/ [" m/ z7 ?由于当初经验不够,也没有对网站日志进行详细分析,故此事不了了之。但通过自己查找的一些资料,心里隐约感觉跟服务器或者网络状况有关联,具体原因又说不出来。$ C6 [9 Z6 W4 g2 K8 e' c; t
* x% |; ]' l/ h' n
今天在站长论坛又发现了这个问题,于是把自己服务的地坪公司网站日志下载分析,觉得有必要纠正一些错误的观点,做科学的SEO。8 K4 S6 r- {+ b% m- L; l8 Q
- S3 q- b6 L9 z3 J+ d+ y/ Z
首先我们先分析一下200 0 64这个状态码在windows系统具体含义。
$ P" U4 Y4 g* _+ \' s' s \- O; J7 J$ {& h* x, |
在windows命令提示符下输入:net helpmsg 64,回车我们看到“指定的网络名不再可用”。这样就证实了网络上一位名博的观点:会话故障,请求不可到达。那么是不是有可能是蜘蛛在爬行服务器时,服务器资源不够,导致请求失败呢?这个持保留意见。# \' X3 h& L/ E( [6 m' l9 ]7 H
+ Y& j( ]. z) z$ @1 F9 ^2 O d
那么下面就服务的企业网站实例来解析日志出现200 0 64这个现象。
2 X3 J9 R! d2 @' B2 m, T- q# {, d
1、首先该企业网站使用的是独立ip服务器,是江苏电信机房的;
0 c& M& p u+ W. J9 q0 T7 q" d; |: S# f' q$ O/ g- b1 F! V& Q
2、笔者随机查看了几天的日志文件,发现几乎每天都有200 0 64代码出现;
[) _' \6 B- ^3 ~/ L; P4 g# W: C
" ]) w0 i: ^& H- E g3、在日志文件中笔者发现123.125.71.12这个百度蜘蛛抓取2197.html时候出现200 0 64状态码;: A! e+ r9 \* d/ I/ F% e! ?& t
$ W; O+ ?3 B* O/ A! r
4、命令提示符下DNS反查命令nslookup确认百度蜘蛛,Baiduspider ip的hostname以*.baidu.com的格式命名。. Q) @( e, Y3 ~ y+ |! z
/ @5 x( R6 v |2 \' T
5、同样的方法判断了其他出现200 0 64的日志代码,发现状态码处于的IP段是123.125.71.*
4 {0 {7 e, R6 K/ g; s- Q- W8 U
& O* q9 d2 ^$ R$ v1 @6、通过ip138工具查询123.125.71.*为北京联通ip段;4 J: {' H3 p/ ~; @
0 C: _1 f; V. q5 B# z+ x7 j
就这个网站出现200 0 64状态码原因大胆猜测:笔者分析的网站服务器是电信机房,当百度蜘蛛网通IP段访问电信服务器时候,由于两网互通出现问题,导致蜘蛛不能正常获取网站内容,百度网通蜘蛛于是放弃爬行索引,故出现了200 0 64状态码。7 u9 L: k8 _. j: v# B$ s8 o
; m) }+ e0 [4 y7 _) n
目前国内网络运营商的竞争态势是在各自市场上的竞争极为激烈,摩擦不断。而竞争的直接结果就是,在互联网互联互通问题上,运营商人为地限制了对方数据的交换速度。有人开玩笑说世界上最遥远的距离,不是我-你-他之间的距离,而是电信和网通之间的距离。
6 R# Y1 |( B9 t; C# Y* q4 n" Z, D* K' h. M
7、笔者再次抽查一些日志文件,百度蜘蛛电信IP和电信IP访客访问网站也会出现200 0 64这个状态码;
7 v" Q' z1 K" G/ N6 l( A% n. P
' U" ]; x3 ?( y% ^( R8、必应蜘蛛ip都是美国的,也有出现200 0 64状态码,谷歌蜘蛛暂时没有发现。$ o5 _ X- _9 M, @, @) S8 {" w
5 h% `& C" E) `+ |今天在论坛又看到一位高手的分析:百度蜘蛛访问页面时在特定时间内无法完成页面全部数据的接受而最后导致访问页面协议返回正常,但在页面返回全部数据的过程中由于服务器或者网络当时的状况导致失败进而出现了200 0 64现象。7 k. I& J. r3 R* d8 m G" O9 ?) G
4 N( Y {' j! e: y2 x, s
另外附上一位独立SEO名博论断:服务器中同时存在IIS和Apache;IIS经常无故重启;服务器CPU使用经常100%。
W, F6 k0 e8 G( |) @6 X1 ]- {1 q/ P+ T
再次总结:当网络请求不可到达的情况下就有可能出现200 0 64状态码,不论是电信还是网通亦或者是移动,所以国内用户比较好的做法是使用双线主机或者三线主机。如果是客户群在分布在全球,建议使用质量有保障的全网互联云主机。0 {8 Y! S: N" S$ t1 ]% Z
( ]( a% a! D' J; X* V
通过这个例子有感想,做seo的人很多,网络上关于seo的言论也很多,如果没有在事实数据的基础上而做出主观臆断,那是伪seo,不科学的。这样的言论从小的方面来说是害人害己,大的方面来说是拖seo行业发展的后腿!
! h z- f- N6 w$ B7 q% r# r- c: d1 }0 @. z
也许笔者的案例分析也只是个案,不代表众数观点,但是倡导的是大家都来做科学的seo,用数据与事实来说话!
1 j, j1 E H0 i" v% Q# }0 x ?$ H6 J9 {* q8 }9 o5 K
|