做为一个seoer来说每天观察日志文件是一个必须的过程,今天我也就想对于搜索引擎蜘蛛的爬行来说说自己的一点自己的理解.6 p( x* O6 b0 l" r0 r
7 Z; w3 N; a l- z; ~ 看日志都看什么?这个大家都知道要看http的状态码,分析里面返回的200,304,404等等通过这些来看看服务器是不是不稳定,看看屏蔽一些页面等等.
# w: ~2 t1 f# Q* k3 O8 y, j: @6 N+ t- Z
) _9 K8 Q' ?. Y 再者就是看看蜘蛛爬行的频率。看看蜘蛛爬为什么总是在这个时间爬取这个页面而是是频繁的爬取?为什么会爬取这个页面?1 I3 B e3 K* A# W. {. I$ t
! a+ S% J) x' Z1 ] [ f 对比分析一下我们会发现
3 i+ A, Y$ q- o9 v2 u8 ~- m' I# ?4 N( `- ~4 f5 k% Q+ z+ J
1. 一般凡是蜘蛛爬取的目录页面,他的搜索引擎的相关收录就会相对还得好一些。2 R R& D" u$ m6 T$ Z) ^# U# ~
1 F- r, j+ D0 J$ D8 ^
2.在这个目录中的长尾词的排名也相对的好一些。8 d: H+ E+ c5 {& l& e4 ^
9 E# A1 b% g( k5 T, v
那么根据这个我们为什么不投“蛛”所好呢?不是有句话吗:爱它就给它(我也不知道出处)。- G& n: n- }( T) S( S" A5 J8 p
5 I- |: h( ~2 Y7 C- T 问题又来了,要投其所好也要知道蜘蛛为什么会喜欢这个页面?为什么要频繁的爬取它,到底是什么吸引了它。所以我们就要对这个页面进行分析:% |( h8 c: m8 K& l& V( |
3 z/ \$ \2 @2 w: a! m3 y 分析一下蜘蛛到底喜欢什么样的东西7 T' \ C8 {2 }7 b+ _5 b3 A t
9 [* m0 L1 U! `8 k! Z1 W9 m 1. 更新速度快的页面。“软文啊”提示这个页面的内容更新的频率很快,每次蜘蛛爬取的时候它总是有新的内容,就好像去报亭买报纸,每天去一个报亭买报纸,相同的时间相同的地点,相同的位置,不同的内容更新的报纸。你可以付钱拿起来就走不用!我想这样谁都喜欢。5 `3 H f3 |3 a: Y; N+ V9 K: v
# T/ R7 ^. S/ G 2. 网页的内容丰富。同样是报纸的例子,每次去买相同的报纸,但是你慢慢的发现报纸的内容就是那么窄窄的一个方面,想看国内新闻他只有地方的,想看国际的新闻他还是只有地方的。慢慢的我想你也会考虑换一家。但是如果内容丰富想看什么内容都有即使旁边的地方报纸包装的在好你也会选这个内容丰富的.4 ? n2 o' {. X& `) {
8 x; c* S* X' I
3. 内容的重复性低。这个就很好理解了,谁喜欢天天看一样的东西。一期的报纸每个版面都重复的在说一个事情会让人很烦的。 |