|
|
百度蜘蛛,英文名是“Baiduspider”是百度搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在百度搜索引擎搜索到您网站的网页、图片、视频等内容。Baiduspider是一套人自己编制的程序,百度蜘蛛的爬行有一定的规律可寻,以下来看看百度蜘蛛到底是如何爬行的呢?​
" Q+ E6 e# C% p2 P: c5 F
) I. r. A2 _* c) w7 \2 }$ {一、爆发式爬行( o7 n! `7 o3 a6 M; C
1 r2 y, h" q9 l; E6 \8 _. B' h不知百度蜘蛛是不是喜欢高效率的爬行,有时百度蜘蛛能在一两分钟内爬行几百次。因为蜘蛛机器人,它爬行一段时间过后,蜘蛛机器人再去运算程序,看是否是原来收录过的,是否是原创什么的,是否应该收录等等。毕竟这样的爬行不会经常出现,只是偶有现身。
4 M7 t H# a9 W' T4 F
) x- K% B: ]& a6 Q" `* @% ?- P二、稳定式爬行
9 }/ |* H, U! ^! e* y
, y2 J6 {# w+ H5 s& q- K* N稳定式爬行,指的是每天24小时,每一个小时的爬行量相差不大。稳定式爬行往往是对新站才会出现,对于百度认为你站是成熟期的,如果出现了这种爬行方式,你可一定要小心了,这种爬行方式,你的站多半会被降权。第二天就能看出来,首页的快照日期,一定不会给你更新的。就好比一个人做任何事情时的,没有了激情,也就没有了爆发力,当然不会卖力干事的,不卖力干事,你说效果会有多好。
# }& M2 g$ I M* U$ C
5 D6 p8 G% }0 ~5 f" z三、确认式爬行/ D+ }6 d- S$ h2 T
; W$ Y) G: e, d) N! }4 E% \% M/ s 什么是确认式爬行呢?就是指你网站更新一个内容过后,百度第一次爬行过后,一定不会给你放出收录来,百度蜘蛛还要进行第二次爬行再运算、比较计算的,如果认为你这个更新内容有必要收录,百度蜘蛛会进行第三次爬行,正常情况下百度蜘蛛不会进行第四次爬行。第三次确认过后,百度蜘蛛就会慢慢的给你放出收录。2 ?5 ~% K0 Y' n! `, N. ^5 H* H
( k5 F) I- b: E! M; k 这种确认式爬行方式,就有点类似与谷歌的爬行方式。百度蜘蛛机器人爬行首页的方式还是同原来一样,一天不知要爬行多少次首页,其它页面,如果百度认为有必要进行计算的话,就会进行第二次确认爬行。
0 K) A" I% D9 o1 q/ ]6 }以上说了这么多,大家可能有疑问了,百度蜘蛛来没有,我怎么知道,这个很简单你可以去查看服务器的记录日志。你如果查看不了记录日志的话,看一下网站后台有没有记录蜘蛛爬行记录的。做百度优化的朋友都知道,百度相对Google而言是比较难做的,但“世上无难事,只怕有心人。”只要用心去做,相信成功近在咫尺。下一篇我会介绍服务器日志分析!!! |
|