找回密码
 加入怎通
查看: 1294|回复: 3

[关于百度] 百度蜘蛛爬行规律详解

[复制链接]
TONY 发表于 2012-03-27 20:41:07 | 显示全部楼层 |阅读模式
百度蜘蛛,英文名是“Baiduspider”是百度搜索引擎的一个自动程序。它的作用是访问互联网上的网页、图片、视频等内容,建立索引数据库,使用户能在百度搜索引擎搜索到您网站的网页、图片、视频等内容。Baiduspider是一套人自己编制的程序,百度蜘蛛的爬行有一定的规律可寻,以下来看看百度蜘蛛到底是如何爬行的呢?​2 p0 Y% X0 F3 a" e

6 J7 r, Z+ q, T, S$ o/ w一、爆发式爬行
% l/ l* E" v+ k! ?  4 O" R$ e  Z) F; Q
不知百度蜘蛛是不是喜欢高效率的爬行,有时百度蜘蛛能在一两分钟内爬行几百次。因为蜘蛛机器人,它爬行一段时间过后,蜘蛛机器人再去运算程序,看是否是原来收录过的,是否是原创什么的,是否应该收录等等。毕竟这样的爬行不会经常出现,只是偶有现身。
) C4 a% C0 I1 P. E( B; N6 |% k! c, E% {& U. q% b
二、稳定式爬行! r' L! z0 U* |9 M' {- n
  
" m* `! K- K8 V0 y& @" x! G8 d稳定式爬行,指的是每天24小时,每一个小时的爬行量相差不大。稳定式爬行往往是对新站才会出现,对于百度认为你站是成熟期的,如果出现了这种爬行方式,你可一定要小心了,这种爬行方式,你的站多半会被降权。第二天就能看出来,首页的快照日期,一定不会给你更新的。就好比一个人做任何事情时的,没有了激情,也就没有了爆发力,当然不会卖力干事的,不卖力干事,你说效果会有多好。+ q# }% ?, y' [! N3 T# f9 ~# Z
8 N( w6 B4 k# X0 D0 ~
三、确认式爬行5 g7 @6 U$ L3 M5 [! ~
  
/ X  H+ W; [( |& U0 e: o  什么是确认式爬行呢?就是指你网站更新一个内容过后,百度第一次爬行过后,一定不会给你放出收录来,百度蜘蛛还要进行第二次爬行再运算、比较计算的,如果认为你这个更新内容有必要收录,百度蜘蛛会进行第三次爬行,正常情况下百度蜘蛛不会进行第四次爬行。第三次确认过后,百度蜘蛛就会慢慢的给你放出收录。
) |+ `$ m. O' |3 B6 i  P  
2 W: f- @3 L2 m: w  这种确认式爬行方式,就有点类似与谷歌的爬行方式。百度蜘蛛机器人爬行首页的方式还是同原来一样,一天不知要爬行多少次首页,其它页面,如果百度认为有必要进行计算的话,就会进行第二次确认爬行。 
" @; n- |7 x5 W# `6 e$ i) q以上说了这么多,大家可能有疑问了,百度蜘蛛来没有,我怎么知道,这个很简单你可以去查看服务器的记录日志。你如果查看不了记录日志的话,看一下网站后台有没有记录蜘蛛爬行记录的。做百度优化的朋友都知道,百度相对Google而言是比较难做的,但“世上无难事,只怕有心人。”只要用心去做,相信成功近在咫尺。下一篇我会介绍服务器日志分析!!!
回复

使用道具 举报

a9allp 发表于 2026-03-13 13:36:20 | 显示全部楼层
分析得很透彻,很多细节都说到点子上了~
回复 支持 反对

使用道具 举报

杨强 发表于 2026-04-28 01:23:29 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

mym0210 发表于 2026-06-02 01:05:11 | 显示全部楼层
楼主太厉害了,整理得这么详细,必须支持
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-6-12 13:17 , Processed in 0.080475 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表