找回密码
 加入怎通
查看: 620|回复: 3

[关于百度] 百度蛛蛛爬过的每个不同的IP代表啥子

[复制链接]
pcbwork01 发表于 2012-08-15 14:19:08 | 显示全部楼层 |阅读模式
本文只贡参照让大家对IIS日志各引擎的蛛蛛IP有个更深的理解.以次来下定论网站到现在为止的状况事情状况.下边我们专说百度蛛蛛爬过的每个不同的IP代表啥子!
) ~% q2 O( ~8 z8 u9 D; A0 u$ x  依据不一样的IP我们可以剖析网站是个怎样的状况.下边就依照我IIS日志上的百度蛛蛛IP为例:' d# Z, w! P* ]
  123.125.68.*这个蛛蛛常常来,别的来的少,表达网站有可能要进入了沙盒了,或被者降权。- N- E3 z/ k! r0 S) K! @
  220.181.68.*每日这个IP 段只增不减很可能进沙盒或K站。; |) a7 o/ F( t/ \0 ~' H* a
  220.181.7.*、123.125.66.* 代表百度蛛蛛IP拜访,准备抓取你物品。
0 n1 J4 ]% _) z+ X% F% @( J  121.14.89.*这个ip段作为度过新站考察期。& X* e+ A. Y, L' C) F5 c# v3 r
  203.208.60.*这个ip段显露出来在新站及站点有不正常现象后。; @, q4 }8 i4 [/ B1 x& f9 E, {* E
  210.72.225.*这个ip段不间断巡查警戒各站。
# g+ W% J7 c% x2 j6 d9 n( j  125.90.88.* 广东茂名居民用电信也归属百度蛛蛛IP 主要导致成分,是新上线站较多,还有运用过站长工具,或SEO综合检验测定导致的。4 ]) J* X% B: Q8 _
  220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,基压根儿说你的网站会天天儿隔夜快照,完全错不成的,我保障。8 ]# _, m) o6 p4 d) o
  220.181.108.92 同上98百分之百抓取首页,有可能还会抓取其它 (不是指内页)220.181段归属权重IP段此段爬过的文章或首页基本24钟头放出来。% e2 O, P6 L0 ?' a: v
  123.125.71.106 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或搜集文章。
" _0 y1 D5 j0 W6 r5 V  220.181.108.91归属综合的,主要抓取首页和内页或其它,归属权重IP 段,爬过的文章或首页基本24钟头放出来。) [9 Z  h# K# B; Z' p9 Z
  220.181.108.75重点抓取更新文章的内页达到90百分之百,8百分之百抓取首页,2百分之百其它。权重IP 段,爬过的文章或首页基本24钟头放出来。
0 ?* w* J, {6 H! y! l9 m& j  220.181.108.86专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。
: d% P# i& t/ A8 y" g7 N. J. X  123.125.71.95 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或搜集文章。# y* Q6 {8 @" v9 f7 l
  123.125.71.97 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或搜集文章。
- v7 ^- s: i6 `. D8 h  220.181.108.89专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。/ V! y& o( }1 o! N, X6 S
  220.181.108.94专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。
2 U! I& J9 a" I. o2 X  220.181.108.97专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。8 u! F8 T8 o1 N' O) Q- C
  220.181.108.80专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。
$ z6 b  n, J% C6 m$ a  |  220.181.108.77 专用抓首页IP 权重段,普通回返代码是304 0 0 代表未更新。5 |# r" H4 P0 f+ Y6 v
  123.125.71.117 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或搜集文章。# w4 j) f3 I% J
  220.181.108.83专用抓取首页IP 权重段,普通回返代码是304 0 0 代表未更新。$ U% x8 ~# {* }2 l  Z" x: \. K  |
  注:以上IP尾数还有众多,但段位同样的123.125.71.*段IP 代表抓取内页收录的权重比较低.有可能因为你搜集文章或拼文章短时间之内被收录但不放出来.(意思也就是说待定)。
( a9 [2 Z' _4 W% K$ Q# P  220.181.108.*段IP主要是抓取首页占80百分之百,内页占30百分之百,这此爬过的文章或首页,完全24钟头内放出来和隔夜快照的,这点我可以保障!9 m# W# T# |/ C2 B# X1 B3 v
  普通成功抓取回返代码都是 200 0 0回返304 0 0代表网站没更新,蛛蛛来过,若是 200 0 64放心这不是K站,有可能是网站是动态的,所以回返就是这个代码。/ L3 d7 N0 t: ]; a$ P
  好了,今日短时间之内就简单大概绍介一点儿吧..你们可以依照以上的IP段来判断自个儿网站如今是个啥子样的了!可谓95百分之百准!
回复

使用道具 举报

fiodada 发表于 2012-08-15 14:20:10 | 显示全部楼层
楼主说的很有道理,学习了
回复 支持 反对

使用道具 举报

苹果-恬恬 发表于 2026-02-23 06:01:34 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

duskydusky 发表于 2026-03-16 10:42:29 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-15 10:04 , Processed in 0.203256 second(s), 50 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表