找回密码
 加入怎通
查看: 318|回复: 1

[站长八卦] 百度蜘蛛抓取文章标准

[复制链接]
独特之蕞 发表于 2012-09-17 14:47:39 | 显示全部楼层 |阅读模式
     网站收录良好与否跟蜘蛛爬行频繁次数、抓取页面有关是众所周知的,但是对于蜘蛛抓取了哪些页面我们不知道,那么我们只能依靠蜘蛛爬行过的访问日志进行分析了。如果爬行量大的话,那么就可以简单的得出网站很合蜘蛛的胃口,如果蜘蛛几天都不来的话,那么就要检查一下,是不是网站没有蜘蛛喜欢的“食物”了,下面就说说影响抓取的有关要点:
/ K; ~9 s, z/ ^   一、是否导入链接过少。: x2 A' P0 B  S
     相对导出链接,那么导入链接就是越多越好了。导入链接要遵从两个原则:广泛度与质量。先有质才有量,所以,咱们建设导入链接的时候,要先注重导入链接的质,然后再追求量。如果你颠倒过来的话,那么不但不能让网站对搜索引挚友好,而且还会让网站在搜索引挚眼里减分。因为你追求量的时候,通常都会把质忘了,造成了拥有过多的垃圾链、无效链接。& h* `  |2 s3 w0 o/ X
    二、是否有网站地图。
; A. @' V8 r0 w# `  网站地图对于蜘蛛来说就是一幅爬行路线图,当蜘蛛拥有了这张路线图的时候,那么在网站上爬行就不会那么的吃力,而且也不会有随时会转到头晕的感觉。网站地图是专门给蜘蛛用的,目的就武汉白癜风http://www.hbbdf.cn是减少蜘蛛爬行时间,加快蜘蛛爬行速度,毕竟,如果你的网站不配地图的话,就像自己去一个陌生的地方,没有地图,就要靠盲目的找了,这要花的时间多了多少,笔者不知道。9 R1 j# i9 y) R  j) _
  三、是否导出链接过多。$ G8 e5 W5 t2 a' J7 ?
  一个网站过多的导出链接,对于网站的权重集中有很大的影响,对于蜘蛛的逗留时间有很大的催促作用,因为当蜘蛛爬行你的网站的时候,一般都是由头爬到尾的,那么蜘蛛爬行有时候是按广度爬行法,有时按深度排行法,当它按广度排行法的时候,刚好爬到尾部而还没进入内页,你就给他来一条导出链接,那么蜘蛛也会按照其导出链接出去的,这样就是你经常看到的蜘蛛来了,但是没收录任何页面的原因了。
5 J4 Q. E3 D5 i  k* G: X0 B  四、是否设置404页面
1 m; G4 k& c/ S. s  F1 R  很多的网站对于这个根本不在意,其实按笔者的实战心得来说,这个对于一个存在死链的网站有着很重要的意义,因为他可以帮网站告诉蜘蛛,当它爬到死角的时候,给他一条出来返生之道,404页面就是为了避免蜘蛛走进死胡同出不来而准备的,谁敢保证自己的网站不会有死链的出现,死链对于一个网站的影响是很重要的,如果网站的死链过多,而又缺少404页面,那么用站长工具查询分析的时候,你会发现,很多的页面都抓取错误,这一方面说明,网站对蜘蛛的友好度不够,让蜘蛛产生排斥的心理。
; x% f6 v( |: L3 s* @
* _3 ]/ l- e0 K
回复

使用道具 举报

巧克力baby 发表于 2026-03-16 09:09:57 | 显示全部楼层
蹲了这么久,终于看到有价值的讨论,支持一下!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-15 07:36 , Processed in 0.063726 second(s), 23 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表