找回密码
 加入怎通
查看: 621|回复: 2

[其他] 让你的网页更新速度来的更快一些吧!

[复制链接]
商摆小路 发表于 2012-07-17 10:18:12 | 显示全部楼层 |阅读模式
  搜索引擎要对一个网页进行排名的基本条件是这个网页被搜索引擎收录了,那么一个网页要被收录的前提条件是什么呢?根据我们做SEO的常理可以得出该网页必须被搜索引擎蜘蛛抓取至少一次,在经过审核之后便会放出来(直接搜索网页URL有结果),当然互联网是动态更新的,网站的收录可能随时都在变化着,一些旧的页面和信息可能被搜索引擎过滤掉,这里就有一个问题了,它是如何确定网页更新的呢!  抓取策略介绍:聚类抽样
8 ]2 e6 a7 f3 r, i! [$ f! t  网页具有一些属性,这些属性可以预测更新周期(抓取更新周期),具有相似属性的网页,周期也是类似的。
1 r8 X7 h2 q& P6 g7 l+ `4 f; V  反应一个网页更新周期的属性特征可以简单地分为两个大类别,即动态和静态。
6 [' O/ P; m4 L; v* c2 y* ?  静态的特征:网页内容变化,图片变化,页面大小变化,链接深度等等。在进行SEO优化的时候可以适当的考虑更新以前的旧信息来获得新的抓取周期,当然也非常多的技巧,如:http标头里面的last modified信息。具体可以查阅google网站质量指南当中相关条条款款,这里就不叙述过多了。
9 K: s% N2 ^0 s& m# _1 a6 j& q  动态的特征:入站链接变化和其他变化。这也算是一个常理吧,一个网页获得的入站链接变化,抓取也同样会随之而变化,长期观察日志就能发现写一点,在一段时间内给网站导入一批站外链接,抓取可以提升起来。
4 U  u2 G" p# Z5 c/ ~  搜索引擎爬虫通过上面两个特征可以对网页进行聚类,计算出相应的更新频率,从而确定抓取。" I( Y" q8 j' m( k
回复

使用道具 举报

﹃錯愛 发表于 2012-07-17 10:53:23 | 显示全部楼层
很不错。感谢楼主的分享  
回复 支持 反对

使用道具 举报

tj666 发表于 2026-01-26 10:15:52 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-25 01:06 , Processed in 0.273032 second(s), 50 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表