找回密码
 加入怎通
查看: 1195|回复: 3

[站长八卦] 百度搜索引擎(蜘蛛)如何抓取我们的页面

[复制链接]
twelgwei 发表于 2012-06-29 16:08:08 | 显示全部楼层 |阅读模式
  搜索引擎优化(seo)是让搜索引擎更好的收录我们网页的一系列过程,良好的优化措施有利于搜索引擎蜘蛛对我们的网站进行抓取。什么是优化?优化的目的就是“取其精华去其糟粕”,就是是网页的内容放方便百度蜘蛛的抓取,百度搜索引擎(蜘蛛)是如何来抓取我们的页面呢?笔者在百度搜索自己在admin5站长网发布的一篇文章,拿出来和大家分享。
4 a' \& ?& W5 e+ m1 X! o7 X
8 m! g7 {$ k1 I+ a8 ]2 B6 {* i6 u
  图一
  页面标题
+ ^* }' e6 `1 _4 p% o, F  如图一所示,百度搜索引擎最先抓取的是页面标题的title标签部分,网站的title标签对网站的优化工作至关重要。笔者前一个星期对网站的title标签进行修改,仅仅是删除两个字,百度搜索引擎一个星期才放出来,并且这期间并未对快照进行更行,一直停留在原有时间!
6 [0 C# L$ [( X- L  描述标签
8 A8 S$ _" u' M) C4 E0 k  如图一所示,搜索引擎并不一定展示的是描述标签(admin5中的信息摘要),百度指数在抓取页面标题之后,会优先抓取网页内容中最先显示的内容,而不是网页正文的第一段(如图二所示-标题一下部分-在admin5中,这个可是锚文本链接,百度既然抓取,肯定也抓取这个锚文本链接),然后在抓取网页的手段描述部分,网站的描述部分通常部超过200字符。通常网站描述部分显示的也不全是网站的第一段内容,而是显示搜索引擎认为与用户搜索最相关的内容。如图三所示。图二中抓取的部分在图三中没有抓取
2 i: m1 ]; e& u9 I. |  / W- h8 x' x6 Z! ]$ }) f

  y0 h. j& d, T$ j4 c
  图二
  
1 \& \9 F9 U3 t% T* u! b; ~. Z+ v, R4 w4 s& r  }
  图三
  如果把图一、图二和图三结合起来看,我们可以清晰的看出,百度蜘蛛究竟抓取了网页的哪些部分,title标签,标题,与用户搜索关键词相关的部分内容,并且相关的内容以飘红的形式展现出来。让用户区分,这究竟是不是自己需要的信息!所以了解百度蜘蛛的搜索对降低网站的跳出率,增加用户粘度还是有一些帮助的。7 L% l5 E1 U% k( ^4 c
8 V: J% K( X- q
转载出处:http://www.sh-zhuji.com
3 f9 s0 }% u% v7 G
回复

使用道具 举报

20120506 发表于 2026-01-22 10:20:46 | 显示全部楼层
内容很干货,没有多余的废话,值得反复看
回复 支持 反对

使用道具 举报

沫沫 发表于 2026-02-27 09:26:17 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

网缘残冰 发表于 2026-03-13 16:10:41 | 显示全部楼层
分析得很透彻,很多细节都说到点子上了~
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 19:52 , Processed in 0.088968 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表