找回密码
 加入怎通
查看: 1214|回复: 6

[站长八卦] 百度搜索引擎(蜘蛛)如何抓取我们的页面

[复制链接]
twelgwei 发表于 2012-06-29 16:08:08 | 显示全部楼层 |阅读模式
  搜索引擎优化(seo)是让搜索引擎更好的收录我们网页的一系列过程,良好的优化措施有利于搜索引擎蜘蛛对我们的网站进行抓取。什么是优化?优化的目的就是“取其精华去其糟粕”,就是是网页的内容放方便百度蜘蛛的抓取,百度搜索引擎(蜘蛛)是如何来抓取我们的页面呢?笔者在百度搜索自己在admin5站长网发布的一篇文章,拿出来和大家分享。, @' M9 L  F1 Z1 W; z& x) \6 m; r

) d" X* L% h$ F
  图一
  页面标题) e6 x( {. o, ]. Z0 T% X% a( b
  如图一所示,百度搜索引擎最先抓取的是页面标题的title标签部分,网站的title标签对网站的优化工作至关重要。笔者前一个星期对网站的title标签进行修改,仅仅是删除两个字,百度搜索引擎一个星期才放出来,并且这期间并未对快照进行更行,一直停留在原有时间!
8 _4 k: D9 R, x  描述标签# M+ J. S" f1 J, t+ g
  如图一所示,搜索引擎并不一定展示的是描述标签(admin5中的信息摘要),百度指数在抓取页面标题之后,会优先抓取网页内容中最先显示的内容,而不是网页正文的第一段(如图二所示-标题一下部分-在admin5中,这个可是锚文本链接,百度既然抓取,肯定也抓取这个锚文本链接),然后在抓取网页的手段描述部分,网站的描述部分通常部超过200字符。通常网站描述部分显示的也不全是网站的第一段内容,而是显示搜索引擎认为与用户搜索最相关的内容。如图三所示。图二中抓取的部分在图三中没有抓取+ R8 z- b( D  @" V& |
  
0 F0 q& Z/ k  X! Q% v
: o) k$ C8 j  J/ v$ \% P0 e7 s
  图二
  2 x1 \# ?- L: i8 f$ X- Q$ S; g; ~- c
) K6 J2 [- i7 D+ g
  图三
  如果把图一、图二和图三结合起来看,我们可以清晰的看出,百度蜘蛛究竟抓取了网页的哪些部分,title标签,标题,与用户搜索关键词相关的部分内容,并且相关的内容以飘红的形式展现出来。让用户区分,这究竟是不是自己需要的信息!所以了解百度蜘蛛的搜索对降低网站的跳出率,增加用户粘度还是有一些帮助的。& p( R8 U0 F1 _4 h6 i
  V" {3 s2 _- G& W3 V
转载出处:http://www.sh-zhuji.com
% E3 a1 X# Q0 g7 p
回复

使用道具 举报

20120506 发表于 2026-01-22 10:20:46 | 显示全部楼层
内容很干货,没有多余的废话,值得反复看
回复 支持 反对

使用道具 举报

沫沫 发表于 2026-02-27 09:26:17 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

网缘残冰 发表于 2026-03-13 16:10:41 | 显示全部楼层
分析得很透彻,很多细节都说到点子上了~
回复 支持 反对

使用道具 举报

q475364102 发表于 2026-03-15 16:16:59 | 显示全部楼层
楼主太厉害了,整理得这么详细,必须支持
回复 支持 反对

使用道具 举报

我是学霸小渣渣 发表于 2026-03-26 00:29:50 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

zx3968 发表于 2026-04-19 08:19:05 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 01:21 , Processed in 0.049765 second(s), 26 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表