找回密码
 加入怎通
查看: 341|回复: 1

[其他] 百度蜘蛛抓取网页的一些分析

[复制链接]
混沌 发表于 2013-11-04 14:46:04 | 显示全部楼层 |阅读模式
"第一,要想排名靠前,目标关键词应该完整匹配地出现在页面中。比如说,你想让你的网站在用户搜索”电脑学习”时出现在前面,那么在你的网页上,”电脑学习”这四个字应该完整连续的出现,而不能”电脑”出现在第一段,”学习”出现在第二段。; D& x% [2 r3 r! \
3 g. z, L/ d- E; z0 J0 {' i5 ^* Y8 ~
- f3 t1 _% r) ~6 a5 l' i

) z/ l" E5 d2 G; r- F, r
6 J1 @; L8 G' t+ Y, M
      第二,我注意了一下蜘蛛似乎更注重页面内的因素。与Google更加重视内部,有点爬虫类的味道,越黑越深,它越是喜欢往里钻,--不相信你做100个页面,做得再漂亮,只要链接没有层次,哈哈,不好意思,你最多就孤零零的被收录可怜的一点点东西。我前两个站开通不到一个月,也很少有外部链接。但因为本身的结构是比较有层次,一些竞争不太激烈的关键词在百度的排名还不错。2 I  p( R' p+ G& x
8 e! M, |3 q. `# C
8 m, c4 v* b9 C, q. l7 U

7 x/ k7 D$ A2 ^
+ E/ X, |$ F# ]
      第三:百度蜘蛛极为活跃,经常看看你的服务器日志,你就怀发现百度蜘蛛抓取的频率和数量都非常大。百度蜘蛛几乎每天都会访问我的论坛,并且至少抓取几十个网页。我的论坛只开通了不到一个月,网页数目还没有完善,但是百度蜘蛛的活动已经相当可观了。大量捕获是百度的强项,其他任何搜索引擎都没办法相比。但是百度中文网页数目并不是最大的,百度蜘蛛抓取的频率和网页更新情况有关。
0 T" p$ C" W4 ]' W' p9 |! j8 x% r5 b) }4 F0 T* \

0 ]  J( t" O, L$ L1 @- @& V3 f6 D7 ]3 @/ v2 i

) P& l7 [7 ]0 K      第四:充分利用百度的一个最大的优势--大家可能觉得它的优势对我们来说就是难事了嘛:呵呵,的确是可以利用的,百度收录速度可以用海量来形容,正因为速度快,就给我们留下了可以利用的空间!
& {9 a7 T1 X. _4 U  b
* v# J6 P5 j3 N- o

) k* Z! [& Z9 k" ?6 N
+ J/ c2 Y! u8 |, m

/ Z2 J+ o/ i( X3 S      第五:百度并不被所谓的优化迷惑!!GG对优化好象www.ljbylc357.com远远没有百度敏感,百度尤其反感所谓的优化,不知道是用什么方法识别----我的看法是目前最”先进“ 的优化方法,好象对百度没什么大的作用,大家都这么干了,机器人是有点死脑筋,但是百度那些IT也不是吃白饭的哈,要知道他是全球最先进的中文搜索老大,,GG在中文搜索这快--哈哈,不用说了吧:)
! f5 v4 O- b& f8 A1 Y+ m# `$ A0 q: u! t4 y

5 [1 M4 p4 L( t" I/ U; h6 o0 f      第六:百度排名算法是以网页为基础,比较少关注整个网站的主题。联系到上一点,这说明百度排名算法中比较注重内部结构缺少完整的语义分析。所以一些目前比较认同的关于site:之间那几个所谓关系到搜索质量的东西,并不是百度蜘蛛所最敏感的。"
8 |, b5 U) T+ Q. ?! R; Z7 b* b, i* Q3 o* @" `* [
  E- ~. r) t- }8 R$ i$ p
回复

使用道具 举报

谁的世界 发表于 2026-03-17 07:58:54 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-1 08:34 , Processed in 0.044912 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表