找回密码
 加入怎通
查看: 340|回复: 1

[其他] 百度蜘蛛抓取网页的一些分析

[复制链接]
混沌 发表于 2013-11-04 14:46:04 | 显示全部楼层 |阅读模式
"第一,要想排名靠前,目标关键词应该完整匹配地出现在页面中。比如说,你想让你的网站在用户搜索”电脑学习”时出现在前面,那么在你的网页上,”电脑学习”这四个字应该完整连续的出现,而不能”电脑”出现在第一段,”学习”出现在第二段。! e) s) I( d7 k) P! Z9 x
3 D' B$ X$ B/ X) q. a
* p, G* x1 U/ q6 I, N4 \. n
; ~# p4 \7 x4 v3 o; @& Z! i

6 K5 u: A3 l; y! G5 S6 `5 a      第二,我注意了一下蜘蛛似乎更注重页面内的因素。与Google更加重视内部,有点爬虫类的味道,越黑越深,它越是喜欢往里钻,--不相信你做100个页面,做得再漂亮,只要链接没有层次,哈哈,不好意思,你最多就孤零零的被收录可怜的一点点东西。我前两个站开通不到一个月,也很少有外部链接。但因为本身的结构是比较有层次,一些竞争不太激烈的关键词在百度的排名还不错。
) x% ^/ ]3 k4 r& w  A0 v( m* D! ?! v
4 z7 a$ g2 t0 Z8 k
; u6 p7 X$ {, |* \& k' Q: K" L

; ^- B0 g* J" X3 ?$ Z  t

7 d5 X. b) C- i- Y5 L# f) y) X1 o      第三:百度蜘蛛极为活跃,经常看看你的服务器日志,你就怀发现百度蜘蛛抓取的频率和数量都非常大。百度蜘蛛几乎每天都会访问我的论坛,并且至少抓取几十个网页。我的论坛只开通了不到一个月,网页数目还没有完善,但是百度蜘蛛的活动已经相当可观了。大量捕获是百度的强项,其他任何搜索引擎都没办法相比。但是百度中文网页数目并不是最大的,百度蜘蛛抓取的频率和网页更新情况有关。
0 h0 e1 ]5 L& U* v3 ?* n: W) J
6 b2 x& j+ P: r; R9 Y' D; ~' S
. [9 y4 t( B; c2 c/ T
( P% ^+ ?. C# q
' k5 J; S2 i! F
      第四:充分利用百度的一个最大的优势--大家可能觉得它的优势对我们来说就是难事了嘛:呵呵,的确是可以利用的,百度收录速度可以用海量来形容,正因为速度快,就给我们留下了可以利用的空间!  c; ~+ }" F  ]. M
: \! h% ?; G5 g/ |) O4 g5 b8 C

2 r2 C, r( `. v4 f+ g) @- k5 I7 X3 p* A' i/ A; G0 B' J

  J- j2 S3 `; l2 f8 k1 }% E      第五:百度并不被所谓的优化迷惑!!GG对优化好象www.ljbylc357.com远远没有百度敏感,百度尤其反感所谓的优化,不知道是用什么方法识别----我的看法是目前最”先进“ 的优化方法,好象对百度没什么大的作用,大家都这么干了,机器人是有点死脑筋,但是百度那些IT也不是吃白饭的哈,要知道他是全球最先进的中文搜索老大,,GG在中文搜索这快--哈哈,不用说了吧:)6 \2 }# o. E* U! b* V/ \

: b+ N0 v9 a( k6 s! m

1 l6 b" a( n* D: o! Z5 B      第六:百度排名算法是以网页为基础,比较少关注整个网站的主题。联系到上一点,这说明百度排名算法中比较注重内部结构缺少完整的语义分析。所以一些目前比较认同的关于site:之间那几个所谓关系到搜索质量的东西,并不是百度蜘蛛所最敏感的。"( @( Y9 @9 V! M+ h

5 {) N4 T1 R& B/ P+ y, j0 a7 j1 M% }  w7 I3 X$ J( S6 ?$ K) K
回复

使用道具 举报

谁的世界 发表于 2026-03-17 07:58:54 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-1 07:53 , Processed in 0.068977 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表