找回密码
 加入怎通
查看: 630|回复: 2

[SEM行业] 百度蜘蛛爬行解析

[复制链接]
【优化】马佑涛 发表于 2012-08-01 14:01:43 | 显示全部楼层 |阅读模式
  首先,介绍一下百度收录。网站中包含了许许多多的网页,在网络上“有贡献”的,就会被百度收录,收录的是它的网络地址,被百度收录了,假如收录的威望很多,那你有可能出现在百度搜索的头条,而头条永远是备受关注,正因为这个位置谁都想争,随之便产生了SEO(搜索引擎优化)。
$ O+ h3 F2 W( d9 S- l8 \% u
: i& f# u' B. _4 P" M# x) m- |  蜘蛛爬行“就用到这个东东。再跟大家说一下“蜘蛛”,当然不是我们日常所见的蜘蛛,简单来说它是一个计算机程序,爬行的过程就是实现算法的过程(至于说法,不能简单地理解为日常的算术过程,它的意义相当于一个活动的策划流程),最近好像百度更改了搜索算法,但具体怎么改还是让大家慢慢去了解吧。& H0 F5 ?- M9 Z' d# _  J
/ C9 `/ C# o. W- a8 d: q
  一般情况下网页抓取抓到40%是正常范围,60%算很好,100%是不可能的,当然抓取的越多越好。我在学习了解的过程中,偶遇了一篇介绍蜘蛛爬行的安全性的文章,里面介绍到了蜘蛛一般会优先选择遍历那些网站,会自动躲开那些网络漏洞,免得自己陷进去,这个挺吸引我的,弱弱记得这篇文章里介绍说:优先遍历静态网站,因为动态网站里可能存在死循环,这样蜘蛛进去就出不来了,不过一般蜘蛛搜索的过程会先检测网站的安全性,发现这些毁灭性的动作,就会避开。我想这点值得大家考虑一下在建立动态网站的过程中,一定要严谨自己的程序代码,免得造成网站漏洞,
$ k6 {0 ^0 }8 }% J6 Z
7 [( y* K; S7 V7 U2 `( x
回复

使用道具 举报

镜花缘 发表于 2026-03-16 11:15:57 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

csyp2017 发表于 2026-05-15 11:17:41 | 显示全部楼层
楼主太厉害了,整理得这么详细,必须支持
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-15 11:22 , Processed in 1.157674 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表