蜘蛛链接跟踪，网站的深度优化和广度优化

无聊的星期天 发表于 2012-09-05 11:26:16

蜘蛛链接跟踪，网站的深度优化和广度优化
　　为了抓取网上尽量多的页面，搜索引擎蜘蛛会跟踪页面上的链接，从一个页面爬到下一个页面，就好像蜘蛛在蜘蛛网上爬行那样，这也就是搜索引擎蜘蛛这个名称的由来。
　　整个互联网是由相互链接的网站及页面组成的。从理论上说，蜘蛛从任何一个页面出发，顺着链接都可以爬行到网上的所有页面。当然，由于网站及页面链接结构异常复杂，蜘蛛需要采取一定的爬行策略才能遍历网上所有页面。
　　最简单的爬行遍历策略分为两种，一种是深度优先，另一种广度优先。香格里拉旅游 www.czuuw.com
　　所谓深度优先，指的是蜘蛛沿着发现的链接一直向前爬行，直到前面再也没有其他链接，然后返回到第一个页面，沿着另一个链接再一直往前爬行。
　　蜘蛛跟踪链接，从A页面爬行到Al，A2，A3，A4，到A4页面后，己经没有其他链接可以跟踪就返回A页面，顺着页面上的另一个链接，爬行到B1，B2,B3，B4。在深度优先策略中，蜘蛛一直爬到无法再向前，才返回爬另一条线。
　　广度优先是指蜘蛛在一个页面上发现多个链接时，不是顺着一个链接一直向前，而是把页面上所有第一层链接都爬一遍，然后再沿着第二层页面上发现的链接爬向第三层页面。香格里拉旅游 www.czuuw.com比如，我的一个站点，，大家可以去看下，研究下。
　　还有就是蜘蛛从A页面顺着链接爬行到Al，B1，C1页面，直到A页面上的所有链接都爬行完，然后再从A1页面发现的下一层链接，爬行到A2 ，A3，A4，从理论上说，无论是深度优先还抒度优先，只要给蜘蛛足够的时间，都能爬完整个互联网。在实际工作中，蜘蛛的带宽资源，时间都不是无限的。也不可能爬完所有页面。实际上最大的搜索引擎也只是爬行和收录了互联网的一小部分。

山核桃5元 发表于 2026-01-18 14:30:13

完全赞同，我也是这么认为的，英雄所见略同～

wanglong69 发表于 2026-06-11 14:54:53

蹲了这么久，终于看到有价值的讨论，支持一下！

页: [1]

真牛社区's Archiver

蜘蛛链接跟踪，网站的深度优化和广度优化