2 ?+ p: ], A U9 O& c2 B+ U 蜘蛛程序不太喜欢爬行太过于臃肿的网页,为了保持自身的高效率运行,蜘蛛程序花同样的时间可能会爬取更多精简的网页,每个蜘蛛程序都有自己的限制程序,太大的网页可能会导致不能完全爬行,甚至根本不去爬行这些网页。 ' }: a$ u+ \5 o2 k/ t
. f' K) o/ m4 m4 e7 w g0 [1 d
当然,目前使用<table></table>布局的已经很少,一般情况下,导致网页体积变大的原因都是由于js代码太多引起的,要解决这样的问题,应该把js代码从网页转移到一个外部js文件,这样蜘蛛程序将不会去爬行它,而且网页界面不受任何影响,从而达到精简网页的目的。 ) V& k3 @0 F' s. M6 J9 ]: P2 `/ l! K& o ; K M3 O$ v3 e. l2 T8 b% U( C* v
二、验证 html 的正确性 / R. z1 ] N3 y4 @ 1 R# c' C8 S# ] N$ G 当用户在浏览我们网页的时候,可能很少看见错误信息,这样看起来网页的 html 好像没有什么问题,但目前的浏览器,特别是ie浏览器,其设计的思想高质量的显示网页,尽量不让用户发现网页上的问题,因此,浏览器是可能容忍 html 编码错误的。但是,作为进行seo优化的网页,面对的不仅仅是用户,还有蜘蛛程序,蜘蛛程序不想浏览器那样,任何错误的编码都可能会向蜘蛛程序提供错误的信息。 9 a8 V$ P7 e3 e& a a - W5 K: x1 Y, {. u7 H; C
由于目前很多个人站长都采用 cms 程序来建站,在编辑模板文件和购买模板的时候,一定要注意起 html 代码的正确性,大多错误都发生在标签的写法上,比如最近一个客户的网页统计代码未封口,在网站上线前或者注意到问题的时候,可以用检测工具检查下网页代码是否正确,避免这些小失误有助于蜘蛛程序更好的读取数据网页数据。 " \) R! m" @" c1 u* i0 \
) l' H& x. w6 D9 }+ S2 k 三、flash 中避免包含重要链接信息 1 I" P! s+ i$ u* D. D" O. o) B 3 Q! M- w+ o; M% S) t flash 网站的确比常规的 html 更吸引用户眼球,其用户体验自然也好的多,但是搜素引擎并不能想用户一样去浏览 flash ,无法确定 flash 里面包含的内容,而存在与 flash 里面的重要链接信息(比如导航)也自然不会被蜘蛛程序捕捉到(谷歌貌似能读懂 flash )。这里也并不是说网页中就一定不能使用 flash ,因为 flash 对提升用户体验的效果我们是肯定,那么,我们只要尽量保证 flash 中内容不会包含重要的链接信息。 " m: o/ ~( W& u8 `7 T3 W4 ~7 V ) X& L6 f& O$ Y( V; D, |$ u 四、避免使用 frames 框架 / c6 i; x( o1 ]0 o& h$ X 8 d0 L. J% @; X; d7 `$ s
由于蜘蛛程序会话费很多时间来解读基于 frames 框架的网页,使得目前搜索引擎开始考虑放弃蜘蛛程序对 frames 内容的爬行,这在百度seo指南中有明确说明,对于使用 frames 的网页,可以借助<noframes>标签将<frames>框架中的重要内容提取出来,这样有助于蜘蛛程序了解框架结构中的重要内容。