一、精简网页 - R4 C& k" ~, u7 H) H. e
; {% x1 X' u8 T9 F7 O* E 蜘蛛程序不太喜欢爬行太过于臃肿的网页,为了保持自身的高效率运行,蜘蛛程序花同样的时间可能会爬取更多精简的网页,每个蜘蛛程序都有自己的限制程序,太大的网页可能会导致不能完全爬行,甚至根本不去爬行这些网页。 + a; X7 k. V q4 }: I; Y
* }, [( P1 |# S+ U# I6 C" s 当然,目前使用<table></table>布局的已经很少,一般情况下,导致网页体积变大的原因都是由于js代码太多引起的,要解决这样的问题,应该把js代码从网页转移到一个外部js文件,这样蜘蛛程序将不会去爬行它,而且网页界面不受任何影响,从而达到精简网页的目的。 + V) H. V% y- K1 \/ f. U2 ?
# x' G0 @' B+ n) X) G 二、验证 html 的正确性 + }, h" C( F4 s: m+ }/ f$ K2 _
" i( o" [/ E0 P' ]
当用户在浏览我们网页的时候,可能很少看见错误信息,这样看起来网页的 html 好像没有什么问题,但目前的浏览器,特别是ie浏览器,其设计的思想高质量的显示网页,尽量不让用户发现网页上的问题,因此,浏览器是可能容忍 html 编码错误的。但是,作为进行seo优化的网页,面对的不仅仅是用户,还有蜘蛛程序,蜘蛛程序不想浏览器那样,任何错误的编码都可能会向蜘蛛程序提供错误的信息。
. R* ^ l* b% k; p, M+ y' _% H
2 ~! F. s- B! m/ e$ S0 J: y 由于目前很多个人站长都采用 cms 程序来建站,在编辑模板文件和购买模板的时候,一定要注意起 html 代码的正确性,大多错误都发生在标签的写法上,比如最近一个客户的网页统计代码未封口,在网站上线前或者注意到问题的时候,可以用检测工具检查下网页代码是否正确,避免这些小失误有助于蜘蛛程序更好的读取数据网页数据。 ) `2 p" j- [# c$ s5 |6 f: F8 k
; A2 F0 a- h/ J
三、flash 中避免包含重要链接信息 5 M2 M! n# l0 i, R5 |2 y
+ P8 B2 O3 h' X- W8 Q* D
flash 网站的确比常规的 html 更吸引用户眼球,其用户体验自然也好的多,但是搜素引擎并不能想用户一样去浏览 flash ,无法确定 flash 里面包含的内容,而存在与 flash 里面的重要链接信息(比如导航)也自然不会被蜘蛛程序捕捉到(谷歌貌似能读懂 flash )。这里也并不是说网页中就一定不能使用 flash ,因为 flash 对提升用户体验的效果我们是肯定,那么,我们只要尽量保证 flash 中内容不会包含重要的链接信息。 . ^' h z! A* W4 Q, l
$ b9 a% H( b' h. e; U" G. x4 E
四、避免使用 frames 框架
9 a( }. W, H u& K
. m: q' c% K/ z! a0 E 由于蜘蛛程序会话费很多时间来解读基于 frames 框架的网页,使得目前搜索引擎开始考虑放弃蜘蛛程序对 frames 内容的爬行,这在百度seo指南中有明确说明,对于使用 frames 的网页,可以借助<noframes>标签将<frames>框架中的重要内容提取出来,这样有助于蜘蛛程序了解框架结构中的重要内容。 |