seo优化之——搜索引擎抓取
8 L) {& S$ T6 e% `6 C
: {7 j1 x ^7 X0 V; T, ?6 J; t如果搜索引擎蜘蛛或者用户无法访问网站,那么一切SEO都是无意义的。因此在开始对网站诊断前,我们要确保用户和搜索引擎蜘蛛都能正确的对网站进行访问。3 C3 V; W/ V$ c! b3 x6 ]3 e/ W
. `/ g+ [ g b h& mRobots.txt
- S2 r1 `1 t( j2 {8 D" D百度官方对Robots.txt的名词解释:搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
2 i$ S2 h4 C* y( t. t大部分的搜索引擎都是遵循Robots.txt文件的,因此,要确保网站没有禁止主流或者目标搜索引擎的话,建议手动查看网站根目录下的robots.txt 文件, 确认不包含不应该有的禁止命令.' H5 B1 o9 f% g2 a* i. i; I
7 ]5 S0 F: c' H6 DHTTP状态码* o) l1 @# I9 K9 ^2 e7 B! e; J# z
如果网站返回4XX或者5XX的HTTP状态码时,用户和搜索引擎都无法访问网站,因此在使用工具爬行网站页面信息时,应该注意查看各页面返回的状态码,找出并修正错误的URL,返回404或者把页面重定向到与之相关的页面。. h8 s: |2 n0 ?& z$ X
+ y" v: p( }* k l
XML版网站地图) k) T* u# d1 e2 `
XML版本的网站地图能帮助搜索引擎快速的找到网站绝大部分页面信息,有利于提高网站在搜索引擎上的整体收录。7 {0 n3 ^& y) H
在查看XML版网站地图的时候应该注意以下几点:
! W" m3 E- G" j" ]* ca, 网站地图是否格式正确,是否遵守了sitemap协议。# G4 E7 `/ I6 N! Z
b, 是否有提交网站地图到谷歌/必应管理员工具。2 F9 @% N8 O+ c
c, 网站地图里面的链接内容是否为最新版(实时更新)
0 w, z0 z. y* f7 ed, 网站地图的链接与抓取工具抓出来的链接数据是否匹配,是否仍有页面在网站中但是缺乏至少一个内链的支持。
0 Q3 T a, C4 F7 l0 I7 g( {+ [! N! X; H6 @0 n" F- x
网站架构3 G/ m! U5 ?1 M' T( k( G1 {
良好的网站架构有利于搜索引擎蜘蛛快速的抓取重点页面及其他页面内容。因此在评估网站结构的时候,应该注意分析用户需要通过几次点击才能从首页到达重要页面。同时也要注意各页面之间的层级联系,优先确保重点页面处于较浅的层级以及获得较多的内部支持。理想状态下,扁平树状的网站结构有利于网站横向与纵向的拓展。. E& F: Z- d" i0 k+ o* D
. J2 }; U5 C$ T8 ^' \
使用Flash或JS的导航
: Y' w& S* B% c/ F2 N5 R良好的网站架构在一定程度上可能被使用了flash或JS技术的导航破坏。虽然搜索引擎的技术在不断的提升,把重要的内容或者链接放置在flash或者JS里,仍然是不明智的选择。6 N' E2 y/ C* g; c" I, r" W
如何评估是否使用JS技术?非常简单的两步,开启和关闭JS功能(使用chrome或者火狐就可以直接完成)。通过对比网站在以上两种状态下的链接情况,可以清晰的看出哪些重点链接使用了JS技术。
* ]3 j7 \0 Q4 s" I5 q
" t$ q' |* M) [- U7 z* K0 A网页加载速度: U1 K1 ~6 G3 h* J
用户的耐心是有限的,如果打开一个网页需要一分钟甚至更长的时间,用户极有可能在打开过程中离开网站,从而造成网站用户的流失。同样,搜索引擎分配给一个网站的资源以及其在网站停留的时间也是有限的,网页加载速度越快越能充分利用搜索引擎资源。
/ S ~, ]+ Q# Q3 D4 J+ m- [) _0 i6 l4 U0 U7 I
本文由电脑主题下载 www.wm300.com推荐,转载请注明来源于出处。 |