URL在搜索结果列表中是显示内容之一。设计网站结构时需要对目录及文件命名系统做做事先规划。总的原则是首先从用户体验出发,URl应该 清晰友好,方便记忆,然后才考虑URl对排名的影响。具体可以考虑以下几个方面。. p4 P: T g0 N" a- L/ g
5 Q1 R% s4 P; t* v+ Y" ~1. URl越短越好
' I' K! ~, w5 d1 }# b. w H' b/ y, ?% ~! D
这主要是为用户着想。对搜索引擎来说,只要URl不超过1000个字母,收录起来都没问题。不过真的使用几百个字母的URl,用户看起来就费劲了 。曾经有人做过搜索结果点击实验,一个比较短的URl出现在一个比较长的URl下面时,短URl的点击率比长的URl高2.5倍。5 _0 H! H6 t" L
! h$ A; G! ]- a$ j, Y
另外,短URl也利于传播和复制。站长做链接时,通常会直接复制URl。短URl不会有问题,长URl复制事都会费劲,也可能复制的不完整,造成404错误。8 m: I) L r Q- r+ c( N
5 G* r- [" I' Z0 O+ r
2. 避免太多参数) t) E1 [9 q. r# M3 U6 C
[; i8 y B6 {" |% |# b- S Z% n在可能的情况下尽量使用静态URl。如果技术上不能实现,必须使用动态URl,也要 尽量减少参数。一般建议2-3个参数之内。参数太多用户看着眼花缭乱,也可能造成 收录问题。
3 k5 M) {3 Y" V
! ~2 h7 k5 E. w3. 目录 层次尽量少3 Q0 L2 M$ H- s# h9 E
6 \+ i( ^9 s V; |
这里指的是物理目录机构。当然目录层次与网站整个分类结构有关。分类层数越多,目录层次也必然增多。在可能的情况下,尤其是静态化URl时,尽量使用比较少的目录层次。根据观察,百度尤其喜欢目录层次少 的页面。
0 j$ ~9 U! @6 g+ ~, S/ C a4 s* J
- z: X" J0 S3 ^3 u" }当然这不是说建议大家把页面全放在根目录下,那样的话,超过几百页的网站就不容易管理了,不仅搜索引擎无法从目录层次了解归属关系,站长自己恐怕也不容易分清哪个页面属于哪个分类。
$ J* \. C& S' o& Z( M
6 V: S% \7 L; f) g* V% u5 {% I' a3 m5 p! m$ |2 h
4. 文件及目录名具描述性
h4 X r' L3 E; U7 x( ^3 @6 \/ l" g, g" w% @# Q1 B
尤其对英文网站来说,目录及文件名应该具备一定的描述性,使用户在一瞥之下就能知道的这个URl内容大致应该是什么。比如要好的多.0 Y; E8 g9 ]9 i! M" T
, G* ^5 L( {9 ?3 \; z# m5. URl中包含关键词
2 D& @9 [1 p, I1 T
; ?- b3 e; S4 R, p: K关键词出现在URl中,也能提高页面 相关性,在排名时贡献 一点分数。关键词出现的越靠前越好,也就是说出现在域名中最好,其次是出现在目录名中,效果最小的是出现在文件名中。不过切 不可为了 出现关键词而堆积。
; Z& q, v+ J$ p1 t3 J3 Y6 h4 H/ ?* o1 ~$ K+ Z9 U
6.字母全部小写
8 T: s, a# O% e- z. H& R( C, Q' k6 {- X
这有以下几个方面原因。
9 e! b- s- L( D0 I+ d* `( s8 h% V
(1) 全部小写容易人工输入 ,不会因大小写 掺杂而犯错 。
! `/ F4 t3 @' Q" o
' h3 M+ b9 L" M" o/ e" a" u(2) 有的服务器是区分大小写的,如Linux服务器,以上是两个不同的网址。无论站长自己在做链接时还是 用户输入时,因为大小写混用出现错误都会造成 404错误。另外,robots文件代码也是区分大小写的,一个字母之差就可能使整个目录不能被收录。
9 }. O" @; W0 }9 U/ U9 G$ V( b: I8 u4 t& P3 U$ Q0 M' |
本书举URl例子时有时用 大写字母,只是为了强调 ,让 读者看得更清楚。。。1 W2 F, y! m+ y" p! F) T* X% r. x" U( ~
4 ^% @$ L9 m( |6 \
7. 连词符使用! e6 K: m; n+ q8 d4 i) I4 C
3 D( N" h% \) I; Y2 R8 @目录或文件名中单词 间一般建议使用短横线(-)分割,不要使用下画线或者其他更奇怪的字母 。搜索引擎把URl中的短横线当作空格处理,下画线则被忽略。所以文件名seo-tools.html将被正确读取出seo与tools两个单词,而文件名seotools.html就不能被分解出两个单词。
0 i/ d* S# B J/ r( V( ` |