网址规范化问题造成的复制内容,最好的解决方法是,确保一篇文章只对应一个URL,不要出现多个版本,网站所有内部链接统一连到这个URL上。某些时候需要使用到301跳转.! Z) q0 } w1 j7 Z, a. d
0 \: l- O- {8 N6 K$ ^$ a
不是由于网址规范化造成的同站内复制内容,解决的最好方法是选取一个版本允许收录,其他版本禁止搜索引擎抓取或收录。既可以使用robots文件禁止抓取,也可以使用noindex meta robots标签禁止索引。连向不希望收录的复制内容的链接使用NoFollow,JavaScript等阻止蜘蛛爬行。4 J- U- i! Q6 c3 Y3 O6 {
' m% W0 V2 l5 P; v) E- z另一个解决复制内容的方法是使用canonical标签。Canonical标签既可以应用在网址规范化引起的复制内容上,也可以用在其他的情况下。比如网站上有同一款的鞋子可能分为不同的型号,尺寸,型号之间唯一的区别是颜色。这些型号生成多个网址,产品说明也几乎完全一样,只是说明颜色的地方不一样。这时就可以使用canonical标签,用户不会被转向,还是看到不同页面,但搜索引擎会把权重集中到其中一个型号上,从而避免复制内容。
, k2 w0 t3 i2 L$ o2 g6 R' H2 e6 Z6 w, v8 l% @' Z. ~* T$ X# y
带有Session ID的页面也可以使用canonical标签,如页面 http://www.domain.com/page-a.html 放上代码:
6 B. C2 o/ b+ j$ j7 @! F5 V
- e9 m1 A7 X5 O$ G# E& S! q9 L( [这样,后面无论生成什么Session ID:$ a: g7 M/ t- G# N
: a9 f$ R. y2 [5 Y3 o0 S; p
http://www.domain.com/page-a.html?sessionid=123456" u' e: S$ `# d9 M) y/ A
# G8 o3 c. v- _; `. L4 W/ Whttp://www.domain.com/page-a.html?sessionid=254644
! J6 Y& w) O" S& T. T# H: j, z! U m
上面的URL都会被搜索引擎把权重集中到 http://www.domain.com/page-a.html1 L/ a( v! r, {4 P7 @1 S
4 [, i: j7 l3 _: C/ |4 T不同网站之间复制内容解决起来就比较麻烦,因为其他网站上的内容是无法控制的。能够做的只有两点。一是在页面中加入版权声明,要求转载的内容保留版权声明及指向原出处的链接。有些聚合网站会抓住feed自动生成内容,所以在feed中也要加入版权声明和链接。一般来说,原创版本的外部链接会比转载多一些,就算在中文互联网这个对版权都不注重的环境下,也还是会有一些站长转载时保留原出处链接。对搜索引擎来说,指向原创出处的链接是判断原创的最重要的信号。! b) G9 h; B* Z3 n/ Y5 w% _3 ?
6 ]. o; |" y" d- T" g8 R另一点就是坚持原创,假以时日必能增加网站权重,使网站上的内容被判断为原创的机会增加。 |