网址规范化问题造成的复制内容,最好的解决方法是,确保一篇文章只对应一个URL,不要出现多个版本,网站所有内部链接统一连到这个URL上。某些时候需要使用到301跳转.$ i" E% }: {9 M& U7 H
. A* K; H1 J, @ A1 K; Y+ r& w
不是由于网址规范化造成的同站内复制内容,解决的最好方法是选取一个版本允许收录,其他版本禁止搜索引擎抓取或收录。既可以使用robots文件禁止抓取,也可以使用noindex meta robots标签禁止索引。连向不希望收录的复制内容的链接使用NoFollow,JavaScript等阻止蜘蛛爬行。 e; r# e: Z7 }4 T" t$ @; @% ]; \; `
- Q, L4 M" a; ~- j2 z7 v+ l" e/ l
另一个解决复制内容的方法是使用canonical标签。Canonical标签既可以应用在网址规范化引起的复制内容上,也可以用在其他的情况下。比如网站上有同一款的鞋子可能分为不同的型号,尺寸,型号之间唯一的区别是颜色。这些型号生成多个网址,产品说明也几乎完全一样,只是说明颜色的地方不一样。这时就可以使用canonical标签,用户不会被转向,还是看到不同页面,但搜索引擎会把权重集中到其中一个型号上,从而避免复制内容。+ ~7 P% v% h. c# F( j5 D
, P! L7 k0 }# K/ R/ ^ D带有Session ID的页面也可以使用canonical标签,如页面 http://www.domain.com/page-a.html 放上代码:! R$ }1 N+ T+ E/ i W; o& X
$ ~2 v/ W+ ~& e1 O3 @# q6 |) X这样,后面无论生成什么Session ID:
0 {2 k, U6 m) J' ^- R; h$ I3 `
5 r6 j& ]* D/ ^* _http://www.domain.com/page-a.html?sessionid=123456( k( h) f7 }: \8 ]1 q
: { Z/ \& I' q1 Y. b2 O$ M
http://www.domain.com/page-a.html?sessionid=254644
, f8 [/ _/ S; h# [) B2 |3 P1 N% x7 `7 L: i+ I; _
上面的URL都会被搜索引擎把权重集中到 http://www.domain.com/page-a.html
% z% O+ `9 k1 N) p. w% a
( j1 a( ? s0 ^) c) f3 T9 X3 ^不同网站之间复制内容解决起来就比较麻烦,因为其他网站上的内容是无法控制的。能够做的只有两点。一是在页面中加入版权声明,要求转载的内容保留版权声明及指向原出处的链接。有些聚合网站会抓住feed自动生成内容,所以在feed中也要加入版权声明和链接。一般来说,原创版本的外部链接会比转载多一些,就算在中文互联网这个对版权都不注重的环境下,也还是会有一些站长转载时保留原出处链接。对搜索引擎来说,指向原创出处的链接是判断原创的最重要的信号。! J, m* U1 g6 Y1 B
- Y: y' e) Y) ]1 x9 F( g$ R
另一点就是坚持原创,假以时日必能增加网站权重,使网站上的内容被判断为原创的机会增加。 |