|
|
这里说的404错误不是网站内部产生的404,而是由于外链中存在指向本站的错误URL从而到了蜘蛛爬取错误,生成了404相应代码。我们要采取的就是将这些404页面301转向正常可访问的页面,使权重可以得到正常的传递。
3 B7 N$ Q* `( Z+ Y3 z0 t
+ P0 @) [9 V9 A: K在我们创作高质量内容时,总会遇到采集或者转载却不留版权信息的情况。更可恶的是,有些采集或转载的网站,为了防止自身网站的权重外流,在正常URL中随机假如了一些字母和数字,导致蜘蛛在网站中顺着链接进行爬取时,生成了404相应。% D& c2 b7 x ~& E% h' A# L% P
4 H4 U* t5 m, a2 P: c6 Z9 n这个404错误,就是由“链接到您网站网页的域”中URL的错误导致的。再查看了Webmaster Tool中一系列404提示后,我们可以确定这个URL不是由于书写错误导致,而是由对方站点故意生成干扰字母或数字造成的。
. n3 E. B! s/ Q- }% D3 K+ v7 D7 w9 ?
, h+ _6 g! D1 L* z: P% q遇到这样的状况,我们可以采取的措施有:
+ G. c' a* \/ f* ]- f6 j, P- W, W* E I/ L" y
1,像百度和谷歌举报(效果不好,同时有损RP)' R. l G! D, N8 k+ ` _
2,装作没看见,什么事情都没有发生(心情会受影响)
& @. P& z7 [# y# Z3,合理运用技术,拿回属于自己的东西(也是本文撰写的内容), m$ ~, V" ^4 D( L& a& q
( n O/ o+ [) C8 `5 ^+ S这里我们需要用到的就是301重定向了。做SEO的人都知道,301是永久重定向的意思,同时可以将旧URL中的权重传递给新的URL。
9 K3 s$ O. ~1 L+ K; `$ y& a1 ~( v# s
这里,我们可以将出现404错误的页面看作旧URL,而将网站上存在的页面看作新URL。拿上图中的URL为例,就是:
5 ~& ?3 T5 k! P& x2 Y
& V5 `1 [# _+ x将恶意指向不存在页面的URL(产生了404错误):
$ H1 A- r- ?( A, u |% o; g6 N8 T1 G8 f7 ]
8 w! F2 t- P9 z; y0 r ~- W2 r7 Z _http://www.seoyangs .com/rich-snippets.htmlGFQ: F3 F3 P1 Y4 u* W3 h% k
( i% X5 u% d/ r' j
通过301的方式,指向网站上原本存在的URL:% l# D) l! |& C" s, Z' _ J" E
2 D. z. h& ~$ `9 P
http://www.seoyangs .com/rich-snippets.html' }( i1 S a/ W8 ^
7 R7 D! j* i8 [) ^
这样,蜘蛛在访问对方网站错误的URL(上例中后缀GFQ的URL)后,会被重定向到正确的URL页面。从而达到帮助我们回复权重传递的作用。, x7 X. b9 ?4 B0 D
0 ~% b! [/ x( M ]' V这里我们以采用Apache服务器的网站为例,通过mod_rewrite来做URL的重写与转向。
0 s& `6 Y& E, b
$ ^3 n6 w Z( z& t1,首先我们查看网站根目录下是否存在.htaccess文件,如果做过伪静态,那么这个文件已经存在(也不排除通过httpd.conf实现伪静态,那么则需要新建一个.htaccess)。在文件中写入以下代码:8 i! D$ {" j i$ f) X" O' V$ ~
/ p7 E8 t6 d$ A& ?
RewriteEngine on
A0 }5 Y9 m* `; ORewriteBase /7 ?' m; f3 [4 U/ F# s$ f
r1 R4 ~$ _, l% d8 M5 n. h如果你的博客或网站采用的是一级目录的形式,则需要注意RewriteBase的路径。大家可以在网上查找相关教程。这里不再多述。, L% { z- o0 M9 r2 u' [
4 ^/ K( ~9 ?- g& J
2,如果网站中的来自外部的404错误不多,只有个别几个,那么可以通过使用以下字符来实现(以上文中的错误为例):
/ c1 l4 f/ _9 R- o0 c$ ]( T& ?RewriteRule ^rich-snippets.htmlGFQ$ rich-snippets.html [R=301,L]0 A8 @& R+ v. A
8 Y7 `! L8 f5 Y1 {5 K( R4 l3,但往往这些404错误都是大批量出现的,且还会新增。那么我们就要观察404错误的规律,然后通过通配的方式来实现重定向。
. e! T6 r9 k0 V
( d6 Z7 Y, ~+ S4 O5 o7 G) ^9 D" `还是以本文URL为例,我们看到图中错误产生404页面的URL一般都为加入了3位数字和字母的后缀:7 x8 h M7 }0 _# N
$ s0 j `9 H! M防范于未然,我们将所有.html后的所有有可能出现的字符的URL,都跳转到.html以前的URL,使用的代码是:, U. o8 p, {( o0 Q8 I4 d6 e$ z9 {
! ^# T. }5 c7 ^RewriteRule ^([\w-]+)\.html.+$ $1.html [R=301,L]
1 {+ u' }/ i4 ]" a& I7 [# }
8 a; Z) b6 e8 _, X' K) F需要注意的是,我个人博客文章页面的URL是以 http://www.best-ideas.cn/404-to-links.htm 形式出现的。原因可以参考我之前的一篇文章《WordPresss SEO-新博客网站的优化》。但其他很多博主或者网站,在文章页上面还有一个或多个目录层级。那么就可以用
3 ^- E+ \( y2 J7 `, z2 r' X, E ?6 d
RewriteRule ^你的目录名称/([\w-]+)\.html.+$ $1.html [R=301,L]
% j& Q; v, r% _7 r8 G2 d5 s; ?) {% Z2 Q0 y1 R U4 }
这样的方式进行重定向。- n8 P& ]1 y l( y6 `0 T
( v# Z8 R& c" S# @) _现在我们尝试访问之前报404错误的URL链接:http://www.yinshua188.com/rich-snippets.htmlGFQ
- i: @7 } { |1 w+ }) r+ s3 ]% Z& D+ F
即可正常访问正确的URL,同时应该属于我们的权重也通过链接的传递到达了我们的页面。0 b' N9 S; l" J
& l# W, R, r% I1 R. N3 G2 V- [本文主要介绍的是一种SEO的思路,实施办法还需要根据网站的特殊情况具体对待。 |
|