|
|
这里说的404错误不是网站内部产生的404,而是由于外链中存在指向本站的错误URL从而到了蜘蛛爬取错误,生成了404相应代码。我们要采取的就是将这些404页面301转向正常可访问的页面,使权重可以得到正常的传递。
* T+ [5 F4 H% s; p% @! L' q/ N: x. d: N
在我们创作高质量内容时,总会遇到采集或者转载却不留版权信息的情况。更可恶的是,有些采集或转载的网站,为了防止自身网站的权重外流,在正常URL中随机假如了一些字母和数字,导致蜘蛛在网站中顺着链接进行爬取时,生成了404相应。* f+ o& s& J( [. C! P9 j& S6 x
$ a- J3 S% N+ z1 h9 L4 @& y3 y g
这个404错误,就是由“链接到您网站网页的域”中URL的错误导致的。再查看了Webmaster Tool中一系列404提示后,我们可以确定这个URL不是由于书写错误导致,而是由对方站点故意生成干扰字母或数字造成的。( J8 i& m6 {' f4 ^* o: {/ b
; b6 p2 g9 u1 p0 @: F0 F1 s遇到这样的状况,我们可以采取的措施有:% i; L% H3 E: Z( X8 q1 Y( Y$ S
* i* D3 ~/ M/ [8 A @! p: s$ i1,像百度和谷歌举报(效果不好,同时有损RP)
4 j8 A& i6 C( c. R1 I' s2,装作没看见,什么事情都没有发生(心情会受影响)( Q4 f+ q) Y3 h$ R
3,合理运用技术,拿回属于自己的东西(也是本文撰写的内容)3 [: e- ?) |' A+ t5 j7 H
$ @2 d3 L- r: k; a这里我们需要用到的就是301重定向了。做SEO的人都知道,301是永久重定向的意思,同时可以将旧URL中的权重传递给新的URL。1 ?4 }7 ~) S& g3 U$ V& s/ N
2 X, o0 p7 P. a4 Y4 \0 F/ \% g( D7 T
这里,我们可以将出现404错误的页面看作旧URL,而将网站上存在的页面看作新URL。拿上图中的URL为例,就是:
4 e$ o1 L- x+ j3 x0 v1 N7 H
/ u9 n: {) r6 Y* M7 e+ H- b7 v将恶意指向不存在页面的URL(产生了404错误):
; c; g" D: B' X$ G+ ]" w9 `
( R* r# o. O5 K' Ehttp://www.seoyangs .com/rich-snippets.htmlGFQ
5 O2 X+ d) P( ~9 Z R
Y! A' z& ?8 t: M# Y3 [* t8 C通过301的方式,指向网站上原本存在的URL:
/ s; r. q" d$ u- u( t A* t/ J' `9 P1 b8 V
http://www.seoyangs .com/rich-snippets.html
8 \1 h+ o/ g+ h8 {6 i+ a1 [. g0 @. W
这样,蜘蛛在访问对方网站错误的URL(上例中后缀GFQ的URL)后,会被重定向到正确的URL页面。从而达到帮助我们回复权重传递的作用。
, ^* B( p6 A% T/ s$ W8 r: T' N% d( k2 k0 Y' f
这里我们以采用Apache服务器的网站为例,通过mod_rewrite来做URL的重写与转向。
1 ^. C! E) n' e- c( w0 [- A( ]1 l/ J k
1,首先我们查看网站根目录下是否存在.htaccess文件,如果做过伪静态,那么这个文件已经存在(也不排除通过httpd.conf实现伪静态,那么则需要新建一个.htaccess)。在文件中写入以下代码:4 U8 h! R2 y% e
% Q* V1 w$ a3 m3 u0 tRewriteEngine on
/ }! d: q: _5 q+ z5 \/ XRewriteBase /
$ n* C: r4 t9 W& N+ [4 n S. z" Z( B! [& H: h+ U. c+ Z
如果你的博客或网站采用的是一级目录的形式,则需要注意RewriteBase的路径。大家可以在网上查找相关教程。这里不再多述。% _1 |. U, O8 g4 i- F* M, P! W
# z7 p0 D+ q0 o7 k- A. j" A, \2,如果网站中的来自外部的404错误不多,只有个别几个,那么可以通过使用以下字符来实现(以上文中的错误为例):
$ P- X4 T. H- g5 P DRewriteRule ^rich-snippets.htmlGFQ$ rich-snippets.html [R=301,L]
0 x. v% C# m- j. W6 _+ ~
2 v9 U1 n7 |+ q8 y- j3,但往往这些404错误都是大批量出现的,且还会新增。那么我们就要观察404错误的规律,然后通过通配的方式来实现重定向。) a R; @9 M: m) c- B6 r; {
$ C5 S( n4 M6 i+ K, N还是以本文URL为例,我们看到图中错误产生404页面的URL一般都为加入了3位数字和字母的后缀:6 m, e/ o' y; n( c6 q% v- Z
8 B5 c) V' d3 |5 j; i: t: `; O
防范于未然,我们将所有.html后的所有有可能出现的字符的URL,都跳转到.html以前的URL,使用的代码是:
l7 _; b& M* k8 q' f: g% j b t
RewriteRule ^([\w-]+)\.html.+$ $1.html [R=301,L]
( ~' S" }# y, J& G6 E" Y
5 Y$ }9 I: B( |" a2 R+ E' e, N需要注意的是,我个人博客文章页面的URL是以 http://www.best-ideas.cn/404-to-links.htm 形式出现的。原因可以参考我之前的一篇文章《WordPresss SEO-新博客网站的优化》。但其他很多博主或者网站,在文章页上面还有一个或多个目录层级。那么就可以用1 X! M' T e- Z' J7 M3 k
; ]* r5 C' ?5 O6 r0 J, _RewriteRule ^你的目录名称/([\w-]+)\.html.+$ $1.html [R=301,L]1 t3 Q1 [9 m6 d$ w# f
0 d/ l' [' R: i- I. S
这样的方式进行重定向。2 b- C2 {4 S2 x" l* Z& v& U6 P+ m
$ F6 F! \; [0 G- ^: A/ `# B, m现在我们尝试访问之前报404错误的URL链接:http://www.yinshua188.com/rich-snippets.htmlGFQ
0 l; f7 w3 t* A0 X, m+ A2 M2 L o$ Q3 q% Q) c4 c' p0 v
即可正常访问正确的URL,同时应该属于我们的权重也通过链接的传递到达了我们的页面。% s; r* V3 r+ m. [' O! @
# m1 V0 n; V1 p7 X
本文主要介绍的是一种SEO的思路,实施办法还需要根据网站的特殊情况具体对待。 |
|