|
|
这里说的404错误不是网站内部产生的404,而是由于外链中存在指向本站的错误URL从而到了蜘蛛爬取错误,生成了404相应代码。我们要采取的就是将这些404页面301转向正常可访问的页面,使权重可以得到正常的传递。
5 d: k, X8 ~+ ?- |7 h2 ?4 {
+ l. b7 X) Q: b5 R5 \) Y在我们创作高质量内容时,总会遇到采集或者转载却不留版权信息的情况。更可恶的是,有些采集或转载的网站,为了防止自身网站的权重外流,在正常URL中随机假如了一些字母和数字,导致蜘蛛在网站中顺着链接进行爬取时,生成了404相应。/ E9 Q, R. ]8 C: L. H$ d
W, p3 D: Z+ h
这个404错误,就是由“链接到您网站网页的域”中URL的错误导致的。再查看了Webmaster Tool中一系列404提示后,我们可以确定这个URL不是由于书写错误导致,而是由对方站点故意生成干扰字母或数字造成的。
2 R: R, ?1 F8 x$ ~" o
! c4 t1 N' B0 A- ]* h/ e遇到这样的状况,我们可以采取的措施有:
# ^; B, F1 d# T i: y1 r; `9 G; j7 i) o. H \
1,像百度和谷歌举报(效果不好,同时有损RP)" b" f/ a1 a% D" {' Q% p" q% C/ s0 F% B
2,装作没看见,什么事情都没有发生(心情会受影响)
1 O5 l x. G/ ]8 i( L& h# C U* A1 B3,合理运用技术,拿回属于自己的东西(也是本文撰写的内容)
n, N. y' L- K5 j
8 i4 W8 K9 e1 l* n) i这里我们需要用到的就是301重定向了。做SEO的人都知道,301是永久重定向的意思,同时可以将旧URL中的权重传递给新的URL。, Y' D1 j: _' K6 p+ | ]( D
" `7 a% d5 z8 O4 N1 q' r7 _- U8 c这里,我们可以将出现404错误的页面看作旧URL,而将网站上存在的页面看作新URL。拿上图中的URL为例,就是:) B, v9 K2 B C$ p& q. v
. N* G8 P- g7 | ~8 X将恶意指向不存在页面的URL(产生了404错误):
: `% }. @. u7 J; }5 q$ \" w
* p9 Z" V% j X) X# R* {http://www.seoyangs .com/rich-snippets.htmlGFQ6 K3 a2 b+ j3 W" k/ j, z
0 q4 C. ~2 B9 z( W6 z3 e
通过301的方式,指向网站上原本存在的URL:2 F1 Q/ ?6 i& a! x
$ Q( f' s- ~' u5 f( r! ahttp://www.seoyangs .com/rich-snippets.html
% M: m; \& Y+ f! D# h) U
% d( Z; d j. Q- u3 K这样,蜘蛛在访问对方网站错误的URL(上例中后缀GFQ的URL)后,会被重定向到正确的URL页面。从而达到帮助我们回复权重传递的作用。; N; F3 |! U1 x( t& U
1 ~2 M+ u! S- y7 S% R0 Y
这里我们以采用Apache服务器的网站为例,通过mod_rewrite来做URL的重写与转向。$ q O A5 Z8 k1 }$ I; e/ x7 K
- q. c5 w3 p) x) b0 D! X4 U
1,首先我们查看网站根目录下是否存在.htaccess文件,如果做过伪静态,那么这个文件已经存在(也不排除通过httpd.conf实现伪静态,那么则需要新建一个.htaccess)。在文件中写入以下代码:8 L7 Y" H \5 X- S- C7 y* J
/ Y6 n1 D3 h$ a1 e3 V# I
RewriteEngine on
5 J5 j6 o% r9 n q' m/ q6 @7 URewriteBase /* G: S2 }% O4 J4 a1 s
# l' ^# l. I7 e. m; W
如果你的博客或网站采用的是一级目录的形式,则需要注意RewriteBase的路径。大家可以在网上查找相关教程。这里不再多述。
6 l( Q6 k+ D( x& u" G9 J
; H+ \4 v$ r1 o9 M! ]% B. a9 `5 C2,如果网站中的来自外部的404错误不多,只有个别几个,那么可以通过使用以下字符来实现(以上文中的错误为例):" [3 c1 e" }, M* d
RewriteRule ^rich-snippets.htmlGFQ$ rich-snippets.html [R=301,L]
+ A, n7 y% t. U. x f! g# q. j0 [9 B- N% P# S0 o% Q
3,但往往这些404错误都是大批量出现的,且还会新增。那么我们就要观察404错误的规律,然后通过通配的方式来实现重定向。' P2 @% s/ ^+ d
) P ^1 U' l/ T1 j9 [+ p还是以本文URL为例,我们看到图中错误产生404页面的URL一般都为加入了3位数字和字母的后缀:6 m% D/ [& a4 ?5 B
5 j: L; \* i8 T- O3 f4 c
防范于未然,我们将所有.html后的所有有可能出现的字符的URL,都跳转到.html以前的URL,使用的代码是:
) `# k, m2 i4 A0 d0 I
3 Y- u* x/ L I7 E9 ?; t# ?, d9 NRewriteRule ^([\w-]+)\.html.+$ $1.html [R=301,L]( B6 y$ Q) i) V3 d
& M$ h+ g6 p: r3 W3 [+ h
需要注意的是,我个人博客文章页面的URL是以 http://www.best-ideas.cn/404-to-links.htm 形式出现的。原因可以参考我之前的一篇文章《WordPresss SEO-新博客网站的优化》。但其他很多博主或者网站,在文章页上面还有一个或多个目录层级。那么就可以用, r; q; [( N/ U; f w' b
9 ], N( x- d. V' Z, [4 k& R
RewriteRule ^你的目录名称/([\w-]+)\.html.+$ $1.html [R=301,L]8 p$ K1 K4 e% b. n
; E( I+ C/ F2 R; \这样的方式进行重定向。9 V _% n9 l: M; a, p
+ a" E6 q! N9 z: C# _8 _1 _现在我们尝试访问之前报404错误的URL链接:http://www.yinshua188.com/rich-snippets.htmlGFQ# O* Z8 d; h5 |$ Q% N
9 R$ s& B) o0 j( d
即可正常访问正确的URL,同时应该属于我们的权重也通过链接的传递到达了我们的页面。# c9 L$ z. X# y& ?; u& l
% `" {, [& G8 `5 R3 S( G" k
本文主要介绍的是一种SEO的思路,实施办法还需要根据网站的特殊情况具体对待。 |
|