|
|
这里说的404错误不是网站内部产生的404,而是由于外链中存在指向本站的错误URL从而到了蜘蛛爬取错误,生成了404相应代码。我们要采取的就是将这些404页面301转向正常可访问的页面,使权重可以得到正常的传递。" L1 ?) l- G: T4 O; @- F6 w
) `6 t- h P# \, |6 G' M在我们创作高质量内容时,总会遇到采集或者转载却不留版权信息的情况。更可恶的是,有些采集或转载的网站,为了防止自身网站的权重外流,在正常URL中随机假如了一些字母和数字,导致蜘蛛在网站中顺着链接进行爬取时,生成了404相应。
9 W5 f' u$ S) `! E: K
$ l ^# r5 `, o8 N2 R这个404错误,就是由“链接到您网站网页的域”中URL的错误导致的。再查看了Webmaster Tool中一系列404提示后,我们可以确定这个URL不是由于书写错误导致,而是由对方站点故意生成干扰字母或数字造成的。
, ]0 `& j# T0 S& } }0 I
3 {/ u7 A# W8 Z9 X遇到这样的状况,我们可以采取的措施有: o, G0 A3 G- C, ]# Y$ r. n$ y4 b3 w, i- c
( R* J4 @3 R" P z& p4 p( K
1,像百度和谷歌举报(效果不好,同时有损RP)8 A( ` A" \- C9 J* J
2,装作没看见,什么事情都没有发生(心情会受影响)
0 }1 G) R6 g$ |( K* F! N3,合理运用技术,拿回属于自己的东西(也是本文撰写的内容)
+ a9 H, ~( w. i; e3 G& v C3 U
7 m }2 a* s6 s这里我们需要用到的就是301重定向了。做SEO的人都知道,301是永久重定向的意思,同时可以将旧URL中的权重传递给新的URL。
% g4 K+ A7 C1 Q5 R, I2 a5 R5 a' {& l
这里,我们可以将出现404错误的页面看作旧URL,而将网站上存在的页面看作新URL。拿上图中的URL为例,就是:; x+ P# z2 J4 H2 B- e: ?# Q9 u
! h2 U# g2 Y# R: @3 Z# Z将恶意指向不存在页面的URL(产生了404错误):
, c# Q. A/ Q' s* b
% M9 j) ?0 Z3 z0 Qhttp://www.seoyangs .com/rich-snippets.htmlGFQ, o. q' a$ \: u9 A) R
# L" }; M, S, V% b- o
通过301的方式,指向网站上原本存在的URL:/ X4 o9 F3 V; s7 f! T
5 M& Y/ d0 F& ~+ u* khttp://www.seoyangs .com/rich-snippets.html! ~# U/ Y; N; _: `
6 |9 v! c' T$ n这样,蜘蛛在访问对方网站错误的URL(上例中后缀GFQ的URL)后,会被重定向到正确的URL页面。从而达到帮助我们回复权重传递的作用。. ]7 W, g5 z w; s* o' h- k
( i( l# J T; ?9 V4 c
这里我们以采用Apache服务器的网站为例,通过mod_rewrite来做URL的重写与转向。# a9 {, o5 h& N$ Y* A
; h7 W2 p$ e% B/ x. i5 w$ v1 w
1,首先我们查看网站根目录下是否存在.htaccess文件,如果做过伪静态,那么这个文件已经存在(也不排除通过httpd.conf实现伪静态,那么则需要新建一个.htaccess)。在文件中写入以下代码:- ]! V4 ]& T2 s& y* Y* Y
& u2 D* @' E BRewriteEngine on. `4 F) _0 S( R/ ]2 g2 T3 |( B( E0 L
RewriteBase /* F! M# U; d4 k) e
4 E6 |( S+ {6 v' [+ o" | j) y如果你的博客或网站采用的是一级目录的形式,则需要注意RewriteBase的路径。大家可以在网上查找相关教程。这里不再多述。
" q) m9 m5 B7 H; e4 a% K& {- n6 Z6 a8 \0 u
8 n4 M( J. t( D* V0 v2 z' }: }2,如果网站中的来自外部的404错误不多,只有个别几个,那么可以通过使用以下字符来实现(以上文中的错误为例):
& _% c- c7 y5 K5 NRewriteRule ^rich-snippets.htmlGFQ$ rich-snippets.html [R=301,L]
1 Q3 K- _! @2 }* F% L# ~9 ^
2 B* R- |+ G0 Q% a" ?3,但往往这些404错误都是大批量出现的,且还会新增。那么我们就要观察404错误的规律,然后通过通配的方式来实现重定向。' S x5 O" C% G7 @1 i8 \" I
* J1 N) \/ d3 _' ^9 T! @" u还是以本文URL为例,我们看到图中错误产生404页面的URL一般都为加入了3位数字和字母的后缀:
1 S5 ~- a4 _- X' d1 U: `3 [
9 |7 M/ u$ J, k' J防范于未然,我们将所有.html后的所有有可能出现的字符的URL,都跳转到.html以前的URL,使用的代码是:
3 [8 e* C" M' e/ q' B* A
' q. K2 Y/ t2 F- k( V. K3 T7 L5 U/ XRewriteRule ^([\w-]+)\.html.+$ $1.html [R=301,L]
7 W# x' N' J1 W- Q4 c
0 S- e5 C' N; T: h需要注意的是,我个人博客文章页面的URL是以 http://www.best-ideas.cn/404-to-links.htm 形式出现的。原因可以参考我之前的一篇文章《WordPresss SEO-新博客网站的优化》。但其他很多博主或者网站,在文章页上面还有一个或多个目录层级。那么就可以用* r2 B; b M' ]$ d' k& R3 G3 j m
5 U6 A- N, y2 W8 E9 Y5 r2 `# n2 HRewriteRule ^你的目录名称/([\w-]+)\.html.+$ $1.html [R=301,L]
& `, ~5 w" L6 J+ r, T
" w" Y$ i9 w6 `2 f" @: j6 ? h* {9 Z这样的方式进行重定向。
5 Z2 z6 U/ K! B% o) v2 F# q, C! ^8 u+ O) n) y1 r4 I5 ?
现在我们尝试访问之前报404错误的URL链接:http://www.yinshua188.com/rich-snippets.htmlGFQ
1 B" @: _- w* N# N; K! w9 k5 ^
: O! m# b. x U/ r! P6 Y% t8 m即可正常访问正确的URL,同时应该属于我们的权重也通过链接的传递到达了我们的页面。
) i4 `$ J* A6 V
: ]+ d) E+ L( G本文主要介绍的是一种SEO的思路,实施办法还需要根据网站的特殊情况具体对待。 |
|