关于404的来历,这是由HTTP请求(类似在IE地址栏打上地址,回车,显示信息,这就是一个HTTP请求,但不止这一种,还有POST,机器人等行为)服务器,而服务器在给定的地址找不到任何资源的情况下返回来的状态代码,它的英文名称叫:SC_NOT_FOUND。
* j3 a6 ]3 l' w6 S
( c, b4 }3 G7 x 这里抓几个默认的404页面:
1 ^ I, W; j8 y5 ~6 x' [
: \1 Z" R8 h6 n' O* X, H 一般每个WEB服务器都会有一个默认的404页面,目的是要告诉浏览者其所请求的页面不存在或链接错误。这些默认页面很丑陋,可能还是一堆普通网友看不懂的代码(如上两图)。显然,站在SEO,用户体验上看,这并不能引导用户使用网站的其他页面,代替的是毫不留情的关掉我们的页面并一走了之。
1 y5 X: E6 f' j: L9 ~6 c0 A5 s$ U* k
404页面对SEO的影响
$ O- F, y$ W1 L2 \! @6 V1 e. O, f; ^
自定义404错误页面是增强用户体验的很好的做法,但在应用过程中往往并未注意到对搜索引擎的影响,譬如:错误的服务器端配置导致返回 “200”状态码或自定义404错误页面使用Meta Refresh导致返回“302”状态码。正确设置的自定义404错误页面,不仅应当能够正确地显示,同时,应该返回“404”错误代码,而不是 “200”或“302”。虽然对访问的用户而言,HTTP状态码究竟是“404”还是“200”来说并没有什么区别,但对搜索引擎这则是相当重要的。
9 }+ N; W2 I' Q+ h+ Y/ D/ c# B _/ _+ R6 l4 P
搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除,当然,删除过程有可能需要很长时间;而当搜索引擎得到“200”状态码时,则会认为该url是有效的,便会去索引,并会将其收录到索引数据库,这样的结果便是这两个不同的url具有完全相同的内容:自定义404错误页面的内容,这会导致出现复制网页问题。轻则被搜索引擎降权,重则会K 掉网站。
: u6 p5 Y" d. f" l
& \* F, ]8 c( w6 h2 M) h 可见404页面对SEO的影响不容忽视,一不小心则有散命的危险。那么接着注重的话题就是:如何制作一个有利于用户体验,有利于SEO,能留住用户的404页面;还有就是在服务器上如何设置。 |