找回密码
 加入怎通
查看: 451|回复: 1

[站长八卦] 如何解决Google网站管理员工具的抓取错误

[复制链接]
流年尽是伤 发表于 2012-09-01 15:51:28 | 显示全部楼层 |阅读模式
本帖最后由 流年尽是伤 于 2012-9-1 15:52 编辑 , D* y+ [4 \" M1 X4 l+ i; [+ r# E' Y

! o5 q2 P0 {/ L# E1 g. ?“抓取错误”是 Google网站管理员工具(Webmaster Tools)中最受欢迎的工具之一。它可以帮助你检查错误的链接,不仅仅是URL链接,还包行DNS解析失败、服务器链接、robots.txt 文件等问题,几乎所有网站都会出现抓取错误。
6 U6 u- w# B: m5 U5 X/ {网 站站长工具将错误分为两类:网站错误(site errors)和链接地址错误(URL errors)。如果在一个网站上出现多个抓取错误,那么你的网站信任度会下降,甚至会影响到排名,当然这工具对于百度优化同样有效。那么应当如何解决 Google网站管理员工具的抓取错误呢。8 {( _4 |. O' \# ?# r* V5 `
通过Googlebot抓取的错误分类就看知道是什么导致抓取错误的原因了。
1 `, W* P  b( \2 p6 ]一、HTTP的错误& I" ]% m9 U  c# j
当一个网站上的网页(例如,当用户在浏览器中访问您的网页或Googlebot抓取页面时)到您的服务器发出请求,服务器返回HTTP状态码响应请求。( m9 b+ f; b7 H  n. I) H, |
如果出现403状态,可以不用理睬,这表明是你的主机阻止了Googlebot抓取。对于所有HTTP状态码的列表文件,可以参考Google HTTP状态码帮助页面。
3 E3 G3 ^; U' h8 u3 x: E二、Sitemap中的错误" G( Z* t/ ?+ T4 \0 W
Sitemap错误往往会造成404错误页面,或在当前地图返回一个404错误页面,如果出现404错误页面请检查Sitemap中所有的链接,- W& |# C+ o3 G! e  Z5 D7 [
Google会不断抓取你已经删除的Sitemap,这点很郁闷,但也有办法解决:确保旧的Sitemap已经在管理员工具中被删除。如果不想被抓取,确保旧Sitemap出现404或者重新定向到新的Sitemap。
( f3 a! {; S( _  q. v来自Google员工Susan Moskwa解释道:" r* c3 y8 [$ K4 _
阻止Googlebot的爬行,最好的办法是使这些网址(例如旧的sitemaps)出现404,当我们看到一个URL多次出现404后,Googlebot会停止爬行。/ ~; x9 I: J+ l$ q5 y. l
三、重定向错误" F% S5 s  x3 M5 F4 n) B. {
有些错误是因为301从定向引起的,执行重定向后要注意什么:% @2 v* f9 c! l
1:确保他们返回到正确的HTTP状态码。0 R( Y+ o9 U9 |$ z8 u
2:确保没有任何循环重定向。* Q4 ~; w; i* _7 u
3:确保重定向指向有效的网页,而不是404页,或其他错误页,如503(服务器错误)或403(禁止抓取)5 n% U" f8 R- i; r/ e# W% q
4:确保重定向不是指向一个空页面。& r. D1 F4 i' O8 _6 {
四、404错误  V5 x9 Y/ z; f3 h* E* i
404错误可能会出现在以下几个方面:
6 B7 H7 `* Y; o/ Y, ^+ K$ f! h1:删除了网站上的网页;' c+ h/ S5 V) w  ]1 k0 j% T
2:改变了网页的名称;. N( I6 l( a$ h# A1 _% r
4:链接到了一个不存在的页面;
& }0 P' g( P2 p5:其他网站链接到你网站上一个不存在的页面;4 S+ D0 S$ m7 ?# U2 o9 P9 Z
6:网站迁移到一个新的域名不完全匹配的网站。
  [0 F* Q5 ^/ w8 d1 O五、受robots.txt限制6 W/ ?1 {$ P" a4 Y9 o
还有一个原因是robots.txt文件阻止了Googlebot的抓取,如果出现大量抓取错误,第一步应该检查robots.txt
" q$ w2 B; I) ^" J0 \6 N六、软404错误8 G6 i. U. i% C  W& R% F
通 常情况下,当有人请求的页面不存在,服务器将返回一个404(未找到)错误。除了在响应请求的页面不存在返回404代码,服务器也将显示一个404页。 这可能是一个标准的“未找到文件”的消息,或旨在提供更多信息的用户,它可能是一个自定义页面。 页的内容是由服务器返回的HTTP响应完全无关。仅仅因为一个页面显示404文件未找到消息并不意味着它是一个404页。. @. h3 A* x$ N2 V( \* [
本文由  http://www.syzmkm.com/ 整理发表,转载请注明出处# |* L- h$ ~' e' m
: U  P! V9 X% a4 Q6 {* o- L; Z: U
回复

使用道具 举报

卡帝网-释怀 发表于 2026-02-12 08:52:33 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-26 03:21 , Processed in 0.101217 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表