找回密码
 加入怎通
查看: 736|回复: 5

[站长八卦] 通过Robots.txt学会与蜘蛛交谈的策略

[复制链接]
104团队 发表于 2012-06-09 19:34:36 | 显示全部楼层 |阅读模式
一、为什么Robots.txt?# A. L2 Y) N' Z
在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。
# ~0 s! z0 z1 O, e5 E9 ]: q) @- n  K# e# D! N* D- D1 j+ ?
二、一些常见的问题和知识点0 ?# b9 j5 G1 S3 L; z# Z
1、蜘蛛在发现一个网站的时候,第一步是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);) j3 n' q; m8 n0 i
2、建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;
4 ?" L( v6 L/ f& p7 D9 E; f+ U# J9 ~8 L& d- Y0 b
三、在robots.txt文件中设置网站地图; n( S' P/ o6 [7 Y6 H
你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。你可以像这样来添加:+ m& z4 a- a& E/ H' U8 c" b
Sitemap:http://www.seowhy.com/map.xml(支持链接形式:xml、html,一般建议使用xml形式)2 {0 y9 [" s$ X5 z! o

9 G- ]3 B( W2 _8 b& M1 b8 k四、Robots.txt的顺序' m9 t* ], R( g* L
在蜘蛛协议中,Disallow 与 Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。
# p. v% M! I3 m% ^* q" I引擎蜘蛛程序会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:( {9 ?, b7 S7 m! X* p

- A3 D$ s; F' |- w% e8 gwww.gouwozi.com
回复

使用道具 举报

bhccn 发表于 2025-11-08 17:45:19 | 显示全部楼层
这个思路很新颖,打开了新世界的大门,谢谢分享
回复 支持 反对

使用道具 举报

梦想 发表于 2025-11-10 20:48:33 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

额。小P孩! 发表于 2025-11-10 20:48:46 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

客服晓渔 发表于 2026-03-14 01:17:55 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

可爱小米 发表于 2026-05-04 10:38:54 | 显示全部楼层
分析得很透彻,很多细节都说到点子上了~
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-6-12 00:35 , Processed in 0.050625 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表