找回密码
 加入怎通
查看: 710|回复: 3

[站长八卦] 通过Robots.txt学会与蜘蛛交谈的策略

[复制链接]
104团队 发表于 2012-06-09 19:34:36 | 显示全部楼层 |阅读模式
一、为什么Robots.txt?- \% J" a3 h/ \2 l- I
在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。
. w3 ]% ^5 ^2 f9 Q- }2 B/ Q8 v* B9 N1 w2 W! \9 d6 Q: v
二、一些常见的问题和知识点$ q! f6 @$ G' P; }/ j5 r3 v7 ~
1、蜘蛛在发现一个网站的时候,第一步是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况);( @) B4 z  z6 J2 J* b& g1 U% V0 [
2、建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件;
9 @# s* k3 n. z$ j" i$ G1 ]( L  Z2 E3 K, L6 I+ F
三、在robots.txt文件中设置网站地图0 f( V* l4 B& C1 I& o
你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。你可以像这样来添加:
2 {! i; _& Q* T3 y9 d/ G0 L+ z$ w& ZSitemap:http://www.seowhy.com/map.xml(支持链接形式:xml、html,一般建议使用xml形式)! q' p) q! S' |! y' h5 H2 _( M" k, _+ P
% s6 G/ t& _  I# J  Q, D5 I8 R
四、Robots.txt的顺序
1 _/ W5 \% x. p- _在蜘蛛协议中,Disallow 与 Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。
0 Q# k+ ]1 Q- f# h. S0 P9 z5 c引擎蜘蛛程序会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白:
6 S4 U0 [/ J- g9 P8 ?& P1 j; S. X4 f7 E8 \" m7 ^* p; D( \
www.gouwozi.com
回复

使用道具 举报

bhccn 发表于 2025-11-08 17:45:19 | 显示全部楼层
这个思路很新颖,打开了新世界的大门,谢谢分享
回复 支持 反对

使用道具 举报

梦想 发表于 2025-11-10 20:48:33 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

额。小P孩! 发表于 2025-11-10 20:48:46 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-14 01:17 , Processed in 0.656861 second(s), 50 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表