找回密码
 加入怎通
查看: 1486|回复: 2

[站长八卦] SEO新手应警惕使用robots.txt

[复制链接]
TONY 发表于 2012-03-25 21:15:56 | 显示全部楼层 |阅读模式
   去年年底开始接触SEO,说来还是个新手,最近天天扒在各大站长论坛及百度知道等地方学习各大站长及SEO牛人的经验,今天刚好在百度知道上碰到个SEO新人朋友发表的问题:我的网站 为什么这么久了还不收录啊 外链已经有5百多了 但网站页面根本没有结果 为什么不收录。
# ^3 Q. \  }% L  b   
) I) r/ a2 D; H0 U2 l    看了这位朋友的描述我查看了下这位朋友的网站及通过站长工具查看了下网站的基本情况,发现网站页面上也做了一定的页面优化,外链收入很正常;但是发现这个网站的google收录也为1;而后我查看了下这个网站的robot.txt,在这我发现了问题的根源User-agent: *  Disallow: /( U8 x* n& `6 d# J+ ?  ~
,这两行代码的意思是禁止所有的搜索引擎搜索该站点下的所有文件。, S* e' x& V, }/ W$ L4 }
robots.txt文件的写法- x3 M( d- R$ k
  User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符   : z9 k1 x( m- n- A% }
    Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录   + }+ h1 |# e' a
    Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录   2 k% B7 S% s  t, L+ |7 z
    Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录   
4 l) y' b; n, G& x5 Y    Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。   
/ v3 N4 M' }  D) e. y# k# q8 @% M- M    Disallow: /*?* 禁止访问网站中所有的动态页面   
/ a+ `2 o2 I0 h+ n    Disallow: /jpg$ 禁止抓取网页所有的.jpg格式的图片   " ]* P, _9 k/ k4 R. g
    Disallow:/ab/adc.html 禁止爬去ab文件夹下面的adc.html文件。   
/ F7 {5 T7 x* i/ q7 ?    Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录   ! m3 T: e& U$ J$ h
    Allow: /tmp 这里定义是允许爬寻tmp的整个目录   0 a& W* w# o" f  i8 u0 N5 \
    Allow: .htm$ 仅允许访问以".htm"为后缀的URL。   
! H) t5 e! t# y. q# q# b    Allow: .gif$ 允许抓取网页和gif格式图片
' w6 V( k2 P; m0 w$ {0 g+ p   希望此次的分享能给大家带来帮助。
1 {$ C- I( u( F8 h, k
; @" ^9 K0 q. y/ J9 D6 \   本文由易瑞沙资讯网(www.yiruisha1.com)原创,转载请以链接形式注明出处。" d/ D' c) M7 T+ _9 O* R
回复

使用道具 举报

风停花开 发表于 2026-01-17 11:31:24 | 显示全部楼层
蹲了这么久,终于看到有价值的讨论,支持一下!
回复 支持 反对

使用道具 举报

西安.NET技术 发表于 2026-02-12 18:58:32 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 12:16 , Processed in 0.570670 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表