找回密码
 加入怎通
查看: 1099|回复: 0

[站长八卦] robots.txt写法大全和robots.txt语法的作用

[复制链接]
我是小懒猪 发表于 2012-08-12 23:05:20 | 显示全部楼层 |阅读模式
1如果允许所有搜索引擎访问网站的所有部分的话 我们可以建立一个空白的文本文档,命名为robots.txt放在网站的根目录下即可。$ U- O3 _3 Z" Z" ~. a
robots.txt写法如下:

( _3 b" y( M" lUser-agent: *! T6 A3 [. P) f; R* T5 V% w
Disallow:6 l- w# ^2 V) B3 k& l4 c1 U
或者- j2 ]* a" Z7 f) X
User-agent: *0 A3 R5 U% |9 V( {
Allow: /' y& Z  w& E2 k9 Q+ f
2如果我们禁止所有搜索引擎访问网站的所有部分的话
) F! U3 \% j) Drobots.txt写法如下:
# g+ j. b+ e2 M. T2 X* {( vUser-agent: *
0 I/ q; _) Z9 q/ y2 ]- A- |; UDisallow: /
7 X/ l1 B, m& {  n. R7 b3如果我们需要某一个搜索引擎的抓取的话,比如百度,禁止百度索引我们的网站的话
1 A" @) }2 r$ Y' m# c2 ?4 drobots.txt写法如下:
9 v+ n' B  @5 k6 X" a& ZUser-agent: Baiduspider
8 ^( U- W* w7 k; CDisallow: /
) g6 @1 V# V' G2 X4如果我们禁止Google索引我们的网站的话,其实跟示例3一样,就是User-agent:头文件的蜘蛛名字改成谷歌的Googlebot/ Z1 J) L' n, G: N  o9 v) A
即可
# x1 v* d, |+ Z! crobots.txt写法如下:
% p" @: S& A( [4 ?/ X0 iUser-agent: Googlebot
+ I" }3 E7 z0 D$ j2 ~" zDisallow: /. O: K7 B9 \! K2 l5 o7 s' f! O
5如果我们禁止除Google外的一切搜索引擎索引我们的网站话6 Z; q9 a: m5 V- s9 s* a
robots.txt写法如下:: _# {0 V2 ?4 S3 g
User-agent: Googlebot
8 R2 F5 x* ~7 MDisallow:) E$ Q& E4 Q3 p! [
User-agent: *5 i5 S. C+ N) j+ L. J5 O  n. V
Disallow: /
0 M% C/ m- }$ M' I  u5 w  L" f6如果我们禁止除百度外的一切搜索引擎索引我们的网站的话# V" X5 K8 ~) H6 N1 }3 L
robots.txt写法如下:. S& o2 i% e$ u8 e( D# v
User-agent: Baiduspider
: y2 r- V2 u% B1 O' T9 b, BDisallow:
+ f2 X& j- ?5 \/ ^/ ]/ p# ]User-agent: *
  f1 A# x! W6 _& J5 m  VDisallow: /
* z3 h+ j" `) u' c7如果我们需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引的话
8 ^3 _" U: m8 y* {robots.txt写法如下:0 [6 n- r6 y  v: ]
User-agent: *
1 H( b1 E. w% I6 RDisallow: /css/
% n0 M- g4 z; S. }# Z/ p- [- sDisallow: /admin/
$ I, }4 q0 X5 T! eDisallow: /images/
5 K. j& A$ M+ }$ Z2 Q+ P" o6 ?( q8如果我们允许蜘蛛访问全讯网(http://www.ffffm.com/)的某个目录中的某些特定网址的话
) c" _6 G! t3 G- K4 j' Vrobots.txt写法如下:
6 F, s/ ^8 X/ s6 gUser-agent: *
  n) V; l4 [5 X" k3 ]1 xAllow: /css/my
7 ]3 o. F) ^' T, p5 e* hAllow: /admin/html3 H: u/ `/ D0 c3 @+ i. q+ C$ A
Allow: /images/index% C& ]" }, F9 Q2 `0 s* Y  `
Disallow: /css/
. z2 ?$ H: _5 F0 @Disallow: /admin/
  S' k; d. P* a; F) ~  @+ c3 O0 NDisallow: /images/% `+ B* k; Z' K8 n5 Z( H
9我们看某些网站的robots.txt里的Disallow或者Allow里会看很多的符号,比如问号星号什么的,如果使用“*”,主要是限制访问某个后缀的域名,禁止访问/html/目录下的所有以".htm"为后缀的URL(包含子目录)。
7 p! U) O" u! V" c4 b, R0 _2 A" a3 Mrobots.txt写法如下:( D. s, N- l2 `2 l6 o4 x, @
User-agent: *
' D- C+ X6 F9 Z1 B8 f" @Disallow: /html/*.htm
4 P; D1 J$ k- Y* M' t& ?- `4 \
9 y; y6 D( N1 `( y& u) n转载请注明:www.52yyji.com
7 M. p5 |' F6 v* ?7 {# t7 h
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 20:45 , Processed in 0.091791 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表