找回密码
 加入怎通
查看: 1106|回复: 0

[站长八卦] robots.txt写法大全和robots.txt语法的作用

[复制链接]
我是小懒猪 发表于 2012-08-12 23:05:20 | 显示全部楼层 |阅读模式
1如果允许所有搜索引擎访问网站的所有部分的话 我们可以建立一个空白的文本文档,命名为robots.txt放在网站的根目录下即可。7 A* ]. n5 `7 e$ \8 \
robots.txt写法如下:

1 x3 J1 D" W4 P7 d: X$ b0 kUser-agent: *
2 ~! M. c6 S4 x6 q/ ?2 g6 MDisallow:' B) E0 n+ S. T3 N2 c
或者
) L# h1 Y( T" ^5 {User-agent: *
8 s% L/ ^) L- j+ K; N: m9 IAllow: /$ F/ b9 s1 D% r$ j$ I7 I' f
2如果我们禁止所有搜索引擎访问网站的所有部分的话
/ M. W, i' L: S, G: d8 _) L6 wrobots.txt写法如下:
( A' T! g5 {7 D3 E* R9 _( {User-agent: *
4 K% f/ [( i1 r% V  L8 [/ ZDisallow: /  A) z0 U9 h$ S5 b3 w8 V! E' n8 Q
3如果我们需要某一个搜索引擎的抓取的话,比如百度,禁止百度索引我们的网站的话+ _/ ~% q6 A% C9 r
robots.txt写法如下:
! k! W% M6 y2 r5 V4 Y! vUser-agent: Baiduspider3 p) v* i) x! {# b
Disallow: /
) G) m1 c5 m# O  A4如果我们禁止Google索引我们的网站的话,其实跟示例3一样,就是User-agent:头文件的蜘蛛名字改成谷歌的Googlebot
( N, `: f. n6 A  M; A1 x5 \8 c即可3 s! a; E, q0 ^
robots.txt写法如下:
! Y* F! V5 o  u  T, rUser-agent: Googlebot
. G0 O6 S+ v0 q8 ]# O$ z. ~Disallow: /$ Q/ e6 f- H, c
5如果我们禁止除Google外的一切搜索引擎索引我们的网站话% `1 T# X# Y% T
robots.txt写法如下:
# s3 v, J$ k6 t% {) Y+ f, XUser-agent: Googlebot  ]7 s1 B! H+ b3 P1 |9 b
Disallow:- ]  w% C: p6 f% E/ B
User-agent: *' Z' \& Q6 G7 N# G6 h* j3 Z
Disallow: /
: I1 j9 v. u# [* s1 F6如果我们禁止除百度外的一切搜索引擎索引我们的网站的话2 D7 p8 x) L) I- y- R8 n
robots.txt写法如下:: @; y* y0 A0 N" J* D6 W
User-agent: Baiduspider
+ ]7 n( y" K- j6 q! }3 QDisallow:
* t5 |7 [! S! w: N1 ^User-agent: *4 o% v' M% {1 e0 B$ `; `
Disallow: /
7 T4 b2 D; p/ j) g3 L7如果我们需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引的话
, E. Y# k. }9 q/ M2 }$ Yrobots.txt写法如下:
9 ?8 S6 L- P3 j- M; b) RUser-agent: *! w" C: t. {" U! \
Disallow: /css/
0 n3 J3 `# R' \" @% ?Disallow: /admin/! P; W5 W6 z; \! l6 J
Disallow: /images/
6 Y( a. X' w: j  Y& t# C8如果我们允许蜘蛛访问全讯网(http://www.ffffm.com/)的某个目录中的某些特定网址的话: x% z% P9 H' m' D+ |* u
robots.txt写法如下:
& Z2 Q+ D  N( y3 _  k: P3 gUser-agent: *
# J/ N7 l: Q1 K$ {6 f1 K" ~" {, T5 JAllow: /css/my
! j- w8 f' y1 z6 }8 f8 E" u% v4 R1 HAllow: /admin/html; W8 x3 G# f5 d! q, l/ o
Allow: /images/index
9 d' @  m# v$ aDisallow: /css/. Z+ M9 n/ P& C. w+ j$ D
Disallow: /admin/
& d! w7 Z6 m" x$ y; L- n( kDisallow: /images/
' k4 u5 ^+ R: _% E& o" A9 m: ^9我们看某些网站的robots.txt里的Disallow或者Allow里会看很多的符号,比如问号星号什么的,如果使用“*”,主要是限制访问某个后缀的域名,禁止访问/html/目录下的所有以".htm"为后缀的URL(包含子目录)。
) I9 r( h5 o( C, K# Grobots.txt写法如下:
+ {  W8 F- }8 p5 t- f; r3 T3 BUser-agent: *
0 Z7 Q  L3 ]! vDisallow: /html/*.htm" M9 p; I" k# u6 e, K: b: T
2 U% S) `4 K" j, k! ~( }! O
转载请注明:www.52yyji.com2 u2 ]0 f4 R4 N, ]' h
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 10:54 , Processed in 0.161090 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表