1如果允许所有搜索引擎访问网站的所有部分的话 我们可以建立一个空白的文本文档,命名为robots.txt放在网站的根目录下即可。
& C2 }$ c% B- [' Brobots.txt写法如下:
) n5 a+ E1 p* M- [User-agent: *0 j! J6 m: o. ]4 x$ E- \
Disallow:
8 {. r& Z" S$ P$ y% ]* K或者
. R) b6 R$ }; [User-agent: *
5 A4 d9 n4 }, R* aAllow: /; c8 j4 w* p }% u2 X/ y. D- s4 {0 f
2如果我们禁止所有搜索引擎访问网站的所有部分的话
7 a! M) G7 F# P- N& crobots.txt写法如下:
. a @; A, z* P; iUser-agent: *6 W/ @' X L* z& W, ?$ U5 `
Disallow: /- {5 X/ A% v4 t* @7 {' J. U0 |
3如果我们需要某一个搜索引擎的抓取的话,比如百度,禁止百度索引我们的网站的话) y9 R+ Z- ]. o ?" Q
robots.txt写法如下:
: a% o$ Y/ E& n% j% YUser-agent: Baiduspider+ C5 i% C2 I* D6 |. q
Disallow: /* x1 a. j. O8 P: ]
4如果我们禁止Google索引我们的网站的话,其实跟示例3一样,就是User-agent:头文件的蜘蛛名字改成谷歌的Googlebot
I1 W7 B4 I v5 X2 r即可
! d, z/ w( c1 t zrobots.txt写法如下:+ Y" _4 L% a% M: C6 J* t
User-agent: Googlebot
9 a. _; n# P6 IDisallow: /" Z8 n' z5 O9 Y$ Q+ [! A: w
5如果我们禁止除Google外的一切搜索引擎索引我们的网站话
0 ?5 u1 o7 J" w1 m s+ frobots.txt写法如下:
- p2 j' ?; i1 o8 DUser-agent: Googlebot6 |9 [8 Z. B* v- H$ u7 j8 z4 l( q
Disallow:
8 N9 y) l0 {7 y5 p2 t2 oUser-agent: *
) P; a6 C/ k4 rDisallow: /$ [6 N4 w$ U1 t) u6 {/ G5 J) J
6如果我们禁止除百度外的一切搜索引擎索引我们的网站的话
* R* h# M8 Z$ P6 n) k, a5 Zrobots.txt写法如下:) f3 `/ A7 H- x: t" h9 e
User-agent: Baiduspider3 i, C# Y( L% a1 n$ l7 I' ^
Disallow:
8 `" D. {( z! I5 o; o2 O. a4 L, K vUser-agent: *0 b4 C( y+ \3 {5 {& }
Disallow: /3 g9 J4 Z+ i4 ^8 ~# Y0 I" q
7如果我们需要禁止蜘蛛访问某个目录,比如禁止admin、css、images等目录被索引的话6 I0 ^( A+ K4 I7 l
robots.txt写法如下:6 U0 S) z9 O0 ~+ t
User-agent: *' t" K8 }7 o, Z/ i9 X. _
Disallow: /css/; d6 D3 {/ o1 f4 Y- O
Disallow: /admin/
- @* k( z2 _5 K8 TDisallow: /images/
y; ]. n8 ?! {8如果我们允许蜘蛛访问全讯网(http://www.ffffm.com/)的某个目录中的某些特定网址的话
6 E; U) C2 O; a0 [" Y, Drobots.txt写法如下:
0 u5 u8 L& Z5 O: nUser-agent: *
9 S3 ?& `2 H ~" y- l" A/ OAllow: /css/my( R% F+ ^# G; s+ d
Allow: /admin/html! f' J+ n3 ^$ g9 O: m6 Y. M+ v
Allow: /images/index
, x9 [# B: @: r. h3 }% xDisallow: /css/* @% j- v# I6 j* W; L
Disallow: /admin/$ @* m# |8 D" N4 Y) _. A
Disallow: /images/" z4 f8 }* E/ q7 k! [
9我们看某些网站的robots.txt里的Disallow或者Allow里会看很多的符号,比如问号星号什么的,如果使用“*”,主要是限制访问某个后缀的域名,禁止访问/html/目录下的所有以".htm"为后缀的URL(包含子目录)。; ~, ^! ]3 ?) s
robots.txt写法如下:5 p1 j2 N" d ?; ]$ t1 X$ y
User-agent: *
' D5 t& ?- l0 y0 M' O9 B JDisallow: /html/*.htm
- @( u2 D, a+ A4 Z: O5 I& {0 X+ v( F
* B) ~& ~! v2 H g, q转载请注明:www.52yyji.com
1 M# G8 a! \- ?' W) d |