Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。
; C& P# n" Z1 ~$ h3 l6 l2 e INDEX 指令告诉搜索机器人抓取该页面;! K R6 E! i6 b" e) |' v. c
FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;
( C6 b7 C6 [3 D4 O+ a, ]" e Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。
# h$ w% K* A( D. h 这样,一共有四种组合:
! N) ?! z0 r5 c% ? <META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
+ q1 A+ A* q6 ?- F <META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
! B: I f3 O! m% @' f <META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
: |4 @2 I+ ^. f$ |- w8 f <META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>0 P$ k( C5 z% p: o3 d% @
其中
* o) B7 E; }/ a8 ~- ]7 \ <META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;- a+ q: K; |3 ^* L1 M8 v
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>% B& F# s% l1 P5 n" ?- S
目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:
) \3 f1 B( S* P/ K8 L9 X( k, l: z <META NAME=”googlebot” CONTENT=”index,follow,noarchive”> |