|
+ J2 T! A; H8 X% a0 T2 F 很多SEO从业人员在刚刚接触这个行业的时候,经常会问——百度蜘蛛是什么?我们可以理解为百度蜘蛛就是用来抓取网站链接的IP,小编经常会听到百度蜘蛛来的太频繁,服务器要被抓爆了,如果你无法识别百度蜘蛛,你怎么知道是百度蜘蛛抓爆的呢?也有出现百度蜘蛛都不来了的情况,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但无法识别百度IP。
) e R& B' }% w4 p 那怎么才能识别正确的百度蜘蛛呢?来来来,只需做着两点,就能正确识别百度蜘蛛一、查看UA,如果UA都不对,可以直接判断非百度搜索的蜘蛛,目前对外公布过的UA是:移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; + , n0 H% l, i/ p# E' C- B8 w# {/ z
http://www.baidu.com/search/spider.html)PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
2 `# h) _5 c( n1 d6 V3 }8 z. N/ x, M9 R1 F 新增渲染UA:移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0; + : q: @2 a) ]7 D; w1 x8 O! R, L
http://www.baidu.com/search/spider.html)PC UA : Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html) & y5 j* V+ L" [' B
二、反查IP站长可以通过DNS反查IP的方式判断某只spider是否来自百度搜索引擎。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
7 m6 D1 _2 L( L- t7 ]0 E1 l 正确识别百度蜘蛛(1)、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。 1 e6 W) I# i! w' u1 \$ r& J/ Y
(2)、在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。 j. |. o# o; H m
(3)、 在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。
; g8 @6 H" m; u0 e/ m2 I
9 o2 m7 q4 g J" Z: h5 k
+ ]. S2 s9 U4 @" P- F k4 ^1 C* {; h6 {" N" |' D- P
k$ W9 m8 F1 M6 ]$ O |