很多站长在维护网站的时候往往会遇到这样的问题,站长工具查询我们网站的收录量,为什么收录量会变化?到底是哪些因素影响的这个变化呢? 所以首先我们得知道的是百度会收录哪些网页,收录的目的是什么?
+ }! O+ \# G7 a) p/ q u: z (1)寻找用户体验更好的网页?答案是No/ j, p3 V/ a( F: ~7 T
(2)寻找综合质量更高的网页?答案也是No5 @" b: i3 X: B) j( |. [
蜘蛛抓取时其实并不知道内容的质量,因此蜘蛛抓取内容之后,得先保存到服务器上,以后再进行计算和更新,进行“取其精华 去其糟粕”的过程。) |2 }9 i6 b, Y2 N- @
(3)其实真正的目的在于为了更好建立筛选的机制。
" `4 h4 R5 `" P8 w; R* Q 蜘蛛抓取内容,只能起到筛选的作用,把大概符合要求的网站选出来,收录你的网站的原因,不是因为体验好,内容好,而是页面本身达到了百度的收录要求,虽然体验和内容很重要。
: i3 c: ?% T4 `0 u. o4 k 说到这里,可能有人会问,那百度的筛选机制到底是什么样的呢?我们又该注意什么呢?
' h8 M% D& t, c$ P; m9 ` 设定这个筛选机制就相当于给我们设定了一个门槛,达到条件的通过,没达到的就要淘汰。我们网站的内容是否收录与文章是不是原创无关,设定筛选机制的目的在于淘汰垃圾的内容、重复同质化的内容,从而保留优质的内容,从而节约时间和资源成本。因为百度服务器的空间是有限的,因此只能筛选并收录符合要求的页面。(isrreports.org)
) s* j z, A; o { r, |+ R 举个例子,拿之前的电视节目快男超女比赛来说,为什么要进行海选?当时报名的人数是10万人,到参赛的时候只有8000甚至更少,为什么?举行海选,多少进多少,这样的目的就在于限制时间成本。理解了么?那我再举例一个,我们在求职的时候,投送简历的时候,有的公司会要求学历,本科以上学历,因此大专以下学历就不用投送了。所以说,百度设置筛选机制的目的就在于筛选并收录符合要求的页面。
u; {0 n- H9 @1 R4 a3 a! o, p
( X0 I+ m |3 t, [; K' a) @ |