|
首先,来说一下蜘蛛是什么,蜘蛛是整个搜索引擎上游的一个模块,只有蜘蛛抓回的页面或URL才会被索引和参与排名。蜘蛛抓取网页需要一个入口,所谓入口,就是链接;蜘蛛从入口进入网页,在从一个链接爬到另一个链接。蜘蛛抓取文章时,是靠特定的程序代码去辨认文章的原创性。百度蜘蛛在抓取文章之后,经过一定程序处置将一些多余没有多大意义的字去掉,例如“啊”“额”“了”等等,把整个文章变成众多关键字的汇合。0 {- U2 Y0 f6 n+ d: m, t
百度蜘蛛与人的思维是不一样的,像网页总是从上至下,由左至右的看,它仅仅模拟了人的大脑,一般都是首先搜索头部信息,再搜索底部信息,然后紧接着爬取左边,最后才看主体中间部分,所以蜘蛛爬取的图形可以用字母“E”来表示。我们人搜索观看的可以看做一个字母“F”。所以在站内优化时候,必须要首先考虑到的是让搜索引擎怎样抓取你的的网站,怎样你的网站绽放出最大的亮点。蜘蛛爬取时候有几个特点:“四不爬”
. K" P; k0 h4 ?4 Y, K8 t% v 一、蜘蛛不喜欢的不爬
d. Y/ y; b/ x, p 二、没有路口的蜘蛛不爬* ?) n! ^0 [) w, ~
三、全是路口的蜘蛛不爬
6 J+ h9 f8 F: W- f+ s. U5 W: u 四、路口是死路径的蜘蛛不爬 ! ?9 v E2 j$ w! _3 a! |; w
搜索引擎蜘蛛爬取“五不抓”! t8 U9 L. o) T |3 y( [
一、内容网站不符不抓5 @ O2 W! {0 T5 E
二、伪网站伪内容不抓( \9 Z' o# X' a8 Q
三、全视频全flash不抓7 i. O8 \5 ]4 c& D! F5 C% Y# {# P
四、网站优化优化过度不抓
+ \' @) e, M, o( a 五、死链不抓
, v1 R& ?$ G% A7 Z 在站内优化过程中,首先要做到这几点才能保证搜索引擎蜘蛛对网站的抓取效果。这些站内优化的注意点是一直都在关注的,我们要努力做到最好。 文章来源:58商道;转载请注明
, E5 a- t* F" k/ W |