因素19 B N& f% r' E0 R
站长的误操作,这里的误操作应该就是robots文件的写法,很多网站的收录有很大一部分是因为robots写法出错,屏蔽了蜘蛛对网页的抓取。​
/ n, i- `7 @* w, V2 K( c6 Y- j, ~ 因素2:网站域名整体权重
! h$ ` B! _4 e4 |* I1 Y1 V( c0 S/ c5 D 网站域名的整体权重不够,这里宏图互联告诉大家,不同权重的网站蜘蛛抓取网页的时间是不同,权重高自然就时间长,权重低时间就短小。很多权重低的我网站首页和内页到不到网页收录的基本要求。这个就如自然界的动物生存法则一样强者生存,所以提升网站的整体权重对每个网站的网页被收录是十分必要的。7 L! e' a& e6 B1 C
因素3:网站的结构问题
6 I- { z4 b3 P" u 网站的结构设计不合理。网站结构的设计不合理我这里比喻成网站的主干差,脉络细节不通畅。网站的结构设计主要体现在网站的物理结构和逻辑结构(URL结构)的设计是否利于搜索引擎蜘蛛的快速引导抓取,同时网站结构的问题会造成不利于网站权重在各个页面之间的传递。这样也会造成网页的收录存在问题。
* ^4 W/ s+ q, }2 W 因素4:内链的紊乱
% w* H; `$ B8 G; } L3 L 很多SEOer都知道一个网页内部的链接可以促使另一个相关页面的权威性和权重提高,这个本来就是建立在一个网页链接要素的基础上,但是网页的内链设计是否有规划也是一个网站整体页面的总体收录是否充分的必要条件,建议每个SEOER应该是先规划在进行网页内链的部署,而不是想到那里链到那里。; [5 S! d1 T- H" t& i
因素5:页面元素岁搜索引擎的不友好 ​2 V# S6 l6 V* D/ _) |
不友好一般都是指的网页上有太多不利于搜索引擎识别的标签元素,每个熟知搜索引擎的人都知道搜索引擎本身是个程序,他只是认识文本类的标签,那些flash、javascript 、ifrmae的元素如果占据网页的主体导入通道都极有可能造成网页无法被收录。
' R: u& J9 z6 H5 T 因素6:页面重复度 1 Y0 H3 h1 b/ s' N4 N3 c+ S$ T
页面重复度这里指的是网站自身页面内容的重复度和对外的重复度。
% H! C8 B$ t: z3 ] x 自身页面的重复度指的是一个网站很多页面只是标题改改,内容完全一模一样,给用户的感觉这个网站就是在忽悠自己,对搜索引擎来说长久以往就是这个网站内容太单一,因为搜索引擎收录网页索引到搜索数据库是分解成文本文件,这样给蜘蛛的理解就是一个网站的页面有太多的重复,长久以往蜘蛛来的次数也就会越来越少,很大程度影响网站后期页面的收录。 : S. {! R* \1 H; d9 K$ n
页面对外的重复度就是内容采集太多,抄袭太多导致收录被拒绝。这个因素我想也是百度6月风暴算法更新以来一再打击的重点,似乎医疗站行业这样的内容充斥的很多,也就自然成为百度的重点打击对象。
; |/ H! h1 h! r# M0 l 因素7:服务器和空间的不稳定
) K1 s" h5 \0 D1 p. f" a& A4 ~ 这个问题可以说是老生常谈了,服务器和空间不稳定可以说直接拒接了蜘蛛的收录,这个重要性么个做SEOER的都了解。* X. V) n( l- X) M( w, Q) p) H
|