|
|
随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!) _3 s5 z+ ~/ F: _
4 [5 e# l, G3 {& Y
首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度
# @- H# f7 T- v) V' Q; _& T+ T! [% v, h
我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!
/ c" p [9 y* A5 S. s
& a$ R% J7 x7 H! E5 X 1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!" D7 }1 f2 l! B
& c7 j6 m2 N) M+ W& n" S 这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!
1 [' a1 O! y6 G7 e* P* J {0 M! b h# Z. @+ j I- ^" I
当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!1 ?7 ]3 U4 Q) ^6 G
2 [& \2 t& Z N" @ ^% a 列出例子说明:
- S$ L! S" v" K4 q5 w3 }3 `5 U- v8 a; m& E' z
被采集站点 每天大概有500条新的分类信息3 @2 J! U& B/ I: [4 c- i- N
7 d0 N3 D' s) b 我利用采集工具设置自动采集!/ P X Q% J6 e4 n
# m+ H( ?3 F; Z/ d3 ?8 C; f' l 每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!
: A! F3 m& [1 i( F9 D! P% c6 P. k% Y* n- R) }
基本上我站信息和被采集站信息发布时间误差不超过 30分钟!
0 Y3 S4 [8 v9 X4 a& T' i9 \ p1 w+ j9 H+ w- Q4 h' [/ T
我们来看下 百度是怎么判断的
* Y% b2 ~% u( e: x/ `) P$ Y4 C' ~# l+ d
5.规则审核:
1 \1 V4 B! X: \9 c1 X/ p
. S# N3 b" D$ w- E _ 1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,* N4 t# W2 i6 }, a0 ~2 Z
6 Q# N& B4 }% J: q- U: g. l N- `! g
2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比
+ c7 v3 _8 A1 P7 t; X: g9 l7 V1 q1 B
3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!0 t ?# p* k1 ~0 d
% h8 t# ~8 | T }; `! v( D
知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的3 ~3 k9 W, A6 }, B
* U# B, M. T! Z2 Z8 {( S 1.外链
2 s; Y3 d; J, {5 J, W4 g: S# O8 t1 w
2.网站运营时间的长短
" g# A) u4 f7 G1 C9 L/ k& P' C9 {/ x5 G2 J. Z. m7 A
3.流量, ]0 C/ a0 r* I$ g
0 }: `) Z5 F R8 N j4 w
4.采用的编写语言!' E! D$ {- {1 q2 k
1 B: K& T- J& R
这只是一部分! 还有的我不在鏊述!+ A e1 A, Z8 r3 P2 V
6 e8 ?2 X0 x x 要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!
% D- T: D. l3 i" `0 T: ?8 N, e6 Z B9 O4 k, h8 A
流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!
9 w* _9 R6 k* n' T3 y
, |8 S- B' E; r6 l0 A4 H 总而言之!8 y2 R2 @6 v% S9 i) @6 ~
* s | j& Z9 u. I: d2 ]$ T4 n
想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!
0 F! O0 H; b' a+ U* {5 z2 W4 m% D# y0 I6 `
还有一条!有很多小型网站是你采集的不错选择!
/ k0 x# }: P$ d# {! R0 y
( l* z- G* A. {5 O# g8 r 采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!
- a; D" u7 T6 ?3 J P- e& B+ l# y4 u" t) d' x8 F
|
|