|
|
随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!
2 ]- y' d( j1 E9 q( ]$ R7 p# {, U" j5 ^2 m
首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度4 E+ ]& P5 C5 Y
* N$ y2 d' k3 B3 D
我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!
$ k, n( s9 f' g1 i+ P$ A* C' _0 U, N7 b; k) @0 N c
1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!" e& N: ]* ?6 Y7 o- W2 B& J; _
% ?1 n1 \* ?- F8 K 这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!
, M( o& N$ ]6 l2 I4 F
7 b" ` R) N" c; o 当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
A# N0 D: J( W* \9 g
! ~. O6 ^- |( E 列出例子说明:
3 g4 A0 P& k* `4 J$ F8 ?/ }3 ]- J( X0 D( z9 `3 I4 U
被采集站点 每天大概有500条新的分类信息; O7 s* f/ l6 x( d9 ?9 k, }. i
2 T' ]/ r U6 I' I6 x7 N5 o* d 我利用采集工具设置自动采集!
+ Z, D3 N3 a7 J+ a: `. X) @+ H" _5 W& t
每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!
5 T+ Q+ r$ S7 e& ]
% m& a* A7 M0 z 基本上我站信息和被采集站信息发布时间误差不超过 30分钟!
1 c& m" q" a& W
9 l+ B3 Y8 G; n; F 我们来看下 百度是怎么判断的5 N7 d6 a! `! ~& V2 [
- s- A& ^/ u4 T3 \8 V$ x0 }( c
5.规则审核: t( V0 Z4 M! B7 u# W1 a0 S- C
* m* ~) I3 C/ e) M* o7 ? 1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,, `0 w7 X P2 N A5 R) z
' l/ J0 F" a) K& d, ]0 u 2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比
+ o( H' P% H& `) R; q' T7 H
" p4 u2 W) C. g1 n7 ` 3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!
3 T* W+ N! p. v2 b$ t5 g2 b! Z
知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的
7 R, s% E' K0 w& p
! f1 R8 c) d4 S+ X; M 1.外链# C: W* ]$ t6 ~5 x
2 k* h2 x' o* z7 U+ u8 G
2.网站运营时间的长短
: u. K; F0 e5 l
$ \$ d# N: n: ?& ?: t, {/ o 3.流量0 t8 k( x v6 F. p: r' j7 [' s
! k' l! q. I5 x ~6 o
4.采用的编写语言!
4 h( ^! Z- g8 s" y2 J
' B5 {/ N+ e F1 T' R" w4 T 这只是一部分! 还有的我不在鏊述!! k8 l: l- O6 V9 X) T+ x5 }
! t' n: ~0 x/ M9 Z& R, r1 e 要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!- p3 S% U3 B* I0 n6 g4 h5 ~
- }! O- i, x7 G' T 流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!6 _3 K h+ K( a2 ?
! P# C/ L- Y# B, L6 o6 w
总而言之!, J( `" i4 i) l/ I) G
- D( ?# \. ]4 p& i" o& P* X 想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!! U& ~' {0 F. }# l. K
" G9 ^+ T1 ?+ n1 M$ M* c 还有一条!有很多小型网站是你采集的不错选择!: O* H9 d5 p: S; a! x
, M$ g; ], f8 x. `' h/ Z( h
采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!: c% l9 r$ E' y
6 S/ E) j1 [% W9 C! b+ b) Q
|
|