|
|
随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!& A3 X* m W6 F9 ` q# h
4 G0 j; ?( O5 f5 n2 D1 R: q 首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度
. Y% @8 j7 z Z( \+ i$ ^/ V7 }9 W& d/ S. z0 c; ]0 ^7 k4 _* o
我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!
\9 F. `- G5 M( i) Z- T- d, }* U: @' \6 j5 l
1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!6 r o3 U1 g. l; }) ~! Z
, f! ?% _8 h) L4 w# C 这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的! q( z) I+ V b. M H) u, ~. \
6 L' h9 Y! T W J) k
当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
9 R" B) S1 ]9 H
8 e1 r) g7 z# k7 ]4 H 列出例子说明: d; x4 e/ Y! h% N' b1 u* m
5 w# B' h- I5 T
被采集站点 每天大概有500条新的分类信息8 {& F2 p3 }0 j5 }" X* {
% C2 p: w9 X4 n, F0 U
我利用采集工具设置自动采集! i) W1 @0 s" e1 K
3 R9 [( Y9 o. q$ a2 Y/ K
每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!
! k5 v) J& h" |+ [& \, z
8 R" C' m; A! J' L+ G 基本上我站信息和被采集站信息发布时间误差不超过 30分钟!
% g" Y3 f# ^3 ^$ Z9 ?, L1 g$ U" B2 a
我们来看下 百度是怎么判断的4 T, Z I' q4 |& E+ _6 K
. O& ?; X- ^1 ^3 c- l2 ^4 P 5.规则审核:
% `9 Y7 ~$ W" b* l1 J5 h9 ~( O0 d2 ?1 o1 `/ j, g
1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,
, s3 g' u% ]; t& k: o( V. f; z& J# u( b: p) }% `9 t4 I% \9 a
2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比
- g( Y- g% Z/ i
0 r) ^% n2 L x* l 3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!$ e y( ?% e- F9 W, v
/ E9 n/ O5 k& h" z: t8 s% N 知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的' c5 ?% j3 W2 |) P' h0 ^: B
. A7 k0 B, G+ I% O& j
1.外链
' X, y' x+ A5 D4 U) t; s# V( i. e- G; Z: p. s
2.网站运营时间的长短
% A& R5 y' }- M s; r3 D9 [9 c: {5 W. ^& N3 X
3.流量
1 g: h& q: W2 R6 C; f7 W1 e+ s7 Q0 K$ K6 ]. U
4.采用的编写语言!6 v/ d! c9 q! A; `' l! K
: s/ Y) Y1 Z. ^$ ]. y3 g6 x y$ v
这只是一部分! 还有的我不在鏊述!
6 y9 |4 z+ L+ m( R( l# |
) s- L; V- l0 b6 }+ e 要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!: H9 d0 B& J O; h9 Y9 F) X3 C
y0 i1 L* u& n, \- I
流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!
! s4 ~4 @" K! b0 I6 h# C; a7 Z! J# H9 ~9 M1 G8 X
总而言之!( ~$ k$ U+ B" n/ s* U* t9 z6 ^
- I3 e/ R, k+ s. {/ Y9 n 想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!. \! R0 ]* @" e5 m
' }& y; }( m( A5 @ 还有一条!有很多小型网站是你采集的不错选择!9 r( r8 h) Y* R+ ~4 }
6 ?* t$ @9 f- P
采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!
$ R2 G8 p8 o3 F. I/ L4 y$ @
" B) k; i+ G3 r- v5 y7 l |
|