|
|
随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!
: p8 \! D$ y D6 a
# K' {) N6 ]3 {8 J3 }( \ 首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度
2 f+ ?( e; C# q# L2 M$ Y; R9 T/ l, N7 W) w- ]- X+ V$ {, C
我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!7 M' n* T, n2 z9 U
' H- c9 r/ f: k4 B- D7 `: N. O 1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!
" J& |$ J7 |: s
: _3 |. K+ v; y0 |& J9 j 这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!
% K0 m) } [1 J: x& w& I' c B& H# n: W8 P" t& n' G
当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!' Z6 m6 ?$ l! |3 h
l! X- C# _2 S- d
列出例子说明:
. k: _8 ^! Y: |# i" M- \& I+ v2 q
; U, \& A2 a/ q2 s 被采集站点 每天大概有500条新的分类信息
. i, D5 e$ F0 V' ]5 X* A6 r& `9 Z* E# K) |& W, z0 ?
我利用采集工具设置自动采集!3 V- O; T9 ^2 H1 V2 a& y6 n- Y
w' \0 U& v% s l; K 每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!
8 Y4 L/ d9 y3 ] T7 L4 D' ]
5 f7 O# N& h# c; Z: O: Q/ @' y 基本上我站信息和被采集站信息发布时间误差不超过 30分钟! s$ v+ c/ O5 Y4 S4 w/ r
5 L g/ `; E, Y5 ?- i0 p+ G# J
我们来看下 百度是怎么判断的( y4 J( [, Z( @ x+ ]
0 F, F' _( J' ^, E# p7 I8 Q/ |# b
5.规则审核:
# J! j3 d- N6 ^5 g
8 d4 J% V8 o# D! i0 F: X 1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,
" I; O: N5 b& o( ]- L7 v$ S4 n1 Z' A- Q/ `! ^
2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比) p4 |4 @2 f9 f% e. e0 g7 ^
/ O4 _- I! N! X+ s" h) T4 P
3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!& b" v/ i- h( Y. p! }
: H: P7 P( [1 e: } 知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的
( S5 g& C, o P0 @$ `, ^) l' r) S( a6 w1 ^6 b1 r6 t }/ L. |
1.外链
- ], ?. [/ i! O% V
3 E( l% ]: s( A6 s" z( [ 2.网站运营时间的长短, \7 p' o8 u( [$ K- v, i
4 V. V) G$ U' D; T
3.流量. H% L% M8 n8 |) |+ z6 t) m
+ C: F; y* L' r( _ 4.采用的编写语言!* u4 `" L, `. [4 V
{. a! Q$ g/ K
这只是一部分! 还有的我不在鏊述!
1 I; q f$ \" F) v
7 v+ C0 }$ e' J 要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!$ M$ J6 H- X1 ~7 J$ r( F
+ o7 r3 [7 {/ b5 H. C9 I$ u- ]* Q1 v
流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!6 [; t8 q5 `' L6 b
; ^6 s/ {3 W& b9 G! \9 X 总而言之!% ]/ D" u' x2 q
9 G' `( Q( S( I9 e2 \
想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!$ }! ~/ t, _" Z9 _
. d) {4 G+ O# Z- T0 C, w i
还有一条!有很多小型网站是你采集的不错选择!( {% T4 e: m9 I, n& A! _
% F* V7 S9 s$ G
采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!
! \4 e' u& B! T1 k7 X5 G$ v5 J
7 h9 q% V) J9 {: K, l |
|