找回密码
 加入怎通
查看: 1419|回复: 3

[其他] 教你如何将采集的文章获得较高的权重

[复制链接]
商摆小路 发表于 2012-06-04 11:05:21 | 显示全部楼层 |阅读模式
 随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!
& Q8 x% v# ^/ c; W! M0 ~2 _2 o0 R
. D1 \8 O$ Z$ |  M) W% e; f  y  首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度
# s& _2 m3 n4 }5 D; A6 g8 y7 K
' i8 w+ T8 }# B  c2 I  我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!
9 H& n: q, n- }( u: \) T  O  y( A$ y2 M/ C6 ^- k2 z
  1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!  B  q. C4 o2 W, ?/ H- U4 H) j8 @' l
$ M+ h0 z% P2 q4 h; `" r. y/ ~
  这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!) ?. p% p" g( _0 k2 d6 R
8 N& ^5 ?3 E' N, |( a8 D8 F8 n
  当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
  l! J* a& y" h$ q1 d  O! ^6 ^* C% D
  列出例子说明:& j2 i- w& Y# `

2 E$ S& k7 W/ C) J( @  被采集站点 每天大概有500条新的分类信息
- ^& z4 w1 D, x$ L( B) Y3 o; f. k9 y
  我利用采集工具设置自动采集!
* v( }1 I2 J: a7 O% o0 @/ S: V6 C- p! m5 v+ n2 u
  每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!& J' i" o/ Q/ W6 E* a0 @, s4 ~) X
8 ~( C/ d9 G5 ~/ l1 q* O: G) v6 m8 N
  基本上我站信息和被采集站信息发布时间误差不超过 30分钟!
1 q8 A6 G1 s4 L; r/ E1 O% P# D% Z- m( S" N  V! l8 [
  我们来看下 百度是怎么判断的
* }' R3 I5 q' O0 A, d
! A* O; X5 w/ Y; N  5.规则审核:4 o( V9 u: i0 z+ k) I4 V
( P/ V1 z8 \7 a( k8 R' B
  1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,
+ A( G# p3 s9 ?9 j. s9 r9 j6 [5 I0 u
  2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比  ]( `/ i; @% b
8 q) F# ?! s; e2 I4 _2 V
  3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!0 `$ Z, |' ^3 n6 l( o! L
: l+ p, _. w" b
  知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的8 U# c# O4 v! K# p: x

  r) U6 b! J" k7 C8 Q  1.外链. W- M& j5 ]9 m2 Q3 K. f% T

$ K! f1 N7 M  x$ ~& Z0 N  2.网站运营时间的长短; E. f7 L* M; [$ f+ V7 T& b/ O; u

5 O. o4 g6 C, l  3.流量0 \' ~0 g3 v& O* C- \

+ {* ]/ F3 W( X7 {# W  4.采用的编写语言!
. d7 Q, A, d% I* l5 v1 X4 i
9 O4 b. }& h( S4 E/ L  这只是一部分! 还有的我不在鏊述!9 S/ r* e) E6 F4 J& R- x7 \
, e* M- q/ b2 A# l7 n$ z$ b
  要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!
% G: ?& H( m- e
2 Z4 h0 z  j+ O  流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!' {+ a! k, [4 S9 w1 s7 z
. N4 W  Y7 F" A
  总而言之!  i- O+ |2 k! ^8 T. Q: ?& t: F

) ]) g5 t. e! O9 v  想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!
8 Q; i' I4 Q5 h6 M$ ~2 }% ?" f0 W5 l- x, Z2 N& K/ J. u; p# m
  还有一条!有很多小型网站是你采集的不错选择!( e8 n3 S# r/ C
7 W& Y9 T4 c, N4 p1 V- j! K: H+ l
  采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!" ~1 x0 g( k/ s9 s( N

% {8 o* z2 N1 \+ d
回复

使用道具 举报

四尾鱼四月莲花 发表于 2025-11-10 20:26:33 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

surf228 发表于 2026-02-24 20:17:13 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

比太阳耀眼 发表于 2026-04-28 02:53:54 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 04:34 , Processed in 0.050016 second(s), 26 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表