找回密码
 加入怎通
查看: 1403|回复: 2

[其他] 教你如何将采集的文章获得较高的权重

[复制链接]
商摆小路 发表于 2012-06-04 11:05:21 | 显示全部楼层 |阅读模式
 随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!: [4 H  F6 g$ i% \* u' U* b3 D
( i/ ~: y9 R4 a( r0 m) G
  首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度) u1 u- n% f$ R0 t

6 A. \& \0 _. K. \7 {1 h  我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!/ U* B: g- M# @' F/ W

+ M6 n  m- ^1 \" {: s  1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!
' Y  h! ?, f2 ~$ ~9 a/ }4 D" x- B
  这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!4 ~  o6 r" _' p. c' W! a
9 P, S6 d$ G* y5 S8 H, g5 G) ?. ]
  当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
, v% n& w! m8 @8 f- H4 h- n9 z$ y
& F5 c3 ^8 i# ], @! W, {  列出例子说明:
6 V7 y) X7 u6 `; h3 [9 \
3 O) S8 a+ |3 T8 C' i1 S3 q  被采集站点 每天大概有500条新的分类信息
0 ?/ z$ h/ b4 S- {/ H, M
# O7 Z# t  _4 r! B- S  我利用采集工具设置自动采集!  Q) \& Y6 M. G8 F/ L0 n. j" Q
! }8 W; ~2 h2 W' ~4 r: e
  每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!4 u  }" i3 U% K9 A) J
, K" X  E( A( o1 f1 R* b+ [# {
  基本上我站信息和被采集站信息发布时间误差不超过 30分钟!" [  B3 v7 V# t1 r- P* T! [4 \# {

2 h. F& i1 `7 F' m- ^  我们来看下 百度是怎么判断的
1 Y; I- W  f9 F
7 h) Q: a. R# Y$ D  5.规则审核:+ R" i+ [% k$ F1 j. R4 t- u' c

* J6 ^* x1 o/ A; x  1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,
! W: I7 u! O  c; q& _
8 X* S" u1 G5 I6 q' I& Y  2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比
0 l1 z. K$ f7 \7 E
) c  e* J+ O/ c7 ~  3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!" C: F% e  G+ v- y; I, I' y

# y# \& S1 v  ?9 \% t& s  知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的* N- ?7 U5 h, U+ x! [! o% W  _$ D
5 Q7 n( M" L7 |6 x2 x  M
  1.外链; [9 H& ^1 K) ~8 O6 v, Y
- v/ I, _4 R+ w
  2.网站运营时间的长短/ A1 _/ N5 E/ x& j: V8 r  ~

+ c8 W4 l( }8 B  ?: [. I" a4 [. ?  3.流量
8 g) Q  r" d5 g" N6 X8 H. P: E4 _0 p# n' m. o  z2 N6 J
  4.采用的编写语言!
* M2 @* s- K% b0 Z! C4 G5 J* o1 l  {/ P
  这只是一部分! 还有的我不在鏊述!! o* Z+ s: p: \7 ]+ ]" {

, N( T+ `- D1 z) H. z) X* x  要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!
' z8 ]2 L7 T" s; x; \8 c& u( R* H, }' l1 F; Y
  流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!2 @# t. _- ]& Z# K4 l

6 C" S6 \; m1 V' `# f2 W$ e  总而言之!; ]6 |& \7 z' ^1 H' M. a7 w
/ g1 {% m: _5 x9 d  D
  想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!
/ O9 e6 e9 m0 i0 c: Z$ \  e2 D( l8 m6 I' L1 E" L
  还有一条!有很多小型网站是你采集的不错选择!0 t2 P- y5 [! K( p6 O7 S/ K

4 `  N& K' l: h: z2 x2 h; a  W  采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!' q- C! M/ |6 L1 _0 z
4 _% N! ?1 v' a" U" a
回复

使用道具 举报

四尾鱼四月莲花 发表于 2025-11-10 20:26:33 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

surf228 发表于 2026-02-24 20:17:13 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 18:53 , Processed in 0.090440 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表