找回密码
 加入怎通
查看: 1410|回复: 2

[其他] 教你如何将采集的文章获得较高的权重

[复制链接]
商摆小路 发表于 2012-06-04 11:05:21 | 显示全部楼层 |阅读模式
 随着国内大型CMS 动易 新云 DEDECMS 以及其他各式样的CMS 增加采集功能!网络就到处是采集了!!利用这些采集工具不用很长时间便可以做出N多垃圾站点!!当论坛采集工具 也出现的时候 采集之风就更甚了!基本上网站站点可以随意复制了!既然本文谈的是采集与权重,我现在好像离题了我们进入正题哈!!
5 p2 N8 {; E$ Y2 u, H* h" w* f  l' ~' H7 r( L$ Z
  首先来说下我的环境!网站类型:分类信息网 域名注册年限:2年 在百度权重:比被采集站点站点相比要高点 目的:把采集变原创,保证排名和权重 搜索引擎:百度# c. Y& Z: e( I2 P$ _0 J8 A6 c

5 Q, G( ~( ]- p$ D3 f9 f% @2 N6 P  我们首先来看下 百度是怎么样来判断一个信息是原创还是采集的!!* a; K. p6 b& b; c

" U1 |5 H6 K9 L' J( d  1.一条信息----2.百度----3.百度蜘蛛---4.蜘蛛收录此页面---5.规则审核---6.入库并显示在结果里 按照百度的规律 一条信息从收录到显示结果基本就这几步!! P) B. T& e3 L9 ]: F
/ E2 \. M& p! y7 n( p* E( e! W0 I) I
  这几步 最块也要2天时间才能完成! 从1到5 基本上最快也要1天 你不要问我说!我刚发布的他就会收录了?只要你没被K 基本上 百度蜘蛛是把你的数据临时保存起来的。通过5 才会显示在搜索结果内的!
2 u1 B* W& }+ E, N: F
) e8 y  x# L& O+ `& r( d  当你的信息进入5的时候!百度也就是在这个阶段 判断 是否原创或者 采集的!也是从这里决定你的排名高低的!按照上面来说 你有 至少1天时间来进行操作 使百度认为你就是原创!!
% l$ l6 G( j/ |0 C& O5 l, T
2 J2 }4 @6 e9 z6 K" G9 N$ G  列出例子说明:
2 ?3 z5 @8 R. |8 O& B- J: C8 B! X& m- B2 k' n7 o
  被采集站点 每天大概有500条新的分类信息4 Y: n& R% ^. b
, o4 p, _/ z0 C' Y5 t6 B# l
  我利用采集工具设置自动采集!7 ^* ?! A# r7 x- B+ S7 h  k' A

. M  s! E% D- A  W- F; T$ a& S  每日 8点 10点 12点 14点 16点 18点 20点 22点 0点 进行采集!!并且进行直接入库!* ]/ j; Q) n5 E

8 [! i2 K8 n8 U6 P) a3 B, e  基本上我站信息和被采集站信息发布时间误差不超过 30分钟!# g! E# f7 F3 t2 Q8 M1 s

; ?2 K' f$ j, k  我们来看下 百度是怎么判断的
% M7 t. T4 c2 M4 q2 @4 L" t& a% e' L- T+ m( K/ |( m% P
  5.规则审核:# `9 r6 Y7 @1 h* ^, a0 h1 z  A

2 h9 u9 [5 c7 O! C! N& O( _  1.对比现有数据,数据库中是否有存在相同内容,不存在就直接收录 默认此信息属性为原创,& q& r7 G3 ?; l  P

) x  e/ e( J( f5 a6 ]  2.对比现有数据,数据库中是否有存在相同内容,存在就进入下个对比$ @: j% @) V5 [: b* J! v9 q
8 r% [* F- k, F" l9 k1 D
  3.存在相同内容,就对比A和B的所属网站在百度权重.权重高者胜出!低着则排在后面!或者直接删除!( U% [5 d! U& U: d+ T

1 }& I( n/ G+ C6 v3 z  知道了百度的审核的机制 我们就很好来操作了!及时更新了。说白了,。就是及时采集!我的例子说过了!他最新的信息,我采集过来 误差不超过 30分钟.百度在这个30分钟内,是不可能把这个信息内容缓存起来的!到了这里,就要看百度更新谁的网站快了。谁的网站先更新,那吗谁就是原创!!为什么你也是及时采集了他,但是仍然和他不能比!那就是因为百度先更新的是他!他在规则审核中,。、胜出了!!为什么先更新他 他权重比你高!!说到权重 我说下百度如何判定权重的7 a1 P5 H7 z2 Z8 [6 |

% ~5 X' B0 ]' \4 v# r9 [* a8 j  1.外链
( V& g! [. }0 m* Y6 F
5 _# G) G/ y/ u3 a  2.网站运营时间的长短( M  Q3 L- W7 o; _4 a$ d

: W, w5 Q4 ]1 J0 Y  3.流量( G& H6 g& [  V" s- `9 \2 h
: C$ l) A: T7 K" ^
  4.采用的编写语言!  r, H- F' w. ^* D* R
# G. }$ U; e- ?; H
  这只是一部分! 还有的我不在鏊述!
3 c. B1 J! ]! @& D/ @8 T+ A6 z( e! V1 y% A8 r1 @3 w
  要高质量的友情连接,和百度K过的站做连接,你那是找K!运营时间的长短 要看个人站长的 毅力和专注了!经常改变 主题改变定位的站 百度不喜欢!一天是音乐,第二天变小说了!百度绝对会在你第三次改之前K了你!!" s1 T$ k0 I  F: [* {# F7 R) K

* ]& R6 p/ J3 e$ D7 o  流量也是一部分先决条但不是绝对!!网站使用的脚本语言!当然能静态化的就静态化把!如果自己开发能力不怎么样,还是使用现有的CMS把!+ ~9 r1 G4 c; I+ }

4 i, L0 C# L$ V$ n4 e4 P  e  总而言之!9 G: C* G' W$ u4 n

# i. d  Q: i8 @( R0 k# f  想尽一切办法缩小 采集更新的时间!想尽一办法提高自己权重!
4 [) U; V" Q+ A$ F) O$ g
5 _' `- ^& c6 z' z% l4 K  还有一条!有很多小型网站是你采集的不错选择!. |1 a; ^1 S- T4 Z0 I; R

. V) r8 I: {( a* \  采集比自己权重低的网站 会更容易的实现让百度误判的目的!从而达到采集变原创的目的!!8 X" L% E. T: K5 F) f- L3 ?

0 i- z& A. k4 H9 ]7 F" K7 y# j7 L
回复

使用道具 举报

四尾鱼四月莲花 发表于 2025-11-10 20:26:33 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

surf228 发表于 2026-02-24 20:17:13 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 02:53 , Processed in 2.559509 second(s), 54 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表