找回密码
 加入怎通
查看: 599|回复: 2

[其他] 搜索引擎是如何确定你的内容就是原创内容

[复制链接]
真心 发表于 2012-08-22 15:04:52 | 显示全部楼层 |阅读模式
  很多人在群里聊到一些事情,比如原创是如何被搜索引擎确定的?核桃今天分享一下自己对搜索引擎确定原创内容的看法。% C; A( n8 `' O8 i8 S
  
. g8 t9 X0 r& O% d0 T, E  首先我们明确两个概念:原创与伪原创
! S8 \7 x2 P7 y; G$ z9 @  - ^5 F% F5 Y; {/ N0 s& e: U3 i$ v
  原创:简单地理解就是第一次在网络上发表的内容。' N' {. k! D5 W; B. Y1 t) z
  2 k, I8 Y9 m' z. `& g
  伪原创:就是对原创进行的第二次或者第N次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。# ]; n  Y# O/ S% {
  
* |: p+ B7 X6 z4 h$ t" a/ [. g  搜索引擎对于原创的判断是如何进行的呢?
) [" f. s0 Z( d- W: l0 U' A  ! ?. a& V$ i$ D$ _' {
  一般来讲有以下几个方面的因素决定:+ d% D1 ]; a6 T. `9 `
  5 ^/ S% }+ k' E; M0 |3 M: G
  1、快照日期。
6 }: T  T7 b8 i  ( r; E0 Q, \1 O- [3 v8 H
  2、蜘蛛抓取日期。! `3 K9 h( Q8 D$ j8 r
  3 e& _$ y" O) F; Z9 f
  3、页面外链的多少。
7 ?# v! ^0 v. x8 j% @  e0 m  
; Z* G/ `- `9 e  4、文章修改的程度。
  _, L& B* v- J. P  ; }- F3 V& t7 g5 m3 v
  搜索引擎蜘蛛来到这个博客或者网站,发现这个页面,分析内容,放入数据库,并且被确定为首次发现,这肯定就是原创了!& u2 `$ y0 x; w& Q" k
  
6 g- ]* N$ Z3 q, {7 R: O% X  那么这个收录与判断的过程中间有几个细节方面问题:4 s+ y3 [, Q3 y2 t1 f' e
  / W, P0 _: `1 W5 R4 X' h6 y
  1、必要条件' _' n3 P; O) \: o) d" g
  / P% r- y" t$ \3 u7 j
  ——假如这个网站没有被收录,这篇文章会认为是原创吗?
" A' W! O/ Q8 }" k4 L" [  $ r4 H9 P% s" ?, |1 J
  ——当然不是!因为它根本不可能出现在搜索数据库里!8 v' _8 h$ B" g. W5 u% V1 @
  ; @6 M2 M' a0 G' v
  ——如何让它成为原创内容?
1 ^6 @2 P( i+ h$ L; Y. @( m  , [9 V5 d$ s* ~  A* B
  ——第一个条件,网站必须有被搜索引擎收录。
7 G1 ~6 x2 w- v* E+ t7 j; j( N  1 b7 s% [  w3 ~3 a- z! Z
  ——假如这个网站收录了,但是不经常更新呢?& X6 _4 Y+ n9 I1 k: ^, k+ T6 B( s
  2 g) ^( }* U. y- g9 S
  ——很简单,如果不经常更新,发表的文章到收录的时候也会认为是原创的。
/ O2 e* A* k- o& N+ _, G7 r  8 p) e, h2 Z0 ]" c# G* ]: b
  3、转载与采集
- V. S6 T+ C( Q( o+ z. `  ^  
3 Z1 k7 q9 N8 E0 T2 G; g3 I' E  ——如果文章被转载了呢?
5 B/ |( Q( y+ C: J. h6 u  
4 {8 W1 ?5 \4 a7 f) `  ——如果文章被转载,那么看转载这篇文章的站更新周期与首次发表站的更新周期哪个更快。
6 ]) z' l1 a4 h, k/ q  
, A8 W" V" S5 F3 s  ——不太明白更新周期。
# V: z% ]; [1 F8 K8 I) A. A  ! z) o8 o' M0 u3 d& i8 v$ r
  ——比如在A站发表,B站转载,如果蜘蛛先访问了A站,发现了文章,再来到B站发现了文章,很明显的,原创权重归A站。/ b8 A, s4 @3 q2 Z  u
  9 ^( Z$ x; s$ v) G2 Z3 F7 \
  ——采集的情况是否符合这种情况?" U% u( M0 }3 p6 Z: v
  + U& V2 C" M8 V# z/ y1 O2 @+ z
  ——是的,采集的情况一样。如果B采集A,但B收录比A早,B就可能变成原创喽!
) p+ {. o) E- i. X+ ^% z5 c  
% [4 z% p# l+ g" M$ M, d8 c" ^0 q  4、访问时间
+ _/ X! ?( M$ A+ p, f1 m  1 [/ M) G1 k3 v/ G  {. X
  ——如果蜘蛛先访问了B站呢?
) ?, r9 J0 D$ P+ `( q) ]3 T  
. B2 |4 B# w- k- g, j9 E9 w( i4 d  ——当然权重给B站,一般的情况下都会这样!
# I: ]  K' k/ O9 k" c, ?  7 V$ a; s7 }! ^1 `
  ——如果B站转载的文章带了A站的原文章页面链接呢?
! s0 q: J" I4 k5 s' {  1 ~) ^- P: T" n. R" ^! {
                                                                                                http://www.120gc.cn/编辑
) Z- T; {8 T0 v  `$ w  
6 a; w0 n* C. M% B( j- a' T7 g7 }  
回复

使用道具 举报

小丫头 发表于 2012-08-22 15:20:14 | 显示全部楼层
分析的有理,那如果这A网站的文章没有收录,而B网站权重也不高,但采集A网站后这篇文章收录了,那么这算是原创吗?
回复 支持 反对

使用道具 举报

南光的世界 发表于 2026-02-25 15:47:57 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-25 07:15 , Processed in 0.049959 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表