5月16号百度站长平台公布了原创星火计划,起源算法上线准备打持久战,对此各站长网站论坛和QQ群讨论声不少,自然是有人欢喜有人愁。这次的算法调整真的会有大的作用吗?原创真的迎来了春天? ; l5 A3 @! f! h8 ]9 V# U % a M* f U7 U( ? p 站长,你还在吐槽别人对你的复制粘贴吗?你还在纠结原创被别人改版权吗?现在不用担心了,起源算法已经正式上线,原创星火计划正在实行。站长时刻在查看百度的动态,而百度每一个动作会影响一批批的站长,相信起源算法的实施又将会打击一批低质量的站点。对于起源算法的可行之处相信是大家讨论的焦点,守护今天想和大家探讨的就是这个话题,个人认为起源算法存在四大可行之处。 , H5 {2 C* E$ ^0 W% k + D8 D5 O. g7 z$ _8 w$ m3 s 一:通过内容相似程度来聚合采集和原创。 A8 L; G6 U5 s2 E# y# ]# N
0 F& V3 B3 I2 P' C% I+ p u 通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合。对于百度数据库来说这一点应该不是问题了,毕竟原创内容是数据库里没有的,新出来的原创内容在很大程度上一定会被关注到,对于这一点相信没有多少人会质疑。 1 f4 E5 e# b d4 a7 y) N $ b `8 T8 m8 `% x1 |" b% Q) ? 二:通过作者、发布时间、链接指向、用户评论。8 |/ P' d6 ^. K& u