找回密码
 加入怎通
查看: 467|回复: 2

[站长八卦] 百度对采集的内容收录有一个数量限制

[复制链接]
朱岩 发表于 2013-01-14 12:16:18 | 显示全部楼层 |阅读模式
1.百度对买卖链接进行了严厉的处罚,对导出链接超过40个(一些知名站点不受影响),链接工厂,垃圾站,半年以内的站所导出的链接全部没有权重。对于不相关友链全部降权,大约有相关网站友链的十分之一左右。- r8 \5 P1 d1 r7 N
2.百度增加了对隐藏链接的识别,隐藏链接一律没有权重。; M- Z/ K1 z( ?) g$ b! F
3.百度针对购买GVM,教育机构,事业单位链接的行为进行了打击,百度已经建设了GVM,教育机构,事业单位数据库,对此类网站给予专门的排名,同时此类网站导出链接一律无效。. |9 k8 ~  G; H% a% u
4,对于针对百度产品进行优化的行为进行打击,百度产品所导出的外链一律没有权重。
( [4 e6 Q) {+ `# S2 s/ k5.百度对在友链平台出售友链的网站所导出链接全部不给予权重,百度已经建设了一个友链平台的特征库,比如在chinaz通过了验证的,阿里微微验证的网站,阿里微微自动挂链的网站,百度的系统都能自动监控到,发现了以后将这些网站加入出售链接的网站数据库,这个数据库内的网站导出的链接都是没有用的。* q7 C' |) m0 ^9 f
6,百度实现了对论坛发帖和回帖用户的识别,被系统认为是垃圾贴和垃圾回复的(百度根据一些自动顶#贴机的顶贴原理和一些万能回复(就是很常见的回复)搞了一个特征库,符合这个特征的就会被认为是垃圾内容)不给予权重,非原创(识别原理和识别原创文章的原理一样)的回复,同一用户重复发表的同样内容的帖子或回复不给予权重。
# W, P8 c" D: {8 R$ v7.百度会对国外空间和未备-案网站加大检查力度。
6 S# Z* B' o) D. k/ [+ n/ l. F8,百度又根据了常见的采集软件的伪原创方法增强了检查伪原创的算法,像打乱段落,关键词替换,截取一部分等方法百度现在都能检测到,百度会针对网站伪原创和垃圾内容所占内容的比例进行处理(具体数额我不知道)而且会把伪原创的内容全部剔除。1 S: o% c8 h# R" a: Y& D+ p$ ?
9.百度对采集的内容收录有一个数量限制(具体不知,但是大站没有影响),达到数量以后就不收录了。( s' L8 c* ?0 C6 h
10.百度对导出链接基本没有但导入链接很多的网站加入疑似购买链接的数据库,进行重点监控和人工排查,对于该网站的导入链接加入疑似出售链接的数据库进行监控和排查。
: c& L% [' {9 ^& \5 W10,百度降低了外链对网站排名的影响,但降到了多大不知道。
' @% d  n2 T6 h& s9 a/ ~% R+ G1 N7 x本文由:淮安仁爱 www.harayy.com 转载请注明
7 Q: Z  x5 ?2 b$ f  |: m: W( l
回复

使用道具 举报

回忆快乐 发表于 2026-02-02 20:44:37 | 显示全部楼层
蹲了这么久,终于看到有价值的讨论,支持一下!
回复 支持 反对

使用道具 举报

阿涛汽车服务 发表于 2026-03-25 10:22:35 | 显示全部楼层
楼主太厉害了,整理得这么详细,必须支持
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-25 10:26 , Processed in 0.059213 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表