找回密码
 加入怎通
查看: 508|回复: 1

[站长八卦] 网页内容的相似度问题

[复制链接]
stella 发表于 2013-05-30 10:21:03 | 显示全部楼层 |阅读模式
   网站被K是网站运营中不可以避免会遇到的情况,作为站长当我们的站点被K之后在分析网站运营中内容和外链上疏忽时,往往还有一个很大的方面是大家所没有分析到的。那就是网页内容的相似度问题。因为据笔者在今年六七月份百度大规模K站风波中的观察,有很多站长都在“喊冤”,明明自己的内容是实实在在的原创内容,为何还是被无情的K了。而笔者认为原因就在于网站的相似度问题上。网站内容即使有原创的,但是相似度过高仍会被搜索引擎误认为是重复的内容。那么在本文中笔者将就这一问题追本朔源分析如何根治网站相似度高之一头痛的问题。
* i2 ^. D8 C3 A0 X7 u) t* p  那么既然追本朔源,那么我们首先就需要了解网站产生相似度高的问题所在。: |8 ^8 [% z4 J8 }/ o& ?( [
  1大量采集内容,这一点很容易理解,www.44444q.com把别人的内容放到自己的站点为自己所用,骗得了访问者,可终究是骗不过搜索引擎。
3 c/ \" P% [( b4 }  2、网站的内容少、图片多,这种情况主要出现在一些瀑布流的网站。虽然这种情况不会直接造成内容重复收录,但是我们都清楚搜索引擎对于图片的识别不佳。如果图片多,内容少就有可能直接造成相似度高,影响到收录,还有可能引起不必要的惩罚。
) H% q  z2 H  O# e- c2 h+ ^  3:网站同时生成动态静态页面,然后没有对其中一种形式的页面进行robots屏蔽,造成网站内容大量的重复。
, |) X1 [6 j( ^' r1 f: E  4:站点内容多次转载造成内容的相似度提升,这种情况主要还是发生在站点的RSS订阅的设置上。: T$ {, g/ s" H6 P
  当然产生重复内容的原因还有很多,笔者就简要的分享这四点原因。那么在网站运营中,我们要如何根治这一些重复的内容?/ Q% h  f1 @: c0 b8 f7 S" n$ D
  1首先重中之重的是要加强自己的原创力度,做网站不能靠抄袭,使用别人的内容,虽然可以充实我们站点的页面,但网站的可读性就搜索引擎的友好度就会大打折扣,要知道网站的内容是用户和搜索引擎最关系的一环。
" {$ e% e0 {2 z6 ^+ N  2自定义网站自身的结构,因为现在绝大多数的网站都是使用建站系统进行构建,这类主流建站程序一般都支持站长对站点生成自身结构的自定义,所以利用CSS的这个特点,我们可以制作出一个富有网站特点结构,对减少网站的相似度,可以起到非常好的效果。
' ]" n/ n& H( K) S  4提升页面的独有性,比如在页面上设置独特的title,让蜘蛛知道这个页面的唯一性,或者是手动修改meta标签,让各个网页的description稍有不同。这一点我们可以看看A5在内容页面上这两个标签的使用方法。Title调用内容的标题,description则是使用内容的前面几个汉字,如下图所示。
4 {  r) {' Y, z9 a! L$ E  5在上文我们也提到过图片过多也会引起相似度过高的问题www.55555q.com,针对这一点我们可以从以下几个方面着手。9 p+ B# U* J- t8 }$ u$ a) V! r
  ①针对每一个不同的图片页面使用独立的标题。0 `& ?6 v9 l# Q- o, F( f0 b1 @
  ②针对每一个不同的图片页面使用丰富的描述内容。
) b4 f0 r7 v5 M  ③针对每一张不同的图片制定完善的ALT标签。
* l6 V7 S7 i5 B2 ]  ④借助“你可能会喜欢”栏目合理的调用其他页面。
' `- B6 U8 l/ U  借助这几个手段,我们可以说在一定程度上基本上可以根治站点相似度高的毛病。当然如果要真正治愈的话还需要我们的坚持不懈。希望本文对于大家在处理相似度高的问题上有所帮助。
. t! `5 l0 x% \' W' |
3 z; g6 q. z0 I' r- E& R* z
回复

使用道具 举报

北风来袭 发表于 2026-02-18 18:31:38 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-6-12 14:22 , Processed in 0.028816 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表