找回密码
 加入怎通
查看: 1225|回复: 4

[站长八卦] 搜索引擎如何判断核心内容的思考

[复制链接]
TONY 发表于 2014-01-07 08:32:54 | 显示全部楼层 |阅读模式
搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?6 S' J' S+ V( j
先说下Kyw认为的搜索引擎运作过程的前几个步骤:$ z$ [- A; t7 R" Z5 O
1.蜘蛛下载A页面,送回服务器;
! Z' S; _9 E9 }, I2.服务器寻找A页面的核心内容位置,然后去除HTML代码;; C% D) N7 T1 B- f
3.寻找网页核心内容;……
- w. u' X  i: A% R8 Q我不确定GOOGLE、百度、YAHOO!是否真的有“判断核心内容”这个步骤,但我相信一定有类似的运算机制,因为如果没这个步骤,搜索引擎将耗费大量资源做重复运算。当然KYW不是搜索引擎工程师,下面只是对搜索引擎的一些思考。6 l9 x; s2 K6 u( O" ]! E
SE面对一整页HTML代码,如何判断核心内容在哪里呢?9 Z, t7 e4 C  J. {+ Z5 H0 u) W6 _! d
第一步:拿该页面和同域名、同目录、同文件名格式的页面做对比,去除相似的部分。经过这个步骤,头部的导航条、底部的版权信息、固定位置的广告就被去掉了。我估计搜索引擎在每增加一个新网站的时候,会建立一个对比模板来提高工作效率。如果网站经常改版,在改版刚开始的期间,搜索引擎还没反应过来,就可能造成新收录网页的排名不理想。6 s4 L6 {( `+ ^8 }- U1 p0 T
第二步:去掉有大量链接的部分。经过这步,“相关文章”“推荐文章”等都被去掉了,剩下一些包含文字内容的代码。
+ X, z6 Z9 l6 s& m$ _5 R3 s( j第三步:在剩余的代码中判断哪段标签(可能是DIV、TABLE、P或其它标签)中的文字内容最多,因为一般核心内容的文字量会比较多。. i, W* ]- _& [' s" N' Y( ~
每个页面经过上面3个步骤,应该就能顺利的判断出核心内容所在的位置。经过这样的思考,我们也许可以这样总结:0 |' T: s+ E! V. g( f% B
1.同目录下的页面,最好模板一样。4 N7 n" N, w4 X, T
2.核心内容文字量不能太少,特别是企业站和B2C网站,只放价格和包含大量说明文字的图片是很不好的。, b6 `9 Q& V5 {# N' J
3.HTML代码中如果错误很多,可能会影响排名,因为搜索引擎可能在判断核心内容的时候出差错。
. M, h" U& M: V1 Q6 A' Y, Z4.期待你的补充^_^9 ^( I/ ~/ Y8 b, B
Kyw把SEO的主要工作理解成帮助搜索引擎更高效的理解网站及页面的内容,所以建议大家有事没事琢磨琢磨搜索引擎,问题想透的越多,SEO的手法也就更加随机应变了。当然也没必要钻牛角尖,有想不通的问题就到我这留言吧。
3 p/ s( }: q1 K& \0 w  F原文:
' H! b6 P3 I* u5 b) L. O: Z8 U0 a  q注:相关网站建设技巧阅读请移步到建站教程频道。
6 p- ~+ X* m6 F$ ]$ U7 z) Z. L
回复

使用道具 举报

codyness 发表于 2026-01-09 03:36:41 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

qq756590910 发表于 2026-01-09 16:50:21 | 显示全部楼层
这个思路很新颖,打开了新世界的大门,谢谢分享
回复 支持 反对

使用道具 举报

codyness 发表于 2026-02-11 07:10:59 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

汇付天下闪电宝 发表于 2026-03-02 02:30:25 | 显示全部楼层
内容很干货,没有多余的废话,值得反复看
回复 支持 反对

使用道具 举报

2026年3月12日真牛社区(fd.znbgj.com)签到记录贴
我今天最想说:「www.hzzdsw.com 加油」.

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 12:09 , Processed in 0.219508 second(s), 26 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表