找回密码
 加入怎通
查看: 797|回复: 2

[站长八卦] 搜索引擎工作原理之排名大揭秘

[复制链接]
TONY 发表于 2012-03-25 22:49:33 | 显示全部楼层 |阅读模式
       不少SEO-er都应该了解搜索引擎工作原理繁多复杂,大致一般分为三大步奏:爬行和抓取,建立索引和排名。当然SEO-er优化网站,目的在于提高关键词排名,增加产品曝光率。为此SEO-er们更加看重排名这一环节,笔者在此对搜索引擎工作原理之排名做个小小的经验之谈。
+ P6 v2 k8 H2 R6 p7 D$ e  G% p  搜索引擎面对的用户大部分是通过键入关键词返回一个列表页面,这个结构页面是大量的搜索索引库而建立起来的。当然这里这个页面是指自然搜索结果。那么搜索引擎是如何完成排名这以环节的呢?我们无妨看看整体思维图。
% w9 g6 R" |' d+ I8 m& ^6 `& o! b/ [  
% B- J* ]2 F" b# d0 ?. i5 \* u
-1-120324235R1415.jpg

4 \6 t7 Z# W  N. F: ^! v* z% E  一、对提交的搜索请求分析
+ ^. b: r# `3 G* w* k' `3 I  搜索用户在搜索引擎上键入关键词,提交搜索请求,一步一步找到匹配的网页显示出来。当我们键入关键词提交(按下回车)给搜索引擎时,搜索引擎便会对这次搜索请求进行详细分析。5 a2 i1 J. q5 g7 R: O
  1、中文分词
. @3 \! H6 h8 v4 l# [. A- h1 v$ v9 X  中文分词是各大搜索引擎中重要的环节,中文分词能够更加明确掌握搜索请求的重点所在,时期更好地页面展示给搜索用户。
- J( E1 R$ U5 C# ?% D6 S  百度中文分词常见的以下三种:8 _; V& |( I) Q0 R7 O% F
  a、基于字符串匹配
: O; _' J; q5 n) z0 |8 H4 s" M$ N1 t  在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分这三种又比较常见。' V0 v' B1 e; a5 f
  正向最大匹配法:利用关键词查询的时候,在百度排名第一位的是以标题和搜索的长尾词相符合,说明在网站条件相当的情况下,先显示标题匹配的网页。( d/ F' g, _: Y1 V
  逆向最大匹配法:刚刚是正向最大匹配法相反的规则,即从右往左反向进行拆分和组合。1 g% P2 d* A) v! f5 y: C& R, j
  最少切分:最小切分就是将一个个词组切分为最细化,甚者会一个字出现。" s# d+ l2 y( a( Z8 W, @9 ^) [: x4 u
  b、理解分词方法
5 H4 b: y4 a9 u+ S( D  L  理解分词方法:搜索引擎模拟人的思维,对其语句的理解进行分词技术。通过对存储的词语和语句的整合,进行分词理解。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。
  F, I' H+ }% C% Q+ h4 l& {) A  c、统计分词方法( J. x& p8 A4 y# V
  相邻的字同时出现的次数越多,中文分词就会可能把出现相邻的字当成你一个词。我们常常不是使用粗体,黑体这些吗?原因还在于这对于搜索引擎理解同样有利。
; h1 V& M0 h1 U7 T$ i8 L! i' f  2、去掉停止词. t2 b; q* ~$ l2 w4 C# T+ a* ~
  搜索用户在键入关键词时,或多或少会出现不少停止词,像“的”“吗”,这样才能最大限度的显示最相关,最能够满足用户体验的结果页面。& N: t6 Z) l! p0 ?7 A
  3、处理符号
1 M* ~, t* ?7 h" c/ H) x! [! q, r  搜索引擎还是很看重标点符号的,因此我们SEO-er在编辑文章的时候,应当注意标点符号的合理使用,尤其是在文章标题上。
' z- P8 F% s" l6 s  二、匹配搜索请求3 i) s* L  |; M/ _2 d0 E
  当搜索引擎接收到搜索请求详细分析之后,便会匹配URL(当然重点是标题和摘要片段),匹配的URL成千上万个,怎样才能有序显示出来了,这就需要搜索引擎按URL的匹配程度排序。" V" ^& {7 {0 F. _, v
  三、对匹配网页排名
+ D1 ?" j) }# f/ x8 v  为匹配的网页排序,其实就是搜索引擎对匹配的网页进行筛选,挑选的过程,然后按照一定的顺序整理出结构的行为。当然搜索引擎都会给每个网页一个值,即权重(SEO-er们自我定义),通过判断该网页对搜索引擎和用户体验的价值进行排序排名。提高排名的因素多种多样,目前基本上是参考HITS算法,TrustRank信任指数算法、PR值等等。- W* G& d0 Q9 z3 V
  笔者比较浅显的谈谈个人的看法,不知道SEO-er有什么想法,不妨补充交流。对于网络优化人员来说,必须充分了解和掌握搜索引擎工作原理,但是不少SEO-er了解的太少,望大家同进步,同向前看。
回复

使用道具 举报

codyness 发表于 2012-03-26 11:59:05 | 显示全部楼层
管理员的更新速度蛮快的,几分钟一篇。要学习了
回复 支持 反对

使用道具 举报

凯龙588 发表于 2026-03-07 02:42:12 | 显示全部楼层
刚好遇到类似问题,看完这个帖子心里有底了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入怎通

本版积分规则

QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

GMT+8, 2026-3-15 01:56 , Processed in 0.094511 second(s), 29 queries , Gzip On.

免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表