搜索引擎如何处理用户录入的搜索信息,拿本文标题为例:搜索引擎关键词匹配机制详解。其中:“匹配”和“详解”是动词,“搜索引擎”、“关键词”和“机制”是名词。那么搜索引擎如何在自己的数据库中去匹配这些词?
6 _- }# t N7 F5 `/ r4 [$ W" w, k8 ~
1.检索类型词:搜索引擎用来匹配搜索结果的第一优先选择。多为名词、搜索热词以及高搜索量词和语句中的主语。本文中的“搜素引擎”、“关键词”、“机制”均为检索类关键词,然后再组合成“搜索引擎关键词”、“搜索引擎机制”、“匹配机制”、“关键词机制”以及“搜索引擎关键词机制”,总计7个检索类关键词。取得候选展示结果,我们用A、B、C、D、E、F和G代替。我们假定每个检索类词有对应100个网页,那么则共计有600条展示结果。
0 o, f) J9 @/ |+ l* z* A
8 x' [5 C# e/ A; S0 M H 2.调整类型词:搜索引擎用来匹配搜索结果的第二选择。多为动词、代词、非常见词、语句中的谓语和宾语等。本文中的”匹配“和”详解“均为调整类型词。搭配检索类型词,从而区分排名次序。在这里可以产生A1、A2、B1、B2……G2等各种排序结果。我们假定A1-G2各有30个网页符合标准,则搜索引擎需要在420条结果中进行关键词排名(14×30)。* h/ U6 @" F, K/ S D
4 P# {" ~, d6 u% Y5 a- Q 3.无效类型词:顾名思义,对检索、匹配、权重等没有不起到任何作用。多为助词、符号、空格、预设的无效词等。- n# @; }3 d6 V" q; n) r; v# P) z
+ L8 J1 j7 a/ Z
分词完成后,搜索引擎便需要进行权重的分配,从而对搜索结果进行排名并最终展现给用户了。搜索引擎首先对检索类型词进行匹配。完全匹配则出现候选展示结果 H,赋予优先展示,然后按照匹配程度依次下降。如果有多个结果同时完全匹配或相同匹配,则处理词的密度。这就是我们SEO技术中的关键词密度运用的地方了。7 f. }2 `3 }8 I# p# D9 Q
: H m5 N4 o6 T0 N( i, d) Y/ d5 W, _& {7 K( O" W1 A2 m
1 U& H' T0 X, o4 F* G" C, K4 |
' \1 o4 E- W8 n: d- W
8 A& u1 ^% ?) F) {% A7 L0 A" g3 h
|