Google搜索引擎采用的核心软件称为PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1 ~10级,10级为满分, PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页别由此成为Google所有网络搜索工具的基础。
* o' m" u+ u. P, y4 y8 Y& M/ | C
. U9 E7 J5 t1 N: l. i 1.网页级别概述
]3 Y1 u u9 t% l* X L% _5 F0 T, N' |0 m+ \; M' Q: @
当从网页A链接到网页B时,Google就认为“网页A投了网页投B一票”。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其他网页的“重要性”。重要的、高质量的网页会获得较高的网页级别。Google在排列其搜索结果时,会考虑每个网页的级别。当然,如果不能满足用户的查询要求,网页级别再高也毫无意义。因此,Google将网页级别与完善的文本匹配技术结合在一起,为用户找到最重要、最有用的网页。Google所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足用户的查询要求。
- f# H9 Y( Z" T$ V* q1 X/ e5 v1 C
2.PR值算法原理
9 t7 ]* @+ G! @ g# y6 C, ^1 C4 p8 {4 X) j. y
(1)如果一个网页被多次引用,那么它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用。那么它也可能是很重要的;一个网页的重要性被平均地传递到它所引用的网页。这种重要的网页称为权威网页。
# t* Z& q+ ~( W" T7 |* \# h; F g, J4 T
(2)假定用户一开始随机地访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRanK值。
; c% t% C/ L7 {. W4 R
" j* R* x8 I$ }7 q 3.影响PR值的因素6 v. x+ O. T. @9 y2 z; Y
* u, Z2 {6 x5 j3 n3 v" f& _9 U/ ` PR值体现为从0~10的11个数值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础,4级PR算达标,5级PR可谓良好,而6级、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。http://www.0411nnn.com/npx/npxyf/447.html
9 Z0 T6 A z: f, @ |