搜索引擎如何评估网页内容质量给予排名7 t) M1 @( q4 ^( d" Q7 {
8 `2 {3 m% \$ R6 } ]; T h# U) g
搜索引擎如何评估网页内容给以排名?放在互联网上的一个网站,需要有好的网页质量,才能被更多的用户浏览。怎样的网页才是搜索引擎认为好的,满足用户需求的,用户认为好的?搜索
/ _2 m( }1 t& \1 v+ a! l( Y( C3 E) I; O& O0 }
引擎和用户对评估网页有各自的标准。下面分别进行介绍。
) W# C7 b$ f) g' q S9 ?- w
# Y# ?3 q# N8 x) T# C8 Q
" g( V" v) }" f; Y! L, ~2 {# A一、搜索引擎评估网页内容
: H+ C% M5 {" {* A, }2 Z! V
7 p3 [/ d* a" H& e搜索引擎对网页中的内容给予不同的权重。但是,想要获得高权重,内容的质量一定得经得住搜索引擎爬取过程中的分析,最终搜索引擎才会决定是否给予页面高权重。分析页面内容,搜索! M( a1 O! e8 u+ I% X) B7 M
- F2 x& b! ] L- y) @9 t* i; x7 E引擎会从以下几方面考虑。, e# k4 l/ |( h9 X0 H6 A* w; m
(1)页面内容与查询的语义关系是否匹配$ \+ O2 \# ^! U! F
用户进行查询时会输入关键词,搜索引擎通过这些输入的内容,来判断该内容是否可以出现在用户的查询结果中。搜索引擎通过分析页面中的词、词组,来掌握页面的内容,并建立相互之间' i. s `" K1 R
' p3 K1 q1 ?2 a ?/ n的关系从而掌握页面内容是否与用户的查询有关系。; H6 U) Z% C5 e C, f" {
(2) 通过判断内容的价值- i5 S: t- }- |1 P
搜索引擎用于爬取页面的蜘蛛,会忽略代码里的很多内容,但是蜘蛛最感兴趣的却是代码里的文字内容。所以,页面的文字部分,是比较容易讨得搜索引擎喜欢的东西。下图所示的是网页的/ t2 W. ]! n O" w" _
: s: b o" ~7 Q8 k6 o+ X: {源代码,蜘蛛对于框选的文字,会比其他代码更有兴趣。" I1 a* v; g0 U! H3 T& Q7 y
" I1 V5 ~* q# K2 |( Q
6 j8 Z' }) f. {) U9 T" O/ }
, \, C# J1 W4 y: {0 x. ], `4 V二、 用户评估网页内容
% j# ]; m3 b+ A0 R+ T3 f用户会根据搜索结果是否能够帮助找到想要的信息,来评价网页的内容。这里将用户的评估标准总结为如下几部分。
* J) o5 D Z& `, j6 _* K5 A: \ e(1)相关性1 b8 t/ V0 ]& W/ _& O
相关性是指网页的内容与用户的搜索相匹配。例如,用户想知道“阈”字怎么发音,通过搜索,搜索引擎会给出搜索结果。如左下图所示,都是用户能够获取的结果,但很明显这个页面解决1 }# e- Q, S- k: Z/ I
4 ?- h5 f- @* b+ w8 I) q
了用户的搜索需求。& N% |! g% L$ \; V# d l; U( S/ Z
5 T' m7 h" a2 f/ M% X6 P(2) 有效性
0 O5 c8 G9 L! i7 G& q9 B; s有效性,是指内容要对用户起到有效帮助。例如,通过搜索查找软件,实现软件的下载安装。该任务是用户在互联网上经常用到的。但是,在搜索的过程中,是否能够找到安全的可供下载的& P9 {8 L% H9 I( q
# j) A" X- a4 c
软件资源呢?用户可能经常会碰到,点击进入网站,然后被要求注册才能进行操作的事情。
0 T m: l- ~, z% ~又或者,用户想要下载软件,但被要求付费。这些有权限限制、需要检查资源是不是能够有效实现下载的结果,都无法真正满足用户的需求。
^. m9 `5 u. E3 T2 Y(3) 全面性6 b8 A, o- R1 S! H4 r! _
全面性,是指内容要尽可能的全面一些。例如,用户在搜索某一新闻事件的时候,单个的页面往往无法满足用户需求,因为不能够全面地发布新闻事件。这时,如果通过一个专题的形式,就$ f/ _& |! I. b$ s
$ j/ ]3 }) N0 Z可能提高页面的质量,使内容变得更加丰富。% r: Z1 e- j$ k( X! r% K! ^
(4)及时性$ [$ H1 S. M5 y( T+ X% q
及时性,是指网页的内容要最新、最快的。例如,用户搜索“招聘”信息,然后用户获取的是一个月前或者一年前发布的信息,又或者是已经过了招聘期限的信息,这样的内容就等于是无用
, ^# x1 K9 x h0 g2 K+ c- i, k1 A$ x0 G9 c- Z+ H$ H! N2 _7 a
信息了。所以,内容的及时性很重要。" x% B+ I4 ~7 \+ J6 @+ t* f
(5)权威性) r6 |# \( x9 S* x; |
权威性,是指网页的内容由相关专家或者网站发布,更能让用户有不同的感觉。例如,同样是一个新闻事件,在大的网站比如新浪网进行新闻发布,与在个人的博客上发布,前者更具有权威6 N8 }0 ^4 t9 R4 F1 d9 n
! p- m: k# s5 e- y4 P8 e
性。8 W0 v, g& c6 E# c3 v
(6)便捷性
) Z( L9 N1 [7 p* C) E$ A; A! C便捷性,是指用户浏览网页内容的过程中,看到内容所花费的时间和成本越少,越便捷。例如,同样的内容,一个网页可以在第一屏就让用户进行浏览,另一个需要用户进行点击或者在其他
8 P8 r( v! n3 k6 L& [( E1 }% Y: T1 Y
c# p5 D, N% `: ?. h6 {的位置才能看,用户肯定会选择能够直接看到的。
6 q5 s0 p2 V, x8 h# F' M0 R) z三、百度如何站在用户的角度评估网页的质量% z0 d$ Q, c: y5 y$ B1 ~
百度在几亿中的某个网页给予排名,不但需要通过百度层层的排名算法,同时,也要结合用户体验的角度去评估网页,用户体验一直以来是百度唯一在努力的算法之一,那么,百度如何站在 o% N: x5 d- E2 H+ h) g& `
) r2 T; l. |. A8 ^用户的角度评估网页的质量给予排名呢,只要体现以下几个方面。
1 X5 I- u5 f- f; u7 z$ q# n$ q; @(1)点击率,点击越高的网站,百度给予的权重也会高,证明用户在百度搜索结果之中你的标题与用户的搜索需求相结合,匹配度较高。7 [1 B1 @' `% R! Y
(2)页面停留时间,一个网页被用户点击进行浏览,页面的停留时间是网站有没有用户体验的唯一根据,页面满足用户相对来说停留的时间会比较久一点,一般以内容大小相对比,内容小浏
! e7 ~5 n( d# [! B5 m# o1 d- l
) `- y! c) e0 q) t览的时间也会比较小,但这不会有所影响,原因看下一条。
6 G8 W8 W; R5 f(3)是否满足用户的搜索需求,用户从百度搜索、点击、浏览到关闭网页,该网页是否满足用户的搜索需求极为重要,百度如何判断,按照用户搜索习惯,如果某个网页已满足用户的搜索需- U" @9 k' `# q8 u" |: A( ?# `
& h9 y; A, E8 O' P& }& J2 r求,首先,他会关闭这个网页再关闭百度的搜索结果,从这一点百度完全可以判断出来,再次就是如果某个网页已满足用户的搜索需求,首先,他会关闭这个网页再用百度搜索另一个需求,
' T, j% k; Q9 g& y+ `, ?" t1 i% o) I; r2 F
从这一点百度也完全可以判断出来这个网页的质量较高,需求的匹配度达到100%。
- m* I; {( W3 j: \. l5 N! G; h; @: }3 V
搜索引擎如何评估网页内容质量给予排名 笔趣阁www .ebiquge.com 整理3 ^( m: z* W& D6 U
7 j1 b2 w) q! M& c( W9 p
|