搜索引擎如何评估网页内容质量给予排名
0 F* R, B% y' {! ?+ B( r
8 G, l& }: o) s1 U* P( D搜索引擎如何评估网页内容给以排名?放在互联网上的一个网站,需要有好的网页质量,才能被更多的用户浏览。怎样的网页才是搜索引擎认为好的,满足用户需求的,用户认为好的?搜索" x+ w/ ]: G) H& S
7 m; Z* g; \8 `- Z$ Z- B
引擎和用户对评估网页有各自的标准。下面分别进行介绍。
" ~( W* Q7 m# ?7 N( f- ^1 \
6 z2 b3 Z! p# G: b( ?
; E: {8 N/ F) x7 _0 U5 T5 s一、搜索引擎评估网页内容* y2 X* A1 S- m; m' A( F/ i
2 r3 s8 w4 \3 [+ ]
搜索引擎对网页中的内容给予不同的权重。但是,想要获得高权重,内容的质量一定得经得住搜索引擎爬取过程中的分析,最终搜索引擎才会决定是否给予页面高权重。分析页面内容,搜索
1 R8 ]5 S9 Y3 A5 T/ {
/ C1 w. Y. U; a! ^. |引擎会从以下几方面考虑。
/ j) @, @7 C- n+ G; s(1)页面内容与查询的语义关系是否匹配; `+ H% U9 K+ U2 A( z. f
用户进行查询时会输入关键词,搜索引擎通过这些输入的内容,来判断该内容是否可以出现在用户的查询结果中。搜索引擎通过分析页面中的词、词组,来掌握页面的内容,并建立相互之间& N8 J, Y. L6 P& h+ s
# y8 @6 n+ R8 a7 G- D% A9 K的关系从而掌握页面内容是否与用户的查询有关系。
[$ G5 ?) [# A' a. w% H, o(2) 通过判断内容的价值: A4 B. m' k# O
搜索引擎用于爬取页面的蜘蛛,会忽略代码里的很多内容,但是蜘蛛最感兴趣的却是代码里的文字内容。所以,页面的文字部分,是比较容易讨得搜索引擎喜欢的东西。下图所示的是网页的$ h# a2 J; F- V' a+ x* c( P$ S
/ v( z& z& I5 x5 W源代码,蜘蛛对于框选的文字,会比其他代码更有兴趣。! M# h4 f7 C" c
1 Q/ c" }/ z+ G! {
: p" d+ I: g6 d/ D
+ \' A0 p/ |2 p8 B5 D二、 用户评估网页内容
$ Z+ y" W, o8 {用户会根据搜索结果是否能够帮助找到想要的信息,来评价网页的内容。这里将用户的评估标准总结为如下几部分。
- O M- o- G2 |. l2 d2 h+ I7 h$ a(1)相关性6 Y4 L3 ?# o% ]6 c% ?2 }
相关性是指网页的内容与用户的搜索相匹配。例如,用户想知道“阈”字怎么发音,通过搜索,搜索引擎会给出搜索结果。如左下图所示,都是用户能够获取的结果,但很明显这个页面解决0 g8 }" v0 j# F! G3 v& g9 B. W
9 t6 K) p- a( K. R了用户的搜索需求。6 Q+ V1 c N4 U/ K9 }8 X
4 N- G. Y/ E m! v$ |' o' R: S(2) 有效性
, z- y( e6 U8 B, C- i3 Y4 I- b有效性,是指内容要对用户起到有效帮助。例如,通过搜索查找软件,实现软件的下载安装。该任务是用户在互联网上经常用到的。但是,在搜索的过程中,是否能够找到安全的可供下载的
$ u; _: T4 S/ T9 i
+ b. f) ?4 [; n& @* T8 Q软件资源呢?用户可能经常会碰到,点击进入网站,然后被要求注册才能进行操作的事情。- y- g5 W, |7 Z' e
又或者,用户想要下载软件,但被要求付费。这些有权限限制、需要检查资源是不是能够有效实现下载的结果,都无法真正满足用户的需求。
# @+ l1 @& M1 l/ t7 ^; k(3) 全面性" I! d- T7 }- O+ S9 {
全面性,是指内容要尽可能的全面一些。例如,用户在搜索某一新闻事件的时候,单个的页面往往无法满足用户需求,因为不能够全面地发布新闻事件。这时,如果通过一个专题的形式,就1 o! W, l5 O5 L* i1 R* ^' i
+ U; U! O: K, b) y! @可能提高页面的质量,使内容变得更加丰富。' G2 U3 ]: S0 F6 C
(4)及时性
4 E# k* s1 G; {及时性,是指网页的内容要最新、最快的。例如,用户搜索“招聘”信息,然后用户获取的是一个月前或者一年前发布的信息,又或者是已经过了招聘期限的信息,这样的内容就等于是无用) F2 O4 `, \& w9 O
+ Z! T/ C; F3 P( h/ \; ^信息了。所以,内容的及时性很重要。' l- b, f% u! T( J
(5)权威性' G$ V. H8 w9 E* U3 v
权威性,是指网页的内容由相关专家或者网站发布,更能让用户有不同的感觉。例如,同样是一个新闻事件,在大的网站比如新浪网进行新闻发布,与在个人的博客上发布,前者更具有权威9 _, B/ V y: [' i. ~
/ D4 l* ?" K' ^; h3 l Z
性。
8 a3 S8 P9 b# n8 G(6)便捷性
1 X9 H" o/ T. r% K' P便捷性,是指用户浏览网页内容的过程中,看到内容所花费的时间和成本越少,越便捷。例如,同样的内容,一个网页可以在第一屏就让用户进行浏览,另一个需要用户进行点击或者在其他2 v' V0 }% w1 j8 {6 q& U4 { T7 l
" J! }$ j0 [$ R7 s: l2 s的位置才能看,用户肯定会选择能够直接看到的。
% N; }7 e! Q* g三、百度如何站在用户的角度评估网页的质量
2 i3 O( x9 E. \1 \" A* o) R4 y百度在几亿中的某个网页给予排名,不但需要通过百度层层的排名算法,同时,也要结合用户体验的角度去评估网页,用户体验一直以来是百度唯一在努力的算法之一,那么,百度如何站在5 ?# K: M, Z* Y' z* _6 H9 l" a
& I( ^, k( B. g5 R用户的角度评估网页的质量给予排名呢,只要体现以下几个方面。
( A0 b: _0 r' X! S5 o0 Y% \' w(1)点击率,点击越高的网站,百度给予的权重也会高,证明用户在百度搜索结果之中你的标题与用户的搜索需求相结合,匹配度较高。 I' ?2 q' c. F5 @/ [- b8 y+ e
(2)页面停留时间,一个网页被用户点击进行浏览,页面的停留时间是网站有没有用户体验的唯一根据,页面满足用户相对来说停留的时间会比较久一点,一般以内容大小相对比,内容小浏
/ z! ~/ v0 g9 c1 Z6 f* C& ]0 t8 m3 ~+ G5 g- Y
览的时间也会比较小,但这不会有所影响,原因看下一条。
/ A( f0 Z B) Z$ |) X( N(3)是否满足用户的搜索需求,用户从百度搜索、点击、浏览到关闭网页,该网页是否满足用户的搜索需求极为重要,百度如何判断,按照用户搜索习惯,如果某个网页已满足用户的搜索需8 K0 W# x. l: J7 M- |; c
) p9 x: U" |5 h1 g
求,首先,他会关闭这个网页再关闭百度的搜索结果,从这一点百度完全可以判断出来,再次就是如果某个网页已满足用户的搜索需求,首先,他会关闭这个网页再用百度搜索另一个需求,
$ N, i2 z) ?+ L/ c6 B$ S- z) N2 H
: b# [( ~# t0 j" _& }5 }; @从这一点百度也完全可以判断出来这个网页的质量较高,需求的匹配度达到100%。
7 I9 E/ a C# T& o8 v) V$ m( T Z( o9 y6 A; B9 F
搜索引擎如何评估网页内容质量给予排名 笔趣阁www .ebiquge.com 整理4 T9 |* P' ^5 L6 N0 y R
7 Y% C. r; C2 r& n$ X* J2 A |