搜索引擎如何评估网页内容质量给予排名' l. `% h2 ?' I x! W- m/ z
# d4 C; M- @4 e1 v5 K2 w搜索引擎如何评估网页内容给以排名?放在互联网上的一个网站,需要有好的网页质量,才能被更多的用户浏览。怎样的网页才是搜索引擎认为好的,满足用户需求的,用户认为好的?搜索- q! G& o# \& [$ u. Q6 ^
- F: I1 \3 S0 K
引擎和用户对评估网页有各自的标准。下面分别进行介绍。+ O0 v0 U! z) _7 ] j7 Y
# g+ J% i7 Y% x
* H5 n% m( Q/ c/ p一、搜索引擎评估网页内容
$ k2 g5 |8 |* }; B% A# l& x9 B, F7 Q$ R* j0 A3 }" L4 H
搜索引擎对网页中的内容给予不同的权重。但是,想要获得高权重,内容的质量一定得经得住搜索引擎爬取过程中的分析,最终搜索引擎才会决定是否给予页面高权重。分析页面内容,搜索5 g& j. h; N9 Q [+ O/ b4 ?# ]
9 I# Y# F" q2 @% G: q& z- E引擎会从以下几方面考虑。
! Y9 g& s0 a3 o( O' W" l$ {(1)页面内容与查询的语义关系是否匹配& |; h ?. c! }6 D' r+ `
用户进行查询时会输入关键词,搜索引擎通过这些输入的内容,来判断该内容是否可以出现在用户的查询结果中。搜索引擎通过分析页面中的词、词组,来掌握页面的内容,并建立相互之间
; f {' I. `' Z$ `% _! U; T: e- O( Y0 o0 x% m
的关系从而掌握页面内容是否与用户的查询有关系。
4 H5 f9 Z) t1 p0 J7 H+ J. I0 g H6 w(2) 通过判断内容的价值& A& R! @ \+ f. O8 o4 g" q
搜索引擎用于爬取页面的蜘蛛,会忽略代码里的很多内容,但是蜘蛛最感兴趣的却是代码里的文字内容。所以,页面的文字部分,是比较容易讨得搜索引擎喜欢的东西。下图所示的是网页的$ k7 d: J5 x# H# X# T
8 I0 ~) y6 F, U, x源代码,蜘蛛对于框选的文字,会比其他代码更有兴趣。
; i1 ~( m7 W/ k! l$ \9 D2 w' F8 f4 m/ i: i2 h
% S1 k1 W, Q, O, R* C
2 Z2 a) ^5 w& e& U& \: e二、 用户评估网页内容# i. l0 U' r0 {. n
用户会根据搜索结果是否能够帮助找到想要的信息,来评价网页的内容。这里将用户的评估标准总结为如下几部分。" G2 q4 k" p- S2 N$ a% r7 ?
(1)相关性
% L% z2 f# U+ ^' q* ?( N( O8 y) g1 Y1 }, u相关性是指网页的内容与用户的搜索相匹配。例如,用户想知道“阈”字怎么发音,通过搜索,搜索引擎会给出搜索结果。如左下图所示,都是用户能够获取的结果,但很明显这个页面解决
( `1 E7 E& u y2 X* K& X* R# G0 |! i8 {
了用户的搜索需求。9 E6 v7 C) |+ |, G
7 N( c, C$ S, }/ M
(2) 有效性: m" V' L) I* p- B# g
有效性,是指内容要对用户起到有效帮助。例如,通过搜索查找软件,实现软件的下载安装。该任务是用户在互联网上经常用到的。但是,在搜索的过程中,是否能够找到安全的可供下载的
e8 ^8 t0 I# R& @ H& { N
% t' l5 N6 g+ S软件资源呢?用户可能经常会碰到,点击进入网站,然后被要求注册才能进行操作的事情。
" F9 i* }! d7 q8 \/ ?" V) y6 V& s: f又或者,用户想要下载软件,但被要求付费。这些有权限限制、需要检查资源是不是能够有效实现下载的结果,都无法真正满足用户的需求。
$ S8 j$ W7 _3 w7 x! |4 p(3) 全面性9 @' i. e2 G, T. q
全面性,是指内容要尽可能的全面一些。例如,用户在搜索某一新闻事件的时候,单个的页面往往无法满足用户需求,因为不能够全面地发布新闻事件。这时,如果通过一个专题的形式,就
- s, w# s+ k! c! `% @
( M/ t* B7 s* y8 \ S可能提高页面的质量,使内容变得更加丰富。& N: t1 e0 h% ]7 M9 u
(4)及时性
3 K- d7 O% V$ U& D/ [. y. U2 M" h及时性,是指网页的内容要最新、最快的。例如,用户搜索“招聘”信息,然后用户获取的是一个月前或者一年前发布的信息,又或者是已经过了招聘期限的信息,这样的内容就等于是无用% M- |4 g( u! c4 G# I
) m% C' L. p7 n信息了。所以,内容的及时性很重要。
7 f2 V3 B3 w; D(5)权威性
8 w4 Z& a8 Y$ F) r- n' \, T5 e% @权威性,是指网页的内容由相关专家或者网站发布,更能让用户有不同的感觉。例如,同样是一个新闻事件,在大的网站比如新浪网进行新闻发布,与在个人的博客上发布,前者更具有权威* i3 e2 M9 _/ n: }2 |; y
( _) s8 M9 T1 j4 X性。
$ d: c" v7 `* c(6)便捷性
! z2 `* t j, k便捷性,是指用户浏览网页内容的过程中,看到内容所花费的时间和成本越少,越便捷。例如,同样的内容,一个网页可以在第一屏就让用户进行浏览,另一个需要用户进行点击或者在其他$ a. I [% Q, b' [4 F& }; _
( T% p; }0 X- U* l) G5 n+ A4 J* {5 u
的位置才能看,用户肯定会选择能够直接看到的。
8 w& R! W) _, f, `; w三、百度如何站在用户的角度评估网页的质量+ _6 X. [4 H \8 k" m. l
百度在几亿中的某个网页给予排名,不但需要通过百度层层的排名算法,同时,也要结合用户体验的角度去评估网页,用户体验一直以来是百度唯一在努力的算法之一,那么,百度如何站在
8 n' v( U1 _: {4 [3 j4 ]
3 i; s5 ^* L' j* U3 r用户的角度评估网页的质量给予排名呢,只要体现以下几个方面。, @& B- @' R" e
(1)点击率,点击越高的网站,百度给予的权重也会高,证明用户在百度搜索结果之中你的标题与用户的搜索需求相结合,匹配度较高。
7 X* B( u3 U9 p) _2 g(2)页面停留时间,一个网页被用户点击进行浏览,页面的停留时间是网站有没有用户体验的唯一根据,页面满足用户相对来说停留的时间会比较久一点,一般以内容大小相对比,内容小浏
: b" O0 U' x6 L+ b/ U2 \8 M8 @* {; _; [% v; Q1 Y' s3 a0 e2 g# L! h
览的时间也会比较小,但这不会有所影响,原因看下一条。6 S$ \* P0 B* k- N, O! J
(3)是否满足用户的搜索需求,用户从百度搜索、点击、浏览到关闭网页,该网页是否满足用户的搜索需求极为重要,百度如何判断,按照用户搜索习惯,如果某个网页已满足用户的搜索需
% S2 X3 i8 g! r" o; a1 V$ I" x. m( J0 S$ S2 ?" g- C
求,首先,他会关闭这个网页再关闭百度的搜索结果,从这一点百度完全可以判断出来,再次就是如果某个网页已满足用户的搜索需求,首先,他会关闭这个网页再用百度搜索另一个需求,8 x4 b9 p8 J3 I8 k
# M' @0 L' ~1 m6 c
从这一点百度也完全可以判断出来这个网页的质量较高,需求的匹配度达到100%。
" R2 H. U2 j0 B7 ^+ L6 r0 w' I/ Z/ \9 ?+ ^" c7 w+ D
搜索引擎如何评估网页内容质量给予排名 笔趣阁www .ebiquge.com 整理
$ ]$ P" m/ E3 z; l0 Y; T
, t$ `* p/ |& ` r/ y |