|
|
1、什么是搜索引擎?4 ^, t3 E/ k3 V$ L6 y0 p6 m
" V4 t4 \8 o; y
简单来说搜索引擎就是指根据某种人工设定好的方式、计算法则从互联网中搜集各种数据信息,纳入自身的数据库后对这些信息和数据进行处理和排序后返回给用户相应的数据信息这样一种程序。经典案例就是百度、谷歌。
+ T! |7 a* _3 ^; S3 x1 ]) J+ _5 \( n! @) v& }
2、搜索引擎的工作原理
% i7 H" z9 f: u" R1 f2 w/ }. v+ D9 ~1 ~2 i# c
搜索引擎的工作原理网络上有各种版本,百度百科里有,百度知道里也有。前面已经提供了百度百科的地址,用户可以直接去查看,这里再为大家提供下百度知道里用户对于搜索引擎工作原理的解答。 k+ B( H/ k8 J; o
3 ~% \8 N; y% m
3、摘录部分:
4 F. H4 J( }2 e) X! |! M2 i: _1 b+ m" ?2 A
全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。6 C0 h7 x& y. ?$ Q& A9 F6 A
0 H( M5 @* U' }: J3 a
4、读者这里根据自己的经验和理解为大家阐述下搜索引擎的工作原理:: u4 c/ ^0 g6 S' c9 N+ ?( u4 x
1 _" R' T Q( a4 `, }0 t8 e
搜索引擎的工作原理基本可以分为三步!4 A& H; `5 J; i& r- ~
4 v6 `- E1 z0 G% n8 K 第一步,采集也就是我们通常说的蜘蛛爬取的过程,也就是直接反映的我们网站的收录情况,搜索引擎根据一定的规律在互联网上通过链接的方式进行爬取,根据网页权重的大小和文章价值与原创性的高低等信息决定爬取的深度和总数。爬取结束后放入索引库,里面有各种表单用于分析处理这些信息,以备后台处理排序最终呈现给用户。
2 N Q4 U0 r- `, v* g6 }& O( f: ]) ]5 { c2 Q+ A- t
第二步,计算也就是我们一直渴望了解的搜索引擎的算法,搜索引擎都有着各自的算法,并且作为绝密保守着。虽然完全的意义上的算法我们无法一探究竟,但是基本的算法我们是可以了解的。例如这种排名通常涉及:关键词分布、关键词密度、网页权重值、外部链接形式等等。因为篇幅这里不做深入的讲解了。6 T, ~/ p) U. @
! z6 z6 W+ v8 u. p 第三步,呈现,也就是我们在搜索引擎中输入关键词之后所呈现的结果,搜索引擎所呈现的内容也是一直在变革的,但总体是更为公正的为用户提供最有价值的信息,并确保满足用户的各种需求,也就是我们一直说的用户体验改善。/ p, ^) [& u1 J* N; i
2 v# G. D" ^$ T; z7 B9 j 其实关于搜索引擎的工作原理我们不用了解的十分的透彻,了解下基本的原理就可以了,更多的算法需要我们在实践中去摸索和掌握!
3 e7 u* `: [8 o' E
! X# ]- N x# Q+ ]6 N5 x |
|