带你了解百度工作原理
1、基于字词结合的信息处置方式。巧妙处理了中文信息的了解成绩,极大地进步了搜索的精确性和查全率。2、支持主流的中文编码规范。包括GBK(汉字内码扩展标准)、GB2312(简体)、BIG5(繁体),并且可以在不同的编码之间转换。
3、智能相关度算法。采用了基于内容和基于超链剖析相结合的办法停止相关度评价,可以客观剖析网页所包括的信息,从而最大限制保证了检索后果相关性。
4、检索后果能标示丰厚的网页属性(如标题、网址、工夫、大小、编码、摘要等),并突出用户的查询串,便于用户判别能否阅读原文。
5、百度搜索引擎支持二次检索(又称渐进检索或逼进检索)。可在上次检索后果中持续检索,逐渐减少查找范围,直至到达最小、最精确的后果集。利于用户愈加方便地在海量信息中找到本人真正感兴味的内容。
6、相关检索词智能引荐技术。在用户第一次检索后,会提示相关的检索词,协助用户查找更相关的后果,统计标明可以促进检索量提升10-20%。
7、运用多线程技术、高效的搜索算法、波动的UNIX平台、和本地化的效劳器,保证了最快的呼应速度。百度搜索引擎在中国境内提供搜索效劳,可大大延长检索的呼应工夫(一个检索的均匀呼应工夫小于0。5秒)
8、可以提供一周、二周、周围等多种效劳方式。可以在7天之内完成网页的更新,是目前更新工夫最快、数据量最大的中文搜索引擎。
9、检索后果输入支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择工夫范围,进步用户检索效率。
10、智能性、可扩展的搜索技术保证最快最多的搜集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最精确、最普遍、最具时效性的信息提供了坚实根底。
11、散布式构造、精心设计的优化算法、容错设计保证零碎在大拜访量下的高可用性、高扩展性、高功能和高波动性。
12、高可配置性使得搜索效劳可以满足不同用户的需求。
13、先进的网页静态摘要显示技术。
14、独有百度快照。
15、支持多种初级检索语法,运用户查询效率更高、后果更准。已支持“+”、“—”、“|”、“site” 、“link”, 还将持续添加其它高效的搜索语法。 刚好遇到类似问题,看完这个帖子心里有底了 楼主太厉害了,整理得这么详细,必须支持 完全赞同,我也是这么认为的,英雄所见略同~
页:
[1]