网站的内容越来越重要了,那么,搜索引擎是怎么判断什么样的内容是高质量的重要的呢?我们先来看看搜索引擎的工作原理:4 S3 h- O' d4 I
一、网页搜集, h1 R2 w; X: b' `7 o* h
搜索引擎通过蜘蛛来爬行获取网页,行性报告书>当蜘蛛爬行一个网页的时候,就会返回http状态码,通过返回的状态码做出初次判断:1、网页是最新的页面;2、蜘蛛有收录的页面;3、与蜘蛛收录的文章有很大的篇幅都是相似的页面。很显然,第一种对于内容方面来说,是相对后两种都是质量较高的。 + Q/ F0 ]# R# q 二、蜘蛛处理网页 $ X2 D* Z8 [# N* F' ~9 a 首先蜘蛛会去掉网站中的一些代码,并对一武汉白癜风http://www.hbbdf.cn些助词做删减动作;其次,提取此篇文章的关键词,在数据库中一一对应存储;最后,网页关键词的重要程度分析,实现初步数据库排名。 " c1 C4 o8 \% @; Z S a 三、查询返回结果/ E0 W6 _- T( b
客户通过百度查询,百度通过遍历数据库,得出结果,上市咨询>返回给客户。 % u( v3 t; N) n, z5 i 很显然,第二点蜘蛛的处理就可以得到这篇文章的重要度。那么,怎样让我们的文章让蜘蛛认为是高质量的呢?我们可以做的事情就是:首先,网站的内容尽量是同一个行业的,这样蜘蛛爬取存储的时候不会涉及到很大的数据之间的“颠簸”。其次,内容中尽量多的出现百度数据库中现有的关键词,这样涉及到的方面较多,百度也就会更加重视这样的内容。最后,内容中的关键词最好具有各种组合,这点就要考虑到百度的分词了。 h7 Y+ X' @2 O2 M& q4 i
& ~$ o! T3 c& [+ D. T0 N, ?. q0 X