大家都知道,十几年来,百度一直牢牢占据着国内搜索引擎霸主的位置。弄懂了百度算法,就意味着Hold住了网站排名和流量。曾经多少年来,无数SEOer为研究百度的算法呕心沥血,对于弄清百度排名算法成为了一代又一代站长的最高目标。3 ]# N# ]7 U! N
首先申明下,刘兴时今天分享的内容要感谢圈内朋友赵一鸣、子墨柔情等人的大力支持。这一章节的内容比较长,刘兴时这边根据各方面数据整理的百度搜索引擎算法有260项,光整理此篇文章都花费了我半个月时间,这也印证了Swowhy好长时间都见不到刘兴时的一个原因了。& Y- l/ b: A" P9 z
百度算法从未对外公布过,以下算法心得均是刘兴时8年来总结推测和资深站长**。打算长期从事SEO工作的新手,强烈建议收藏哦,希望对大伙儿在操作SEO过程中有所帮助!哈哈,废话不多说了,直接进入话题!
3 \8 o6 i# n# S* r% Z& n1 F7 A' \( g 百度算法规则
6 d) n4 O7 ?- _ e% F 刘兴时曾几何时,从来不相信百度的算法有那样的神奇,但是百度确针对这一系列的算法做出了公告与K站降权的举动,不得不让我仔细分析百度算法的原理,以下几个算法仅为刘兴时个人推测。$ i5 H* z! |$ Q
百度绿萝算法:我一直不相信百度绿萝算法竟然可以算出来你的链接是否购买的,但是实际百度却做到了,其中主要原理还是根据一个网站对另一个网站的链接判断,是否有反向链接、链接个数来进行判断。4 u; z7 `& S' @$ U
百度石榴算法:石榴算法主要打击的对象为低质量页面,其中百度蜘蛛主要是根据网站html代码来抓取的,并且搜索引擎根据文章的标签(包含排版)、重复读来进行判断网站的质量。
: g* n/ `8 z) A0 t. q0 O 百度星火计划:星火计划的原计划是为了打击抄袭者,其星火计划的原理非常简单了,也就是判断重复读来决定网站是否抄袭,同时百度蜘蛛也肯定了自己的抓取程序,目前正在往每一个网站时刻爬取靠拢。
. Z% B5 h" ~/ L1 [8 q 百度瑞丽算法:2015年元旦,百度内部相关程序出现了一些故障,导致国内大量的CN和CC域名站点被K,而不少人预测这是瑞丽算法上线的结果。不过刘兴时从种种迹象推测,瑞丽算法应该是一种误传。/ ^3 z6 n6 l" R C
+ h1 k0 w9 g' R0 R& b
收录规则
_) f7 A8 r& N7 `* s 要想有排名的前提下是收录,要向收录的前提下是有内容,所以很多网站内容太单一是很难被收录,但也有网站明显有内容就是不收录的,我是这样理解收录的。+ U7 n, Y' \, n, w
抓取:百度收录一个网站或页面的前提是网站被百度抓取过,也就是百度的机器来过你的站点,来你站点的前提是有一个入口,百度的入口有三个,第一自己提交、第二SEO外链、第三浏览器。浏览器大家可能不是很明白,当你的网站刚刚建立后,没有人知道你的建站建立好了,自然百度也不会知道,唯一知道的就是你自己了,如果你使用百度浏览器打开你的网站,这也就意味着,百度浏览器已经知道了这个站点的存在,数据也就交给了百度搜索引擎,从而达到了抓取的效果。光抓取还是不够的,不一定所有的内容都会被百度收录,所以他们收录也是要判断内容标准。! T4 _: q8 ?5 _
识别:抓取了一个页面,肯定是有内容的,如果说没有内容是很难被收录的,什么是没有内容的页面呢,比如登录注册页面,这类页面是属于有内容没有意义的页面。直接会被列入到空白页面,想这类页面,我们的网站还是非常多的,比如:关于我们、联系我们之类的页面。
! @0 O9 {% K/ I' o2 X 所以页面肯定得有内容,并且是可识别的内容,什么叫可识别的内容,就是文字内容,百度搜索引擎是机器在识别,当遇到视频、图片、flash的时候,他们不知道视频、图片里面展现的内容是什么,所以无法识别,所以前期最好还是以文字为主。" I, c5 }/ r1 }* z! n& A' R0 o
释放:最终才考虑到释放出来,如果释放出来后,这个时候你可以通过百度搜索你的URL,释放你的页面也是需要有条件的。
2 w- _ }0 N8 C5 [$ f G# \8 g$ e 首先会判断你的页面站外推荐很多,这也就意味着这个页面是高质量的页面才会被站外推荐,容易被收录,其次是被站内推荐,这也意味着是这个页面是高质量页面才会被站内推荐。说白了,要向释放出来的内容,绝对是高质量的内容,除非发生了下面这种情况。
' e; t" W( ^- O. }- R 最容易被收录的内容绝对是互联网新闻源最多的内容,说白了就是抄袭者很多的内容是最容易被收录的。这个时候太多人不容易理解了,抄袭越多越容易被收录?
7 A& T* n2 M' U 新闻内容是具有时效性的,当一篇新闻发布以后,马上就有很多媒体转载你的内容,而百度机器识别出来,很多新闻源有同样的内容,也就被列入了新闻的话题页面,从而这方面的内容收录也就非常简单了,不会等一天或几天后才收录,如果过几天才收录,这个新闻内容已经过时了,自然也就影响了百度的体验。
" x" p: Z2 z4 j5 L) m( [9 v" O
/ r w" Y3 k1 U4 i 排名规则9 B# W# W9 V: K, G* ]
参与排名的规则并没有想象中那么复杂,听到这位大哥分析了以后,自认为有一定的价值,其实无非就几个方面解决排名问题。' ]$ \ E b8 O8 R. d1 o& M5 c
得分规则:得分规则是根据一个网站的总体信誉度,比如网站的原创度、网站的停留时间、网站的跳出率、网站的打开速度、网站图片的处理、网站代码的优化等综合判断,总体被称为得分规则。; Y4 P: ~9 S' z7 _! s
点击规则:当你网站信誉度达到一个基础标准后,你网站会出现一些非常长尾的关键词,可能关键词排名并没有在首页,这个时候就是根据点击率的规则来计算排名的。如下图所示,当一个关键词展现量和点击率达到一个比例后,你的排名就会上前一个等级。而这个比例是根据用户的点击来计算的,并非百度定义的,比如搜索“**”这个关键词,排名第二的网页比第一的点击率还高,自然排名第二的页面会会给他排名第一。* O6 ~* @ z4 {6 F% D
链接规则:当你的一篇文章被站外链接过多推荐,这意味着这篇文章价值非常大,不然对方不会推荐,另外也被站内推荐多次,这也意味着这篇文章价值非常大,所以链接的规则就非常简单的,但是由于百度绿萝算法一直在打击垃圾外链,所以在链接上,最好还是自然链接比较安全。
8 x/ [& z3 n6 |5 ~7 p# b5 l \
& O$ ]$ a' e# o$ }9 {2 }" M/ P" h. u, `* z8 n7 d+ {9 V- N5 ?
算法规则(附部分)
+ H0 S6 y# @& b; w0 t 1、网站服务器的稳定性
9 K7 f2 d! T6 W& _6 \. i; ` 2、网站服务器的安全性7 } n! c! R* Q3 C5 F( L
网站服务器的安全是十分重要的,尤其对金融、旅游、移民等高利润行业站点。; Z8 R* s* N$ p9 @# P2 m7 c# ~5 R p
3、同IP下的网站越少越好
0 @* D/ q! y& o7 z4 j# U 4、同IP下的网站无大量被K* f. g( j2 w* v+ N
5、同IP下的网站无大量被降权
( g: H5 @& r8 \) \2 p; G8 j 6、转移服务器会影响网站排名& `) H: B* `( o* [
网站搬家、网站转移服务器会网站排名的,这里刘兴时推荐采用网站流量点击保护可以很大程度避免排名的下滑。
9 v w! a0 ~& \9 V 7、域名包含关键词(拼音、英文)( U K& z9 [$ S7 p [
就比如我做快速消费品网SEO排名,推荐域名中包含有seo等关键词。
6 l! P M; o- w! P9 t1 v6 S5 ?6 m6 f 8、域名年龄越老越有排名优势
3 `% {8 k1 e! G' O$ M9 K# ^ 9、域名主题的转换直接影响排名( Q6 Q- Q/ v$ ^5 g* W
10、备案对网站排名稳定性的重要
% \& | J3 J$ ~5 Z: F 11、最好采用DIV+CSS布局
4 w) k5 o7 W' s/ I2 i. j6 s 12、表格布局避免过多嵌套
- H4 Z! t* K$ j! v5 @# E 13、网页编码对网站的影响5 e% c/ z7 M* T) v4 q
14、整站生成静态HTML; o9 C3 d) z9 u- K+ r
静态化肯定是特别利于优化的,但是很多站长的空间没有那么大,这里刘兴时推荐可以采用伪静态的优化手法。
( O& y) \" O1 \, \ 15、动态URL的优化劣势' n. [1 ~5 P0 n1 }9 l; A0 y
16、目录的层次不要太深
) `; \# Z1 s2 S1 T 17、目录名称的优化8 g" }5 h1 {+ m2 B3 L! \# o* z" x8 j# c
18、网页URL不要太长
' d4 Q% V1 V5 G z+ V 19、网站内容的原创性
* n, I: M' E$ U* h1 d6 B 20、避免大量内容重复8 a; J* B+ x) l- ]
21、避免大量采集内容填充5 f4 J5 ?$ R2 G
22、避免大量页面内容相似度太高 i7 s( A3 b- t, c$ z( r4 a
23、网站内容不要出现违法字眼, Y$ D8 \4 e. W; n4 s' |; H" L
24、内容越丰富越有利于排名# z' ]) k) R0 m$ c. F
25、内容被收录的数量越多越好
& k/ C9 o; a- R/ C 26、页面大小(建议小于100K)0 f* |) ?& j3 l: e) ~
页面内容在满足用户需求的同时,尽量体积小些,比如百度的首页大小才4K。$ S" @8 ?3 b2 R! S( R! \
27、页面避免出现太多图片
, u5 H+ k) o& i( q- u5 H6 Y' \ 28、网站sitemap时时更新与提交8 e. \- J9 D6 V- Y5 J' b9 k
29、新页面产生的速率4 ]. g# V- v6 v; w9 M4 g
30、网站Meta的优化设计
; B5 @4 M0 W# }5 b' O3 q& e9 L3 n 31、Deion的优化设计
# |/ J3 P; q0 ~- r4 z8 s9 r, M 32、Keywords的优化设计# g, J: y( o4 i0 j% G
33、避免太多无关的关键词/ h1 W$ m9 c( o6 n6 |$ N
34、网页PR值对排名的影响
# t3 V! R- i) ]6 h 35、核心关键词的选取: Z% @2 i' b( h6 d# P8 t8 ~- T( y
对网站核心关键词一定要定位准确,快速消费品网(www.ksxfp.org)和fmcg虽然意思一样,但是优化的时候一定要有个针对性。比如:快速消费品发展前景,快速消费品销售管理,又能给用户最为顺畅方便记忆的标题。9 h3 K( L; r( t' \0 I; B4 s
36、扩展关键词的选取
+ S+ @4 q; w/ O: [# B9 y2 Z 37、长尾关键词的选择" O8 I9 f" [+ c9 V0 j
38、关键词在网站TITLE上的使用
2 r/ I. N: Z8 m: d 最好的关键词在title显示是一句通顺的语句,既适合搜索引擎的匹配抓取,又适合用户的浏览点击。
* H9 C$ N& X) ?5 ?9 I3 C0 t 39、保持网页Title的唯一性2 c% Y, V) @7 D9 h9 d# a
40、标题设计不要过长
) |) i; y% M/ _ 这里主要是针对快照索引字节,对手机站的标题就需要更少点,毕竟现在移动端站优化也是主流方向,对移动站标题的设计就需要更少字节。
0 O1 {, i7 A6 U9 f 41、标题不要堆砌关键词" R; G) V% b" z0 _+ H5 d$ T8 X
42、标题的分词描写规则. ^; i6 W' c$ ]* K
43、标题描写结合长尾关键词7 [* q2 t& T) @0 H* |
44、每个标题最好突出1-2个关键词
; {" K" |5 D) ]6 M& V7 L1 k0 q/ _ 45、关键词在Meta Deion中的使用3 p1 I" l( I, Q! S- N6 d
可参考刘兴时的SEO博客的deion写法" }* K1 @3 V3 U! A- F' O
46、关键词在Meta Keywords中的使用
7 H" I# [; W; v5 V 47、关键词在H1、H2、H3标签中的使用* E$ `5 r& C+ S" k, A& ^8 f
48、一个页面尽量只使用一个H13 J+ P- P2 H; B* m/ S
很多人都在好奇为什么我的快速消费品网一直排名那么好,其实大家可以仔细点开我的每一个内页,我的每一个内页的标题都是在 H1中包裹的。
2 U3 d- O9 @- l. S 49、关键词在页面URL中的使用2 _6 F" |- A: z5 c3 }) n
50、在url中使用"-"连接关键词,优化效果“_”等特殊符号。
9 `' ]) k" t' z: S! s& L 51、关键词与页面内容的相关性/ H' i/ q& R# d* }+ T) i
52、关键词的加粗优化
5 f2 P3 F8 O3 d9 N1 @6 u 53、关键词的斜体优化" N) u; v7 k, J1 y
54、关键词的下划线优化
, n0 y; S f& B0 [, e8 S 55、关键词的**灯优化
9 F3 Q2 q! V o$ l' n3 P 56、关键词字体大小' S, \; |2 ~ G, d
57、图片的关键词优化 alt标签* V; c6 ^$ `( P4 c+ a
58、关键词是否突出; T6 b# B) z# ~+ P$ b: V+ N
59、关键词的密度6%左右3 x# C9 F9 b: X, `" R. g0 T. ~( b
其实网站关键词密度这个事在网站优化过程中并没有那么重要,刘兴时优化网站的时候是不会刻意控制关键词密度的,除非碰到一些竞争超级大的行业(比如网贷、装修等行业站点)。
# F; v. c7 j; t; I+ y 60、关键词的集中+分散布局# Z9 C, T: } y2 K/ k! p9 _5 E
61、关键词的均匀分散布局
1 e/ Y" O9 X: d, V 62、网站内部链接结构(星状、树状)# {. ~; U, |( B, Q
63、网站内部链接结构(扁平)- }4 k' z5 {4 q% X
64、内部链接的数量
; |+ s* ^) q1 ?; x* ?# r# [ 65、内部链接相关性质量6 [7 Y6 z' Q$ V1 [
当两个网站不分伯仲时,这个时候对网站内链的控制就显得尤为重要了,网站内链相关性有多大,快速消费品网每个大栏目下面的相关推荐都是最相关的。快速消费品新闻的就推荐新闻,快速消费品销售管理的就推荐管理。
- V4 T8 t; l# a' N) y$ Z 65、内部链接的锚文字) D" d" O& ` ^8 }" j% {+ f
网站内链设置得当的话,不仅仅能提升网站主关键词整体的排名,还能提升网站长尾关键词的排名。
; l% e' t2 N0 Y/ u& p$ Z( { 66、内部链接周围的文字
' O i) ]) e3 n S# P 67、内部链接锚点避免单一
3 Q" C3 U2 d( }* ~. g# I 68、内部链接的多样化# m+ w8 M$ {# s1 a& H- E
69、内部链接相关文章交叉" _- q( W4 B6 _) v/ i
70、内部链接创建和更新时间
# d7 `: R* C* ~: p" U6 z 71、内部链接的加粗优化5 E- W4 j/ L! ?7 e& J
72、内部链接的斜体优化4 ]/ i% Y$ ]% H" a* J, h
73、内部链接的下划线优化
) Q) |& D8 [9 D6 v- R v" E 74、内部链接页面的PR值' Q! b' F" T6 A' o5 H( |( Z
75、内部链接产生的速率& y% H( S3 T2 ^: c
76、内部链接主题、页面内容与关键词的相关性7 `4 ~4 b+ @) T1 Y7 `8 F
77、内部链接存在的时间
$ ~1 O) b1 Y8 Z- O) e: |" G 78、确保站内链接有效
* l$ G8 H/ U, z' U+ A& c/ I 79、网站外部链接的稳定性
7 a" p9 J8 ~+ J# n, L 80、网站外部链接的创建和更新时间/ I5 [& ], D1 l+ X, C3 b) z7 _
我们都知道,网站外部链接是有生命周期的,友情链接时间越长越好,对为网站SEO优化主动发的论坛等链接时间越近越好。
9 f7 x5 y9 o" J) |; G 81、网站外部链接网站的PR值
# c: r; l# T3 I& @( }- @& Z 82、网站外部链接的主题、页面内容与关键词的相关性) Y l0 F* Q U/ ?' V. a a
83、网站外部链接产生的速率
! c/ S# K# i# o/ g( T( Z 虽然很多站长声称外链是没有效果了,但是经过我的实验,主动发的外链还是有效果的。
$ f2 t2 [5 K% S- _3 u! r/ ]7 M 84、网站外部链接存在的时长% L6 z& g# f' _: }5 P( Z
85、网站外部链接指向的页面有具体内容
4 P4 {$ C2 E) h4 w3 x 这里的外部链接通常指一些别人转发我们网站内容的链接,要确保转发到的平台是和我们网站内容相关的,这样才能保证高质量外链。
4 M0 O1 g7 t% A' ^8 E 86、网站外部链接的价值高于互惠链接
( z* B2 x0 S7 ]. R 87、外部连接(反向连接与友情连接)的数量
# o9 K3 [2 Y$ a- | f1 G7 y$ { 88、网站外部链接的锚文字7 K2 I/ W/ r- m* M' E: \+ M
89、网站外部链接锚点的多样化
' x( G8 u8 \9 M' O! F; A0 Z8 h 90、网站外部链接页面本身的链接权重、质量* d- G5 _1 F: Y
91、网站外部链接页面在相关主题的网站中的链接权重
4 C1 q- f. V! \# K' v9 ?6 A 92、网站外部链接的周围文字; R2 u: W( t( |* S) r3 B+ x! l, O
外部链接周围文字,这也是为什么我们最后找一些同行站的其中原因之一。
! ?8 U( {: R% m, }& o6 c 93、网站外部链接最好来自不同IP( U8 G8 D8 i$ m% {
94、网站外部链接的加粗优化
; c# K( t6 R& z9 |% N 95、网站外部链接网站域名的特殊性. H G- U. a: L7 ?9 H
96、网站外部链接的斜体优化
! o3 j9 O% X8 Q 97、网站外部链接的下划线优化
, s- g2 j0 l1 ^$ l" P7 N, V 98、确保站外链接有效" w! L! Y3 A8 f* C8 G6 Q8 L
有个别不道德的站长,采用nofollow链接手法骗取新手站长的首页链接,这里大家一定要慎重。. W% t4 @8 f+ @& [6 Z% b. W, p
99、导入链接增加速度 (导入链接的增加是有周期性的,每天增加可以循环上升)
- G8 a# Z' ` p e) ^3 @ Z+ A 100、导入链接文字不能经常改变
% S/ V8 Z# a7 |1 R& b 101、导入链接的流行程度$ E5 L! T: X1 L; d C6 h- S2 u
102、导入链接页面中关键词密度* s8 p6 l& s2 B; O; q0 D+ j
103、导入链接页面标题5 Y) T# n z6 D" |3 D9 G6 N
116、避免频繁修改网站标题、描述& p! J2 O* z# A# z0 @
避免频繁修改网站的title ,如果修改太频繁的话,容易使网站进入沙盒期。. O/ }. S, ~2 E6 x; [6 p# ?* {4 d
117、避免太快修改链接; j) P. x4 ?! O" o) H0 ^8 f
118、避免太快修改页面( p3 i+ @; G2 f+ f
119、避免过多的java8 s" G* e% b. d) ` G
120、避免使用Flash' i( p" w& b, k8 X W
121、避免使用视频& z7 Y9 A+ d6 c( M! L5 n
122、避免使用框架: S# i9 g# M8 `2 }# `+ M
123、避免使用一个像素的链接
' l! u$ q$ D; S' F3 Q2 w+ t6 J8 h 124、避免使用看不见或看不清的文字
! J) V$ A. f# s! @) x 125、避免存在不良的友情网站链接
. c; x. z3 Y8 s" a! n }$ o 126、避免细节点使用恶劣低级的语言
6 ^/ }1 r% }" Z6 K 127、避免导航结构避免使用图片3 s2 y& Y: P- d0 z
128、避免使用隐藏链接
" J& W5 j: r/ v! x j 129、避免隐藏或者堆砌关键词
. e9 M, O% G% g: l 130、推荐文章链接被大网站引用4 G R: }% M) B# T8 i; _
131、推荐文章被大量转载9 I. r' g; _& i. ~
132、推荐:搜索引擎快照更新及时& [( z s7 ?$ f# b: E, F ?( q
' W( l" z1 l7 H, i# h百度最新调整后的最新收录规则
0 \3 R' J% f) {1、百度对新站的收录时刻简短,从以前的半个月到一个月时间,简短到而今的一到两周。1 [6 g& m8 B. q. |' X: U7 _# h
2、新的站点,几乎不是多需要去注重外部链接数目及质量了,只需要你尽量做好站内内容的质量和经常更新即可。, X* B. ^# d5 R h1 x3 E" ?
3、百度网页的大更新是以前的星期三更新,更改为每一日更新。+ j! @, ?9 f' u. {! Q% r3 h
/ q5 S7 I3 u6 A% Z8 j; I9 F
百度对网站排名的降权规则/ c* R8 A8 o7 c4 r8 k; ]3 ^
1、网站有弹窗广告这样的站点,百度给以降权。" d# C# w! ~# G1 W! {
2、加盟链接联盟站点的给以恰当降权。" N4 \' K9 z9 T- b' H( y
3、网站页面、站点里面有大量JS代码内容的给于适当降权处置。
8 o. J* S4 Y# V1 M4、导出的单向链接过多,给于降权处理针对链接的站点。
+ A; R5 t7 ~7 ^2 N1 B2 X5 r5、友情连接过多的站点,或者是不美观站点友情连接网站的,给于降权处理。
2 m5 u3 N+ N3 c |