找回密码
 加入怎通
查看: 438|回复: 1

[站长八卦] SEO的数据分析概述与案例

[复制链接]
浅浅、笑时光 发表于 2012-12-16 13:10:38 | 显示全部楼层 |阅读模式
  经常有人让我帮忙简单说说SEO相关的数据分析怎么做,甚至期望能几小时速成。但这方面涵盖的太多,不可能三言两语就说尽,也不知可从哪里简单概括。! \" e7 o7 I- K7 m
+ k( j! K& c$ }$ U
  SEO是一个非常不成熟的行业,能参考的资料极有限,大多数东西都要通过数据来摸索,而摸索的过程中,往往能揭露凭过往的直觉没有意识到的真相。所以数据化有时对于SEO是非常残酷的,往往一份简单的数据就可以否定掉一群人数年的努力工作。' K% g1 G1 S. v9 l0 b& R% e  s
0 U; O$ v+ F8 ~) B
  就拿最常见的例子来说,SEO流量是怎么组成的?大多数人觉得那是靠热门关键词撑起来的,或者认为是大量的热门关键词撑起来的,于是认为热门词的排名上去流量肯定会涨,却不然。对于大多数稍大的网站,绝大多数SEO流量都是由百度指数都没法看到的极其长尾的词带来的。因此哪怕用再大的力气去做热门词的排名,它们贡献的流量依旧很有限。
! O) L+ V8 D. x, M
3 }! h# @( s# @& \8 X+ K* r8 p  或许有人会认为这不可思议,因为从来没看到过这样的数据。但这数据是只有通过分析网站的原始日志才能得出的结论,而Google Analytics此类采样率极低的统计系统无法看到这样的数据。更不提哪怕会熟练用GA的SEO也甚少,因此SEO流量的真相几乎是从不被人看到的。1 \) Q. j% M& p/ T

$ z& M3 O5 g3 k% D  所以,有时听人说“SEO已死”,而我经常说“SEO还没活过”,一点也不夸大。
7 {8 z3 o9 K  D/ \4 @1 M5 }- {
/ `* K2 a5 g- ~6 x  如何开始学习数据分析
. d1 p5 U, r7 G: e7 J3 l5 n/ h* F9 w) V# _$ A2 b4 }
  SEO的最终目的是给网站产生收益,因此核心指标有两个:转化、流量。
( s9 [- k- \3 s4 y5 O8 r
3 ?' D* T' T/ N5 F) O  比如流量再可以细分:流量 = 收录 * 排名 * 点击率 * 搜索量收录可以再细分:收录 = 抓取量 * 页面质量
' n- l% G: ?5 `. n' Y* u% K7 @. C6 b) l) |  E3 `
  而比如抓取量,它的瓶颈依情况,可能是抓取时间封顶、可能是抓取总量封顶、可能是页面总量封顶。各种情况都有不同的处理方式,需加入不同的数据指标。( ?; M3 l8 I, z1 i# g$ B
! U9 ?/ B# z5 ?. y
  通过类似这样的分法,从最终数据指标(转化、流量)可以逐步细分出几十几百个数据指标,这些数据指标都是有用的,因为它们的数值变动以后,最终也会影响到转化或流量。
. @! c' S6 ~: c: v1 |3 y7 R& M' H7 b! ]( m; m
  (有本热门的SEO书籍,花了很大的篇幅去写了对一个网站分析并操作的实例,但最后那个网站的SEO流量却很低,没见多大效果。因为尽管其中有大量的“分析”,却多是在看没意义的数据。)当一个主要数据指标产生波动的时候(最常见的是总流量变动),就需要通过细分数据来分析具体的原因,后面有两个举例提及大致思路与步骤。
& m, x  S7 b: Z2 o5 U+ R% Z4 |) ~
: i$ D- u( s1 {. \7 ^2 }- Y  之间涉及到的面则非常广——
  \# M2 K: k6 S# ?! V9 F; n& c& M0 M
  首先要了解搜索引擎的基础原理,这才能知道在什么情况下什么数据指标是有关的;之后需要对多种技术的入门级知识,因为各类数据的获取方式都不同,有些需要采集、有些需从日志提取、有些从数据仓库导出、有些从API获取等等,需要学习的方向不尽相同;单单的数据只是数字,还需要分析数据才能让它产生价值。临时性的分析一般用到Excel,监控类的分析则需要自己做个能输出图表的报表系统。
5 P5 b  t1 L, |+ K/ i  V9 T6 l8 W% k2 [1 P; Y) p6 J& @
  这些至少要花个半年功夫才能学会,但并不算难,没有什么可畏惧的。就如学习1+1时都会觉得9*9是难的,但学会后再往回看,那就没什么了。. c& B3 l( H& O3 q7 t
1 A$ d6 T, B( F% z: x& f' _8 n# t. T# X
  一个基础的假想案例分析
0 `, i+ o" ]/ z  {/ ^/ k% h1 p9 o+ l$ k0 X, S- X5 D! K% o
  假设个较接近于实际应用的例子:+ P1 M3 J0 e# E% A! @2 i, k' {

; e0 S* p0 X% `/ w- S8 e  一个游戏类论坛,A板块为网盘游戏下载,很多页面上有到X网盘的导出链接;B板块为BT下载,页面上有一个站内的种子下载链接,无站外导出链接。' Y: K! L6 o6 e3 {; E; ~5 C
( L4 ~! p* @1 ^6 I# B3 m
  开始分析:
. r- a, T) [9 _5 l# x! [) k
; R  d& U( C! t2 k) ?3 Q: e, a' M  统计页面的抓取数量与即时收录数量,并计算之后,发现A板块的页面质量明显低于B。(页面质量 = 收录数量 / 抓取数量)那么此时猜测,是否是A板块帖子页面上,X网盘的导出链接导致了它的页面质量低?8 s! a9 [8 ?9 Z3 ]* z8 P
  {9 w3 Z- s: D& O8 _% b6 j- R
  为了验证猜测,再将A板块的帖子页面分为两组,其中aa组有X网盘的导出链接、bb组没有X网盘的导出链接。分别计算其页面质量。如果aa组帖子的页面质量明显低于bb组,那么可以得出初步结论:* g: n7 h" c; b/ k. u- b4 ~

; n' f; h- N! |  “X网盘的导出链接,使得自身帖子页面质量降低,影响到收录量,并最终导致SEO流量受损。所以需将该类导出链接做特殊处理,比如由自己站内URL,301跳转到X网盘等。”
% ^+ H# r  u  }
2 E' }& u: Y7 f  当然这个结论未必是正确的。比如,aa组帖子具备的特征,除了具有X网盘的导出链接外,也可能具备的特征如转载帖子比较多(游戏资源贴许多会是转载),可能是后者真正导致了其页面质量的低下。
' K0 |  s- t! [) a2 R6 o. g
1 k- {9 n9 `# v4 h6 H/ \  尽管更严谨的数据分析(比如再将转载帖子与非转载帖子分组)更可能得出准确的结论,但这般严谨下去就没个头了,SEO毕竟不是火箭科学,在某步的数据获取很有难度时,借助经验来猜测下可能更划得来。
1 g1 D$ O, J. f
& Q/ E- E6 r1 ?  所以可以先实施项目,然后再监控整个A板块相对B板块的页面质量是否有拉近,从而以最终效果来证实之前的猜测正确与否。3 ]" @* O* n9 V& i# _2 h2 t$ G  h2 {

" k0 }" |8 ?8 W7 ]$ O) Y  尽管这个例子完全为假设,我并不确定实际情况中,帖子到网盘的导出链接是否会影响到页面质量。但类似的例子平日能遇到很多,且此类分析的时候所需的数据收集起来方便,因此这是日常SEO数据分析最容易碰到的一类情况。
: d/ u& K' K, ^5 O
2 l# v0 M$ `" s7 h+ _8 n  一个进阶的实际案例分析. Q1 c6 A- C9 H# f

) O! h9 l) e8 U2 k  (数字与实际数值不等,但大致比例相同)
# p# ?* n. z6 R  c4 B
- o* s8 _7 a# X; c% e6 W  内页的流量在某一时间段大幅度下降,需分析其下降原因。) a# e6 q4 E& i+ F! J
' v  }7 l* z4 n0 f- O
  一个常用且管用的思路是,取25%的热词,看它们带来的流量、与另外75%词分别的变化。如果得出的数据是热词的流量下降多,即多半为热词的排名有下降;如果下降程度相当,则为整体的影响。" ?9 u( h' D+ q- F$ X/ h# ~( J

" k/ w# z- Y2 F# V6 s& j* E  首先,计算得出25%的热门关键词,它们的流量下滑幅度为35%;而75%的非热词,它们的流量下滑幅度为30%。
! z3 L1 i3 C9 e8 D
! Q' t$ M9 m5 I5 M6 d: X  但虽然数据差了5%,但差距还不是特别明显,需要进一步分析才能确定。5 W, ~0 B( X% X" m- N  ]  n

# N$ _" ^$ P0 J) {& L" O5 t  因为关键词往往是可以被进一步分词的,如“SEO文章”可进一步分为两个检索词——“SEO”、“文章”,而且检索词才是搜索引擎真正在处理的。所以进一步的分析就去分析25%的热门检索词流量的变化。
! g) V* Q% [4 H1 }/ l
. B7 J: Z( f. C: {9 X9 E  最终得出的数据是,包含25%热门检索词的关键词流量下降了40%,不包含热门检索词的词流量仅下降10%。
9 T6 N" I& N4 K) X
& h; |( _8 F2 w& i  那么结论就很清晰了,热门检索词相关的流量产生了变化。之后对比网站近期的项目上线列表,没有涉及到这部分的修改,所以这是百度的算法调整所导致的。! U, a/ b1 r& P" I
# w2 b6 Q  N7 t) S3 M# E
  知道了流量的变动原因后,自然也就可以有一些相应的改进方案了。尽管方案能执行与否尚取决于网站对SEO的重视程度,但至少不用借口于:“百度总是喜欢K我们的站”之类。6 |0 w4 o4 N2 y0 U2 F8 k! I* i& L
回复

使用道具 举报

柳村 发表于 2026-01-10 08:16:37 | 显示全部楼层
蹲了这么久,终于看到有价值的讨论,支持一下!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-14 01:49 , Processed in 0.082496 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表