找回密码
 加入怎通
查看: 3106|回复: 2

[站长八卦] Discuz论坛的SEO优化方案

[复制链接]
TONY 发表于 2012-01-07 19:28:06 | 显示全部楼层 |阅读模式
设discuz已启用伪静态功能,使用5.0/5.5 GBK 版本;   / X8 @! {  f7 z
1、meta,content 优化 ; Q+ }, S# O" j
2、内容页的网页复制问题
9 W* j1 X! w# h) }9 T# V7 c9 p3、robots.txt使用及其它   更新
; q" A, D/ d0 M1 g& ndiscuz5.5的robots.txt问题
3 q$ y1 W% m2 Y2 bDZ 禁止一个版面帖子的收录的补充   一、meta的优化   discuz的后台可以对meta信息进行设置,甚至可以添加自己的头部信息,但它的设置都是针对于所有页面的,全部页面都拥有相同的keywords和description是SEO所不赞成的。   方案一:删除meta   修改页头模板文件 templates/default/header.htm:将meta的keywords和description标签删除。   这两个标签作用很小了,而且还有discuz自带的一些无用信息,用得不好反而会有坏作用,因此宁缺勿滥。   方案二:定制meta   本部分实现了将内容页keywords设为帖子标题,description为内容前100字;也实现了主页与各版列表页meta的单独设置(不同版的不同,同一版各列表页相同)。   1.修改页头模板文件 templates\default\header.htm:将meta的keywords和description标签改为如下形式   meta name=keywords content={$metakeywords}$seokeywords / 8 C( b8 I8 F4 [( c: O( a2 h
meta name=description content=$seodescription /   这里的$seokeywords、$seodescription就是后台设置的那个值,下面说怎么定制这个值;{$metakeywords}是奇虎的关键字,留下以后处理   2.内容页(viewthread)设置keywords为帖子标题,description为内容前100字   2.1修改 viewthread.php 文件: 3 l' Y; O) Q& H  U( }; b, N, B0 R
在 include template('viewthread'); (更新:dz5.5为iinclude template($iscircle ? 'supesite_viewthread' : 'viewthread'); ) 语句的上面加入一行: , F: j* M% }  ^6 W9 R+ }
require_once DISCUZ_ROOT.'./include/bmt.thread.inc.php';   2.2创建 include/bmt.thread.inc.php 文件,内容为   ?php 0 p7 m/ r$ U' a$ k4 C) U5 c
if(!defined('IN_DISCUZ')) { exit('Access Denied'); }   $seokeywords = strip_tags($thread['subject']); //关键字设为帖子的标题
7 S! c9 A+ k& d( V' m) j//(已更新: nethome 提出问题,当启用主题分类并允许按类别浏览时,原来代码会有问题。所以加了标签过滤,本来在viewthread.php中改更好,为以后升级方便,还是放在这里吧,subject很短,不会影响效率)   $seodescription = current( $postlist );//description取文章内容的前100字
8 i, c# i9 Y" n+ [, D3 B, f  Y$seodescription = mb_substr( $seodescription['message'],0,100,gb2312 ); % i) N/ a1 V; e" V2 X, `& g
$seodescription = htmlspecialchars( strip_tags($seodescription) ); * c* u' j: C5 E( F' T& ?4 Y3 e
?   *此处数字和个别函数适用于GBK版本   最后一行作用是过滤内容中的html,否则在meta中会引起语法错误。先是去除HTML标签,但因为这里是前100字,有可能html标签已经被截断了,所以又用了htmlspecialchars转义一下,有可能会有些垃圾信息。
6 F) |1 }$ Z5 S7 N, X当然也可以在截取之前用strip_tags去除html标签,可能效率会差了。   *所以此处表达式您需要根据自己的情况修改。
, p+ t7 _' c0 m! M$ X  D4 |7 F我目前用的是preg_replace( '/[^\xa1-\xff]/', '', $seodescription ),即过滤汉字以外的所在内容,但这样会损失英文关键字。   别外说明,此处数据都是viewthread.php已取好的,所以不会产生额外的数据库操作,只是做了字符串处理,不会引响效率。   3.列表页(forumdisplay)设置不同的keywords和description   3.1修改 forumdisplay.php   文件,在 include template('forumdisplay'); 语句上面添加 1 {8 P  u+ c- L- k, L
require_once DISCUZ_ROOT.'./include/bmt.forum.inc.php';   3.2创建 include/bmt.forum.inc.php 文件,内容为   ?php
# c/ ]. ?2 ?  Z: w# k) lif(!defined('IN_DISCUZ')) { exit('Access Denied'); } / Q; I  ]1 `) p9 O- u, e  c6 N' ~
$seokeywords = $forum['name'];
2 q. G. i" V. r, Z: e$seodescription = $forum['description'];   switch ( $forum['fid'] ){
: C3 G5 m/ Y/ M0 W0 p) @% Y, Qcase 1: //此数字为版的ID号,不同版设置不同的meta
9 q# D3 M) ?% H& H$seokeywords = 'key1,key2,...';
1 C' F! Y( [$ N1 q$seodescription = 'xxxx xxxx xxxx'; 0 C$ J/ n8 h7 u# B+ E6 e; ^  L- R: K
break;
) K8 J( U: ^, ~5 Y/ j8 I! U1 Acase 2:
. l% U# J4 L4 [# n' Z5 {, J$seokeywords = 'key1,key2,...';
( P& l/ D5 `$ j8 U4 o8 e$seodescription = 'xxxx xxxx xxxx'; 8 ^& g3 J! P* E
break;   }
: j8 @; f$ Z+ G; `6 v?   //更新:一般情况下可以不用switch和case,列表页的关键字为版名,说明为版的说明,若要对某个版设置特殊的关键字和说明,可以设置case。这样解决了版面很多时要设置很多case语句,加快了程序执行速度(不了解php,JAVA的 case进行了优化,执行很快)   使用修改文件来实现,每版的meta改起来不方便,感觉有些弱智,呵呵。但没有改数据库,用了两个单独的文件,修改了两个文件也很简单,这样升级或迁移更方便吧   case虽然多了一些,但比起读数据库的记录,速度应该快很多   4.主页meta 2 k0 w5 i3 S! r( T0 z, X/ r5 B; m
在后台设置即可。(如果2、3不做,则meta也同主页)   content的优化 " s& h  J6 ^/ t) K
discuz有个archiver,一是URL容易收录,二是页面比较干静,还有description会从正文中取内容,但archiver没有对内容中[b][url]之类的解析,那些标签起不到作用,原样显示还会增加垃圾信息。 * B0 l8 v4 b/ A' \1 S: u
本部分主要做两方面的优化,一是去除内容页的无用信息,二是给标题加上
# k# E) _/ Z! K) z. Th1 9 V( [9 `" U, h! O, O$ K
。加上伪静态和上篇meta的优化,效果就超过了archiver,因此可以在后台禁用它,还减少了复制网页。   实施方案   1.隐藏内容页(viewthread)中的无用信息: & _! u% D8 V# C
修改内容页模板文件 templates/default/viewthread.htm:   用!--{if $discuz_uid}-- !--{/if}--将要隐藏的信息包含起来。   准确的说是当游客(bots)访问时,隐藏那些信息,当用户登录后是正常的,所以不影响使用。
! \' |2 E, a3 O& M% r/ P1 Y$ o; C$ p这些信息主要指的是左侧用户信息栏、(资料 个人空间 主页 短消息 等等)、用户的签名(隐藏后不怕签名的内容影响正文,链接也不起作用了)
  V2 G6 p$ E, z1 o2 e: s9 n& C以住相关文章   2.为标题加上
4 H& W' z1 F9 ~6 d2 uh1 0 g/ C! h. [, J$ V
标签
, D" z) K- L5 |( o5 `, L# j( q修改内容页模板文件 templates/default/viewthread.htm:   将 span class=bold$post[subject]/spanbrbr 替换为 4 l4 y. \  }! v9 }- I$ I" d
h1$post[subject]/h1   定制本帖最后由 XXX 于 xxxxxx 编辑内容   修改文件 templates/default/misc.lang.php:将下面两行改成您喜欢的内容:   'post_edit' = '\n\n[] 本帖最后由 $editor 于 $edittime 编辑 ]',
9 V* V6 t* u& _% @0 |7 u'post_edit_regexp' = '/\n{2}\[\[i\] 本帖最后由 .*? 于 .*? 编辑 \[\/i\]\]$/s',   比如我改成 [ 网站名 URL xxx 于 xxxx 编辑]。改程序无聊时的自娱,呵呵 ) _! K+ c. ?3 L" d. T
注意上下两个表达式要匹配。为了防止解析方括号是全角,不要复制后在文件中查找。   二、内容页的网页复制问题   看看内容页的URL大家就知道了:thread-(tid)-(page)-(forumdisplay page).html,可以看出最后一节表示的是此帖在列表页的第几页。所以,当您的帖子越来越多,这个帖就会由第一页到第二页...,它的URL就会不断的变化。其实打开一个列表页就可以看出来,第2页的帖子链接的最后数字都是2,第3页的都是3,只是很少注意它。我是在SE的收录中发现复制网页越来越多,才对最后的数字注意的。   解决方法 * \$ h0 @2 E3 f4 z
修改 forumdisplay.php 文件:   将 $extra = rawurlencode(page=$page$forumdisplayadd); 语句替换为
  W9 A  c( m9 b: L$ C# W$extra = rawurlencode(page=1$forumdisplayadd);   语句中的page就是forumdisplay page,这样改后不管帖子在列表页的第几页,这个数都是1。   功能损失:当用户编辑帖子或版主管理帖子后,有个提示跳转页:选择转入列表页还是主题页,这时转入列表页的话,只能转到列表页第一页,而不管您原来停留在第几页。   redirect的301重定向   在discuz论坛中可以看到类似redirect.php?tid=xxxgoto=lastpost#lastpost这样的链接,它的功能是实现最新发表、最后发表、上一主题、下一主题功能,仅这一个功能就可以给同一个内容页造成四份复制网页,因此将这样的链接301永久重定向到帖子的静态地址。   解决方法 8 R) w: g4 F7 L! ~8 I
修改 redirect.php 文件:   将前两个 require_once DISCUZ_ROOT.'./viewthread.php'; 语句替换为 % x% N- _5 [. a# V3 l$ _
$bmt_url='Location:/thread-'.$tid.'-'.$page.'-1.html';
  D: N8 ?# r4 \: H' S6 `header('HTTP/1.1 301 Moved Permanently'); 2 Q  ?1 E. E+ k" @0 r) R
header( $bmt_url ); 8 j+ _. D' A, n- ]9 w' R
将后两个 require_once DISCUZ_ROOT.'./viewthread.php'; 语句替换为
/ y( ?+ X$ F% `7 I: O$bmt_url='Location:/thread-'.$tid.'-1-1.html';
: A. o7 Q+ A# b) r- H# Eheader('HTTP/1.1 301 Moved Permanently');
5 e. \$ V9 W6 R: |# D1 G+ E0 J  Nheader( $bmt_url );   dz5.5的引用处也有个跳转,也可以做301:   将 dheader(Location: viewthread.php?tid=$post[tid]page=$page#pid$pid);替换为
" x8 E, w! |* Q$bmt_url='Location:/thread-'.$post[tid].'-'.$page.'-1.html#pid'.$pid;
# H" u, q7 Z/ F; D$ Fheader('HTTP/1.1 301 Moved Permanently'); 8 m: }& D1 J, Q: ]1 [1 F
header( $bmt_url );   ***注意此处直接转到了静态地址,没有做判断是否开启伪静态功能,所以不开启会有问题   功能损失:转向到静态地址后,动态地址中类似#lastpost的锚点将无法起作用了,可能要手动滚屏了 * [6 a: h( @0 z3 w
???好像没有影响锚点   提示信息页的网页复制   这个问题和内容页也有着很大的关系,呵呵。如管理员设置允许游客浏览列表,而禁止浏览内容时,这些内容页都将返回一没有权限的提示信息页,但它们的URL 是不同的,这样就形成了严重的网页复制,此外还有其它形成的无权操作等。别一种提示信息如帖子不存在等,数量大了也会形成网页复制。这两种提示信息,都是通过showmessage函数分别调用nopermission.htm和showmessage.htm两个模板实现的。   解决方法
( s& O9 x$ A( v% f. ~# ^1.创建另一个头模板文件 templates/default/header_disbots.htm
+ \2 D' i: u6 @/ w, o! s* _内容同 header.htm 文件,但加入meta robot标签,如下   meta name=robots content=noindex,nofollow /   2.分别修改 templates/default/nopermission.htm 和 templates/default/showmessage.htm 文件
$ i+ m4 t1 n. Q. O将它们第一行的 {template header} 替换为 {template header_disbots}   虽然对meta robots标签支持的不是很广泛,但这是比较省事的方法
/ t4 f. {0 e; b; O- Z因为是提示信息页,用301来实现的话,还要传给转到的页好多信息,修改起来比较麻烦   三、robots.txt使用   User-agent: *   #禁止一个版面的收录
1 J0 U- `4 B: l( ?8 u#如果有个水版,不想禁止游客权限,也不想SE收录,已免影响网站质量,可以用如下方法 & a! z# K- P, S% z# \
Disallow: /forum-1-   #数字即为要禁止版块的ID。
# M1 u/ {2 I+ y* L3 J: N#注意数字最后的 - 不要省略,否则连ID为11,12等1开头的版都禁了
( s% }4 h! a; L+ h5 c; h[更新]补充方法:再给内容页加meta robot禁止   #再禁网页复制
  @9 z; O  I& Z/ x7 gDisallow: /viewthread.php ) ?( F; Y& r/ I
#这个是内容页的动态形式,前面对伪静态做了优化并修改了很多的复制网页,因此这里动态形式如打印页等一定要禁止   Disallow: /forumdisplay.php
7 }3 p3 }. {, `$ c3 w- ^# b) ]#这个要慎重:列表页的动态形式,还包括精华、活动、投票等形式。我发现5.0的静态化不彻底,它的上一页下一页翻页仍是动态,这样如果禁止了,十页之后的内容就不能通这索引了。所以如果您站内的交差链接不丰富的话,不要在此禁止,以免影响收录。   hekaiyu说没有这个问题,去官方看了下5.5的确没问题(也许我的5.0本来没问题,也许官方在新版本中完善了正则表达式的替换规则),这样更好了,禁止它,又干净了好多   #禁止其它无用内容 8 T6 j+ N/ J$ j$ k* b
Disallow: /profile ! m: L  N. r+ H6 Y+ @
#用户信息,不知为什么discuz也静态化了,一律禁止
5 ]# n9 f6 I" V3 d; r2 `0 dDisallow: /relatethread # u( V* e4 a/ V: O$ m
Disallow: /post
0 e0 f2 t4 H1 [8 v$ M4 C& wDisallow: /blog
7 a: s( E: |. {4 sDisallow: /member & i, C# U, L6 h
Disallow: /misc " U: b0 {! [+ i* ~% t
Disallow: /faq ; _! ]0 o# O( H- j+ Y
Disallow: /my : E  t: Y/ t3 n# B5 i/ y- w
Disallow: /pm
) W0 D+ j" t( ?Disallow: /digest
# b; u. g' [. ~. q5 `Disallow: /status 4 D& A; I9 L5 S2 s1 E. v, `
# ... ... 等等
4 q' Y! H' E" T+ _# ----- robots.txt end ------
. L8 j3 E0 k+ p1 S" F[更新]dz5.5的robots.txt后部分给出的Disallow: post.php等是不合规范的,一定要在前面加上/。详细说明   首页URL问题   后台基本设置-首页文件名如果不设置,会默认为index.php。所以站内到首页的链接为形式为http: //domain/index.php。而我们一般引用论坛首页或交换链接的形式一般是http://domain/。实际是一样的,但SE可认为是两个 URL,而且一个拥有很多的内部链接,一个拥有较多的外部链接,所以哪个被降级都不是好事情,最好统一起来。这里的修改目标是http: //domain/的形式。   1.进入后台,基本设置-首面文件名 设置为: / . A/ e# D& O$ T4 x4 i
2.修改文件 member.php 将 header(Location: {$boardurl}.$indexname); 替换为   if( $indexname=='/'){
3 s' [" U/ n) _0 T2 _5 yheader(Location: {$boardurl});
4 f' `. d9 k( T3 I2 ~7 \}else{ ! ]4 E' a2 u6 V, K4 \- ^7 N: n" F
header(Location: {$boardurl}.$indexname);
4 p) C0 _/ ~5 w9 }1 |}   [更新]dz5.5为dheader   此修改处的功能是清除cookies后返回到首页,如不修改域名后就有两个/。暂时未发现使用/当首页文件名的其它问题   结 束   除了文件的修改,有些地方要配合后台设置,前面都提到了,这里总结一下。主要有:1.URL静态化,只启用普通页面静态化就可以了;2.不要启用 Archiver功能;3.后台的keywords和description设置只是针对首页的(如果您没做列表页和内容页的meta修改则也应用到它们);4.后台首页文件名为/(当然您也可以设置自己特定的)
回复

使用道具 举报

西万路小混混 发表于 2026-02-24 22:29:45 | 显示全部楼层
这个思路很新颖,打开了新世界的大门,谢谢分享
回复 支持 反对

使用道具 举报

zhang900827 发表于 2026-03-16 00:13:43 | 显示全部楼层
这个分享太实用了,刚好能用到,感谢楼主!
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 01:39 , Processed in 0.402349 second(s), 28 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表