|
企业在做SEO的会接触到链接这部分内容,在SEO界链接基本分为内链、外链(友情链接)、反链、死链四大类。很多人认为只有页面不存在(404页面)的才称为死链,其实并不是这样的。死链是指已经无法到达的链接,也称作无效连接。死链不仅影响了用户体验,也影响了搜索效果。
% R2 ]" O, i0 j
: U% ?7 O% U2 N# I
本文将给大家分享下死链对网站的影响:死链是如何产生的,如何发现死链,如何正确的处理死链!
* M. b3 L' _, {. C" C/ h8 ~1 N / z2 }6 @; ?9 L# d& R& V
0 D( x9 @2 ~" y0 G% [$ L" O! f/ T
D6 N5 {$ a: E% `' g8 ~ 一、大量死链对搜索引擎的影响 ) S- M% y) S* g7 I+ x3 _# z
2 |) E! M% R# Q9 W. Z* g8 x
1、死链率过高,会影响搜索引擎对网站的评分。
1 I" \( F5 g7 C2 l" _/ Z; `0 J% c 2、搜索引擎对每个网站每天抓取的频次是限额的,若网站存在大量死链,会浪费掉抓取配额并影响其他正常页面的抓取。 3、过多死链对网站用户来讲也是体验不好的表现。 ' K, X- ?* b+ d0 v# s$ ?
( o/ S) T9 c6 {7 E! V& K1 V 二、死链接是如何产生的?
# `. O# H% V* g
" L, u5 q# Q7 |
- |9 g' l5 U* z9 u
1、网站内部添加了错误的内部链接 % v4 b& w* }, _1 a# Q" V' m0 h) t: r
7 C! v$ {* M- d% v0 e) f
编辑失误或者程序员大意让页面产生了不存在的页面。. a5 x+ @2 |* ]# Q
9 h5 R. @! @8 N' I5 A
* V' c" E+ o) f, _% s7 N3 |. }
2、网站短暂无法访问 ; P f) F& ~$ ?+ b
, F; p) c3 S. h) O6 s) a- R7 i
因为服务器、空间或程序问题导致网站短暂无法访问,产生大量返回码为5开头的服务器错误页面。
) H) }) j6 d" _' [5 J- g* ^1 J% ^ 1 a" I9 R$ g6 n: I" A
/ Q; S4 z2 F4 E& X0 s3 _
3、外部链接错误 # _ e5 a) K) H
8 ^2 M6 |( N+ q# U/ Z" F! M4 ]
用户或者站长在站外发布了错误URL;别的网站复制或采集了你们含有错误链接的页面。 k8 o+ f' n" {# d( M7 e
# f. j8 ~" S6 i6 @# c
( h5 T& `8 z% i: Z1 V* D% D
4、爬虫提取了不完整的URL
2 I. q9 d# |5 Y; f
) w- V; F7 t& k
个别爬虫在提取页面URL的时候,因为URL中有不规则字符或者URL与后边的文字链接起来,导致URL失效。
+ {2 M& j$ @: ]9 t2 e/ | 8 K- a& Q5 b& D9 E$ B3 S
" H J/ b/ @, F. M* S+ V5 d
5、网站改版 . ]' j' ?' w( d1 B9 _: o
% @* Y$ T4 C# d. Z6 z8 k$ G
如果你的网站已经改版或者将要改版,一定要注意死链问题,很多网站改版后,之前的老页面直接删除,导致了大量的死链接。, I6 K) R- A3 X7 `
/ H; e; h# [% Y* y6 V+ [* a, }5 b; x
/ s! \0 |4 D6 m5 f" T8 I" G
6、管理员删除页面 7 x, g3 l/ Z! c: n
% ~* F0 r9 t8 v
网站管理员删除被黑、广告、过时、被灌水页面导致很多死链接。
4 l5 O. c- l# x1 ?
1 Z$ Y1 Z5 v1 ?( Y4 Q
1 x+ Y+ J2 c* w6 p6 H, c# p
三、如何发现网站中存在的死链接? : s1 D' e! Q5 s$ |4 X
% A" K1 {; D+ d+ y
1、站长工具中的抓取异常工具可以查看最近一个月产生的各种死链,并支持导出功能。 6 K- H7 d' e1 d ^/ B
2、使用相关爬虫软件,比如Xenu,此类工具可以爬取全站所有链接并分析页面状态,分析完成后,支持导出功能,提取死链接即可。
7 b) S4 R! _4 f, x L" Q7 S
3、在网站运营中,特别是论坛,经常需要删除某些页面,在删除页面时一定要记录对应的Url以便后期提交死链。
, V/ b4 I* Z4 y( v( F( \
通过上述两种办法提取的死链列表,一定要经过删重和验证,比如用wps表格进行删除重复链接,然后再使用Http状态批量查询工具验证下是否确实是死链接。 - h+ O. k* O0 C. H: A7 _
9 d7 q; ?* q' B% R5 ?, Y [& } 四、如何避免和处理死链接?
# h* M L9 m2 G- C9 `8 K- G
) W% f! _1 f! x/ q/ X( E4 A
1、网站改版最容易产生死链的( T" ^3 H! N; [- K: L
5 y" c4 e7 w7 Y7 ?
改版之前的页面如果有价值尽量不要删除和修改Url,若需要更换域名或Url分配规则,那一定要将之前的url进行301跳转到对应的Url;若老的数据必须删除,那删除的所有页面Url要进行整理和提交死链。 , B8 i/ f& d8 {6 J# q
2、对发现的死链接如何处理 , }5 n a# c# |5 q* M
将收集好的所有死链接粘贴到网站根目录的一个文档中,再把文档地址提交到 站长工具--网页抓取--死链提交--添加新数据--填写死链文件地址;若大量死链具有一定的规则,如某个目录下全部为死链接,可提交规则死链。 + p' ?4 S5 R7 N3 {
# _0 Q6 h. O7 ?+ }- ?
相关注意事项 7 f6 `2 Z- ], q1 K: q# ^! ?% ?
3 m0 z; P+ c9 W" }. R$ R2 @- r4 j0 ^
1、在站长工具中提交死链前,一定要确保提交的死链数据不存在活链接。一旦存在活链,会显示提交失败导致无法删除。
+ q$ Y) N _" e9 ?) c+ V7 |% J
2、由于很多网站程序问题,很多打不开的页面返回码并非404,这是一个大问题,比如明明是打不开的页面返回码是301、200、500,如果是200的话,会导致网站中出现不同URL获取相同内容。比如我的一个站,社区的帖子删除后,返回码却是500,后期发现了,立马进行了处理。大家尽量找出所有错误URL格式,并设置HTTP状态码为404。
- B1 U" t3 J% R+ ~9 ~3 k
3、把所有的错误页面找到后,一定要寻找此类页面URL相同特征,并且和正常页面的特征有区分,写对应规则到robots文件中,禁止蜘蛛抓取,就算你已经在站长工具中提交了死链,也建议robots封禁抓取。 X, ]- [' t% b; I B
4、robots只能解决蜘蛛不再抓取此类页面,但解决不了已经收录页面的快照删除问题,若你的网站被黑,删除了被黑页面,除了robots封禁被黑页面外,还应该将这些页面提交死链。提交死链是删除被黑页面快照的最快办法。
6 J8 u+ `2 e3 n |