有时候你的网站不被搜索引擎收录其实就是因为一些很容易被忽略的小问题引起的,也可以说是可能你根本想不到的原因导致的,那么到底是哪些因素有可能导致我们的网站不被搜索引擎收录呢?下面我们来帮你分析一下哪一点是你所符合的。$ [$ o( ^4 b2 G# ~; ` t2 \2 q
' e% V+ N ^" P" { 一、站点的: `- A! B; q+ m: d4 C6 ^: s# s
, b8 @) v8 ]6 X: B# r! [. G robots.txt文件已损坏或者在书写的时候出现错误,书写不规范、写错了或者拒绝蜘蛛的抓取,robots.txt文件书写的时候要注意内容的大小写,许多网站都是这个问题,如果搜索引擎机器人错误的理解了您的robots.txt文件,它们可能会完全无视你的网页。对于这个问题,解决的办法是仔细检查您的robots.txt文件,并确保您网页上的的参数是正确的,你可以使用谷歌网站管理员工具来创建一个robots.txt文件。
4 j. g& j! D; H- I
' \% E% m1 @. ~% N, }. l 二、网址中包含太多的变数网址" E5 |3 P& q1 h( c! K0 @+ h: ?
- S! {2 g* E# v& \ G& |% I9 X
URL中包含太多的变数可能会造成搜索引擎机器人搜索困难,如果您的URL包含变数太多,搜索引擎漫游器可能会忽视您的网页,对于这个问题一些比较熟悉网站建设的人可能会想到动态网页,的确就是这个问题,动态生成的网页(括ASP、PHP)可能导致抓取工具无法收录,解决办法,使用静态页面或者伪静态。9 g% p6 B# I3 Y$ U
1 c' p8 W; k4 t* ~. a6 r 三、在您的网址中使用了会话. ^8 S' J( w0 g& w! G1 U1 b
5 n! l, P. ?: U/ Q ID许多搜索引擎不去收录那些包含会话ID的网页,因为它们可导致内容的重复,如果可能的话,避免会话ID出现在您的网址,而使用cookies 存储会话ID。
( Z$ T& e8 x9 i5 X
) z3 y: O. u: P* m3 ]* l; p! U' l 四、您的网页中包含太多的
& F( M5 k+ h& b* _, _ Y! {' D/ X6 r2 _3 V. L! D- _) ] o+ H
JS代码网页中包含了JavaScript代码、CSS的代码以及其他脚本代码。这些代码与内容没有直接的联系,访问您网页并选择“查看源文件”或“查看HTML源”,如果您很难对网站上的实际内容进行更改,那么通常情况下搜索引擎收录起来也很困难。" x( Y% N$ v' z1 O9 Y5 T; ^! j
9 G: Y) M' o0 a4 t5 T 五、网站导航4 N1 f, p) r+ v
: V9 I2 L( c. T: ` 大多数搜索引擎的机器人不能解析JavaScript或DHTML菜单,当然Flash以及Ajax菜单效果更差,应尽量避免使用这些对搜索引擎不友好的方式。搜索引擎机器人是很简单的程序,它们遵循HTML链接,一旦链接出现错误对收录也会带来困难,这些问题最好是在建站的时候就考虑到,以免再次进行二次开发,并且还影响网站的正常收录。
: T7 ~% s) e9 U& W |