找回密码
 加入怎通
查看: 547|回复: 2

[站长八卦] 巧用robots文件提升页面抓取率

[复制链接]
浅浅、笑时光 发表于 2012-02-22 19:55:52 | 显示全部楼层 |阅读模式
一、认识robots文件
3 b5 R6 G4 }. }) b" }2 p
我们知道,robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的,什么是不可以被查看的,蜘蛛知道了这些以后,就可以将所有的精力放在被我们允许访问的页面上面,从而将有限的权重集中起来。1 G, h  |/ w9 X
同时,我们还不能互略最重要的一点就是,robots.txt是搜索引擎访问网站要查看的第一个文件。明白了这一点,我们就有必要,也可能针对这一条做一些文章。' Q5 @3 i- o% S6 J. t/ M
二、将sitemap.xml写入robots文件+ W6 o. g! ~* g) `$ C
前面提到了,robots.txt文件是搜索引擎中访问网站要查看的第一个文件,那么,如果我们将sitemap.xml(网站地图)文件地址写入robots.txt文件里面,自然而然会被搜索引擎蜘蛛在第一时间发现,也增大了网站页面被快速抓取和收录的可能性。此种做法,对于新站作用明显,对于大站更具有积极和现实的作用。
  m5 U; F0 i3 G7 R) r+ J" ]8 J具体写法示例如下:
1 R( t( C! c1 S, R
460.gif
所以,无论是新站还是老站,为了使得更多的页面被搜索引擎抓取,有必要将sitemap.xml写入robots.txt文件中。2 B1 N) t8 B8 X& a
三、Sitemap.xml文件的获取
4 y0 J+ c0 y6 p4 R- ]7 S前面讲了那么多,可能很多人还不是很明白,sitemap.xml文件究竟如何攻取呢?
' x  |& ?' d3 E给大家提供一个工具,也是谷歌官方推荐的sitemap.xml在线生成工具,http://www.xml-sitemaps.com/,大家可以根据里面的选项选择适合自己网站的sitemap.xml生成样式。生成sitemap.xml后,一般需要将该文件放置在根目录下面即可。9 }6 Z; J: e+ c, u  K8 [
460.gif
综上,把sitemap.xml地址写入robots.txt文件,从而提升页面抓取率的方式是可行的,也是具有可操作性的。希望可以与更多的朋友就网站推广和优化进行探讨。本文原创宝宝早教http://www.iucbaby.com。欢迎转载,请保留出处。
回复

使用道具 举报

悦鹜 发表于 2012-02-23 10:29:06 | 显示全部楼层
学到了,赶紧回去加上
回复 支持 反对

使用道具 举报

服务器租用托管 发表于 2026-03-05 03:09:53 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入怎通

本版积分规则

QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

GMT+8, 2026-3-15 04:58 , Processed in 0.059301 second(s), 27 queries , Gzip On.

免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表