找回密码
 加入怎通
查看: 560|回复: 2

[站长八卦] 巧用robots文件提升页面抓取率

[复制链接]
浅浅、笑时光 发表于 2012-02-22 19:55:52 | 显示全部楼层 |阅读模式
一、认识robots文件
$ V+ e% R. R* Y/ K5 `4 a/ O! g
我们知道,robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的,什么是不可以被查看的,蜘蛛知道了这些以后,就可以将所有的精力放在被我们允许访问的页面上面,从而将有限的权重集中起来。0 A4 T* d- P, F+ R7 H$ m) K% a: s
同时,我们还不能互略最重要的一点就是,robots.txt是搜索引擎访问网站要查看的第一个文件。明白了这一点,我们就有必要,也可能针对这一条做一些文章。
4 Q" M' D" ]: ]. W7 h: O. i二、将sitemap.xml写入robots文件! p) A8 k# x5 T" _2 ~# P. n2 b
前面提到了,robots.txt文件是搜索引擎中访问网站要查看的第一个文件,那么,如果我们将sitemap.xml(网站地图)文件地址写入robots.txt文件里面,自然而然会被搜索引擎蜘蛛在第一时间发现,也增大了网站页面被快速抓取和收录的可能性。此种做法,对于新站作用明显,对于大站更具有积极和现实的作用。' @5 E/ U: c& }+ h- H- R! @3 F
具体写法示例如下:6 T. l/ e9 x; P- {9 g
460.gif
所以,无论是新站还是老站,为了使得更多的页面被搜索引擎抓取,有必要将sitemap.xml写入robots.txt文件中。
3 d) @  w2 O3 x三、Sitemap.xml文件的获取- ^2 o6 c! W. r% Y+ r! Y5 G5 E3 m
前面讲了那么多,可能很多人还不是很明白,sitemap.xml文件究竟如何攻取呢?7 M4 W/ B0 b4 h, P) l% L% j4 x
给大家提供一个工具,也是谷歌官方推荐的sitemap.xml在线生成工具,http://www.xml-sitemaps.com/,大家可以根据里面的选项选择适合自己网站的sitemap.xml生成样式。生成sitemap.xml后,一般需要将该文件放置在根目录下面即可。7 Z9 {' j% ?; |
460.gif
综上,把sitemap.xml地址写入robots.txt文件,从而提升页面抓取率的方式是可行的,也是具有可操作性的。希望可以与更多的朋友就网站推广和优化进行探讨。本文原创宝宝早教http://www.iucbaby.com。欢迎转载,请保留出处。
回复

使用道具 举报

悦鹜 发表于 2012-02-23 10:29:06 | 显示全部楼层
学到了,赶紧回去加上
回复 支持 反对

使用道具 举报

服务器租用托管 发表于 2026-03-05 03:09:53 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-9 01:13 , Processed in 0.091699 second(s), 27 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表