找回密码
 加入怎通
查看: 559|回复: 2

[站长八卦] 巧用robots文件提升页面抓取率

[复制链接]
浅浅、笑时光 发表于 2012-02-22 19:55:52 | 显示全部楼层 |阅读模式
一、认识robots文件
  J7 ]# b2 p1 ^8 j% p
我们知道,robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的,什么是不可以被查看的,蜘蛛知道了这些以后,就可以将所有的精力放在被我们允许访问的页面上面,从而将有限的权重集中起来。
/ m& P: P9 u' P3 _同时,我们还不能互略最重要的一点就是,robots.txt是搜索引擎访问网站要查看的第一个文件。明白了这一点,我们就有必要,也可能针对这一条做一些文章。
" c/ z( i8 c3 `' e# r9 B* f二、将sitemap.xml写入robots文件( c0 z( [5 T2 n$ P: K9 u0 W' s) u
前面提到了,robots.txt文件是搜索引擎中访问网站要查看的第一个文件,那么,如果我们将sitemap.xml(网站地图)文件地址写入robots.txt文件里面,自然而然会被搜索引擎蜘蛛在第一时间发现,也增大了网站页面被快速抓取和收录的可能性。此种做法,对于新站作用明显,对于大站更具有积极和现实的作用。
, e+ l0 D9 A7 D: @6 h( v* G具体写法示例如下:
/ I5 h* K* S( ~2 g( r# w' h! ?( x
460.gif
所以,无论是新站还是老站,为了使得更多的页面被搜索引擎抓取,有必要将sitemap.xml写入robots.txt文件中。
1 z* k% V4 K3 I- s+ k三、Sitemap.xml文件的获取7 _) F3 ^! u2 `  R: Q1 A: u
前面讲了那么多,可能很多人还不是很明白,sitemap.xml文件究竟如何攻取呢?$ z/ p5 M8 [1 H5 m
给大家提供一个工具,也是谷歌官方推荐的sitemap.xml在线生成工具,http://www.xml-sitemaps.com/,大家可以根据里面的选项选择适合自己网站的sitemap.xml生成样式。生成sitemap.xml后,一般需要将该文件放置在根目录下面即可。4 Y" I1 G) b6 I: A( ?
460.gif
综上,把sitemap.xml地址写入robots.txt文件,从而提升页面抓取率的方式是可行的,也是具有可操作性的。希望可以与更多的朋友就网站推广和优化进行探讨。本文原创宝宝早教http://www.iucbaby.com。欢迎转载,请保留出处。
回复

使用道具 举报

悦鹜 发表于 2012-02-23 10:29:06 | 显示全部楼层
学到了,赶紧回去加上
回复 支持 反对

使用道具 举报

服务器租用托管 发表于 2026-03-05 03:09:53 | 显示全部楼层
学习到了,之前一直没注意过这个点,受教了
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-5-9 01:08 , Processed in 0.545146 second(s), 26 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表