找回密码
 加入怎通
查看: 1128|回复: 4

[站长八卦] robots.txt文件四个方面的好处

[复制链接]
拓宽动力小H 发表于 2012-05-02 14:26:46 | 显示全部楼层 |阅读模式
    搜索引擎蜘蛛访问网站时,会先查看网站根目录下有没有一个命名为robots.txt的纯文本文件,robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容。

  只有在需要禁止抓取某些内容时,写robots.txt才有意义。robots文件不存在或者是空文件都意味着允许搜索引擎抓取所有内容。有的服务器设置有问题,robotx文件不存在时会返回200状态码及一些错误信息,而不是404状态码,这可能使搜索引擎错误解读robots文件信息,所以建议就算允许抓取所有内容,也要建一个空的robots.txt文件,存放在根目录下。

使用robots.txt文件可以让搜索引擎看网站更规范和权威。

用robots.txt文件的好处主要有四方面。

1、用robots.txt屏蔽死链接。
死链接就是原来存在,后来因为改版或更新等缘故删除了的链接和网页,可以用robots.txt屏蔽。

2、用robots.txt屏蔽相似的页面或没内容的页面。
我们知道,搜索引擎收录网页后,会对网页进行“审核”,当网页的相似度很高时,会删除其中一个。

3、用robots.txt屏蔽多余的链接,当动态和静态共存时,一般去掉动态的。
网站中经常会存在多个链接指向同一个页面,这种情况普遍存在时,会让搜索引擎对网站的权威性产生怀疑。
通过robots.txt把非主要的链接去掉。

4、用robots.txt屏蔽可能存在的“被K”外部链接。
很多网站允许用户放自己的网站链接,但因为过多的“被K”外部链接可能连累自己。

所以,我们把所有外部链接放入一个链接目录下,然后通过robots.txt统一屏蔽。


回复

使用道具 举报

深圳印刷网 发表于 2012-05-02 15:22:49 | 显示全部楼层
不是很懂也,。,,楼主
回复 支持 反对

使用道具 举报

等待她203307 发表于 2012-05-02 17:55:12 | 显示全部楼层
会先查看网站根目录下有没有一个命名为robots.txt的纯文本文件,robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容。


回复 支持 反对

使用道具 举报

方程式 发表于 2025-11-09 03:12:47 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

西万路小混混 发表于 2025-11-10 20:21:55 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

2025年控制台五大源头厂家排行,这些品牌值得关注
行业概览 随着数字化转型进程加速,控制台作为指挥中心、监控中心等关键场所的核心设备,其市场需求持续增长。源头厂家凭借完整产业链、技术积累与成本优势,在市场竞争中展现出强劲实力。本文基于市场调研与公开数据,从企业实力、技术能力、产品质量、客户案例等维度,对控制台源头厂家进行客观分析

您需要登录后才可以回帖 登录 | 加入怎通

本版积分规则

QQ|网站地图|真牛站长论坛 ( 苏ICP备2023040716号-2 )

GMT+8, 2025-11-28 07:51

免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表