找回密码
 加入怎通
查看: 492|回复: 1

[站长八卦] 查询网站精确收录数量的几种方法

[复制链接]
晴天雨一直下 发表于 2013-05-08 00:38:12 | 显示全部楼层 |阅读模式
利用sitemap查询网站的收录数据
7 M) J3 I, o' D/ C现在除了在谷歌管理员工具提交sitemap文件外,在百度站长平台也可以提交地图文件了,格式可以是txt格式、xml格式以及sitemap索引文件格式,提交后,抓取效果非常的明显,由于百度现在还未完全开放,提交sitemap文件需要邀请码才可以,下边我们主要以谷歌为例来说明,地图文件可以让技术协助来解决,其实最简单的可以使用txt格式,在txt文件中,只需要每一行列出URL就可以了,中间不能有空行,还要使用绝对地址形式,不过最常用的是XML格式,因为它除了提供URL,还提供了优先级、更新频率、时间等因素,更方便搜索引擎去抓取,当我们制作好提交后,在谷歌管理员工具中就会这样显示。
/ F2 Y; e; s% ]$ B/ h) M2 v* F利用百度站长平台或者百度统计工具+ j8 O. i5 {% S& [
在前些时候,百度在站长平台放出了网站的精确收录数据,而且精确到每一天,也就是它每天都更新的,这样只要我们注册了站长平台或者百度统计,就可以精确的知道网站的收录数据了,而且每一天都有数据,非常方便,为了方便我们查看,还使用了按时间倒序排列,百度官方曾说这个数据是当今最准确的收录数据了。其中图片中的已编入索引的网址数,就是谷歌抓取这个地图文件后的精确收录数据,如果我们把网站中所有的URL都放入地图,提交后,利用这个方法就知道它的精确收录量了,注意当URL比较多时,可以多提交几个sitemap文件,一个sitemap文件URL数量不要超过五万条,而且文件在压缩前不能超过50M(百度不能超过10M)。
% R" U0 @( f8 n0 ^利用火车头采集工具查收录1 j$ l6 _3 ~! T7 b( s
首先要把网站的URL导出来,然后根据百度的URL特征,把网站的页面URL当作在百度搜索的关键词,批量生成在百度查询后的这个URL地址,用火车头工具批量采集这些URL的内容,要采集这些页面的特征内容,例如未找到、抱歉等字眼,当采集到这些内容,就代表没有被收录,用URL总数量减去这些没有被收录的URL数量就是网站的收录数据了。) P2 j% w% ^# _4 r, x3 s& }( A
Rank tracker是一个国外的非常优秀的查询关键词排名的工具,它可以批量查出几万词的排名,非常的强大,我们可以借助它查询网站的收录情况,方法是把网站的URL导出来,把它导入到rank tracker进行批量的查询,把url作为网站的关键词来查询排名,排名第一位的,就代表收录了1 e& R4 {4 q. y" b1 a
回复

使用道具 举报

小猪丫 发表于 2026-03-07 18:29:08 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入怎通

本版积分规则

QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

GMT+8, 2026-3-14 22:28 , Processed in 0.408652 second(s), 23 queries , Gzip On.

免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表