找回密码
 加入怎通
查看: 548|回复: 2

[站长八卦] 如何让搜索引擎更快的找到抓取网站

[复制链接]
朱岩 发表于 2013-01-30 10:22:56 | 显示全部楼层 |阅读模式
1、抓取网页) q  g8 s5 T! X/ E0 L, Q: B; ?9 [4 Y
每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
4 r8 J( M7 {8 O7 h: o1 V9 v- h( D4 f& u. E3 Z+ l8 B
, |+ R0 h7 I  R3 Q! ]
2、处理网页
4 r& f# G- m( h4 |搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。
, U' P& y. n* p* m4 M7 I' K5 y0 B% V8 h) J5 V$ D/ h
3、提供检索服务: w4 ^4 W& Y: d9 r5 L
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。* Q2 x8 U9 F5 }
淮安医院:www.0517hym.com. o- t$ F& a4 }. @& `
$ @1 H: h( [% J$ E% J( ?7 T
1 P( }8 a1 Z2 B! |
回复

使用道具 举报

fiodada 发表于 2013-01-30 10:28:38 | 显示全部楼层
这个贴子对我很有用,感谢分享
回复 支持 反对

使用道具 举报

宁静致远 发表于 2026-04-10 06:45:38 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-10 08:08 , Processed in 0.145915 second(s), 23 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表