找回密码
 加入怎通
查看: 549|回复: 2

[站长八卦] 如何让搜索引擎更快的找到抓取网站

[复制链接]
朱岩 发表于 2013-01-30 10:22:56 | 显示全部楼层 |阅读模式
1、抓取网页
5 G0 x! B" U8 p& z每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
9 {6 G4 O# H  A4 w& p
7 A. J0 E. X% C3 j
) R* Q, L1 R9 x2、处理网页
( e0 }% S/ l0 r* F0 h' f搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。
" R" H4 q' q, C& ?6 @9 Y3 a4 q1 H8 w6 d" ^. ?3 w6 `% B& X
3、提供检索服务0 f2 B5 \! |( ]3 }. D3 P
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。& N8 b; G: N! Y/ W) s. O. L3 l
淮安医院:www.0517hym.com& p4 P9 t3 z8 @' e2 @6 C- Z/ U2 b

' G+ y& {( ~! i( W/ w7 ^2 g/ l( c. f: G3 E5 r$ Y
回复

使用道具 举报

fiodada 发表于 2013-01-30 10:28:38 | 显示全部楼层
这个贴子对我很有用,感谢分享
回复 支持 反对

使用道具 举报

宁静致远 发表于 2026-04-10 06:45:38 | 显示全部楼层
楼主辛苦了,整理这么多内容,必须点赞收藏
回复 支持 反对

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-10 08:15 , Processed in 0.052112 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表