找回密码
 加入怎通
查看: 387|回复: 2

[站长八卦] 5个百度搜索引擎基础知识

[复制链接]
tl27558 发表于 2013-01-22 15:00:58 | 显示全部楼层 |阅读模式
报告来源:企业商情报告网(复制此/到地址栏可见原文)[/
* Q. h# Y# r; f% u: k
: U, n4 U" F; a) k4 d1   当您的网站产生新内容时,Baiduspider会通过互联网中某个指向该页面的链接进行访问和抓取,如果您没有设置任何外部链接指向网站中的新增内容,则Baiduspider是无法对其进行抓取的。对于已被抓取过的内容,搜索引擎会对抓取的页面进行记录,并依据这些页面对用户的重要程度安排不同频次的抓取更新工作。# @8 o. Z: Z( ^# H/ Q8 f+ f
0 M/ E8 P; a' W" l* g' y- B

* E4 H$ V1 j$ y+ S- p5 V5 R
( X7 p3 j. d, w5 Y$ d: m2 e# w9 b2  需您要注意的是,有一些抓取软件,为了各种目的,会伪装成Baiduspider对您的网站进行抓取,这可能是不受控制的抓取行为,严重时会影响到网站的正常运作。点此识别Baiduspider的真伪。1 X) \; _" D+ M
' H# O+ X; U2 G9 b; D0 W. |5 C0 o

: U* r1 L4 T' C9 A2 {6 b0 m9 w; u
3过滤$ J+ A" V, R/ u( {$ ]2 t

! H) j: L. s4 w6 ]% }7 a   互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接,空白内容页面等。这些网页对用户、站长和百度来说,都没有足够的价值,因此百度会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦。
! L3 [( c/ }% m! c5 U" Z& j& {# i8 i9 q3 k4 v/ j; t" g

2 ^0 F% D  E9 K: Q5 _. F# C! F5 U: z5 B' f8 h/ f1 y7 ]$ R2 ~  q
4建立索引1 D/ D- Q- S  _! A( H1 x3 ?8 ~

- P; \' ^$ i- z$ A- H* `    百度对抓取回来的内容会逐一进行标记和识别,并将这些标记进行储存为结构化的数据,比如网页的tagtitle、metadescripiton、网页外链及描述、抓取记录。同时,也会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹配。+ N9 e  y( j3 R2 W5 T; f% Y8 p
* a6 |2 k- I& e# j* y/ k# J8 [

& w7 _' E5 r; o  [2 M4 R- o9 C  f$ V/ J
5输出结果6 \* T% }8 I* F2 g) n; Y' @# Q

$ a4 [' \6 z* ?8 m2 Q; ~& e3 c+ h( j& }    用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。
: R7 x6 [- V" C3 ]: z
3 B& [  u0 m9 h7 y; K% q原文出处:小型吊车www.jnlxjt.com
回复

使用道具 举报

tian1004 发表于 2026-03-11 08:33:37 | 显示全部楼层
说得很实在,没有夸大其词,这种真实分享太难得了
回复 支持 反对

使用道具 举报

精彩台湾 发表于 2026-03-13 23:21:48 | 显示全部楼层
完全赞同,我也是这么认为的,英雄所见略同~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入怎通

本版积分规则

QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

GMT+8, 2026-3-16 16:05 , Processed in 0.110189 second(s), 24 queries , Gzip On.

免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表