找回密码
 加入怎通
查看: 631|回复: 0

[关于百度] 什么是隐含语义索引原理

[复制链接]
起点 发表于 2012-09-06 11:34:33 | 显示全部楼层 |阅读模式
      当搜索引擎爬取并下载站点页面后,隐含语义索引LSI (Latent Semantic Index)。LSI会把下载网页的所有单词制作成一个列表,然后就是将一些没有语义的单词过滤(比如停用词,过滤词等),然后再将站点所有的页面都做出单词列表。然后利用这些列表就可以做一个以页面(文档)为X轴,单词为Y轴的巨型矩阵。如果一个单词出现在某个页面,那么对于的页面位置我们标为1,反之就为0。这样就可以很清晰的看到每个单词在整站页面出现的频率,这就是隐含语义索引原理了www.xbhgb.com5 i, E; {7 M: x8 G8 g2 ~, E
回复

使用道具 举报

2026年3月12日真牛社区(fd.znbgj.com)签到记录贴
我今天最想说:「www.hzzdsw.com 加油」.

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-3-13 10:34 , Processed in 0.122360 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表