找回密码
 加入怎通
查看: 637|回复: 0

[关于百度] 什么是隐含语义索引原理

[复制链接]
起点 发表于 2012-09-06 11:34:33 | 显示全部楼层 |阅读模式
      当搜索引擎爬取并下载站点页面后,隐含语义索引LSI (Latent Semantic Index)。LSI会把下载网页的所有单词制作成一个列表,然后就是将一些没有语义的单词过滤(比如停用词,过滤词等),然后再将站点所有的页面都做出单词列表。然后利用这些列表就可以做一个以页面(文档)为X轴,单词为Y轴的巨型矩阵。如果一个单词出现在某个页面,那么对于的页面位置我们标为1,反之就为0。这样就可以很清晰的看到每个单词在整站页面出现的频率,这就是隐含语义索引原理了www.xbhgb.com% L" C% f0 _8 b1 r/ V7 ~' ~
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-28 03:06 , Processed in 0.237107 second(s), 24 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表