利用关键词序列得到的用户事务模式经过聚类以后,形成了表达用户个性化信息需求的不同模式特征。和关键词序列相比,聚类后的用户事务模式显然具有更少的数量和更明确的个性化特征,所以使用此用户事务聚类模式就可以进行下一步的个性化信息推荐活动。 4 d) ?% C/ A, b, _ 2 G/ P5 O. T* I5 K3 m4 K7 u 最后,相关的网页权重计算工作无需在线进行,只需利用离线阶段的存储数据即可计算,从而能够有效节省用户查询所需要的时间开销。& i) e' [6 e5 k9 l
! x5 {2 T1 T& h( L G! q* U 较为常见的个性化网页权重方式为个性化PageRank方法。传统的PageRank是一种用于查询结果网页的相关度排序技术,它通过网页问的链人和链出关系来计算不同网页的权重值,并据此来实现网页排序。这种算法目前已有多种衍生类型,主要目的都是着眼于对结果做进一步的信息表达。其中,最为常见的做法是使用个性化PageRank向量来表达不同用户的个性化信息需求,并使用此向量计算网页的相关度,从而产生针对特定用户的个性化搜索结果。 # u: d4 L8 V! w" y5 C% `6 U& f 7 b7 c% q3 o+ h- Y 显然,此处的算法和选用的模型是相关的,要根据对简易性和正确性的权衡情况来决定所选模型类型,甚至是一些其他模型,这些其他模型多半采用基于树状导航图结构的数据挖掘算法,如聚类、序列模型挖掘、频繁项挖掘等。去痘印; c" o, {# w* V7 r9 p- N4 h1 X
0 {9 g( ~1 }/ d. `9 T
目前搜索引擎中常见的个性化信息推荐方式主要有两种:一种是查询改进;一种是个性化网页权重。前者主要是利用改变用户实际搜索的关键词内容来表达用户的个性化信息需求,而后者主要是根据网页权重对结果网页进行排序来表达用户的个性化信息需求。基于个性化网页权重的推荐方法和基于查询改进的推荐方法相比,具有很多优势,主要表现在以下几个方面: 6 t4 F M9 b) R- T0 {5 D% h6 O. I: g0 [+ V4 H8 V9 _6 ^
基于个性化网页权重的推荐算法思想是在传统的网页权重算法基础之上,通过合理地修改和添加其中使用的具体参数,以表达不同用户的个性化需求特征,从而计算出不同用户所特有的网页权重值,并在用户查询时,利用这个值来计算网页的相关度和优先级。( ^# S* P. I+ _; k) U
- E; ?9 p y: T* T- v4 x/ e/ _