辽宁工程技术大学学报(自然科学版)

2007, No.136(06) 892-894

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于全置信度关联分析的web层次聚类方法
Hierarchical clustering Web pages method based on all-confidence association analysis

史庆伟;赵政;鲍虎;

摘要(Abstract):

为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度阈值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。

关键词(KeyWords): 关联规则;层次聚类;网页文档;文本挖掘

Abstract:

Keywords:

基金项目(Foundation): 天津市科技发展计划基金资助项目(07JCZDJC067007)

作者(Author): 史庆伟;赵政;鲍虎;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享