于洪 重庆邮电大学计算机科学与技术研究所 重庆 400065谌强 重庆邮电大学计算机科学与技术研究所 重庆 400065 摘 要:为更好地适应Web搜索结果聚类的客观性要求,提出了一种基于熵的自适应搜索结果聚类方法。为此,该方法首先运用投票机制确定聚类中心,再引入信息熵来自动确定聚类数目,使聚类结果更客观真实。同时,采用了改进的多方位加权函数权值计算方法,预处理过程中采用了合并词形成短语的方法束弥补分词软件的不足,以进一步提高聚类效果。实验表明新方法是可行有效的。 |
评论列表
0:
暂无评论
读完这篇文章后,您心情如何?