来源:《时珍国医国药》2016年第12期  作者:杨涛;陆明;朱垚;
选择字号

基于FP-Growth的中医药数据关联分析平台的设计和应用

收藏本文  分享

随着中医大数据时代的到来,数据以几何级的速度增长,如何从海量的数据中提取出有价值的信息,是中医药现代化研究面临的挑战[1,2]。数据挖掘技术作为目前有效处理和利用海量数字信息的主要手段,是解决“信息过载而知识缺乏”的重要工具,有望开辟中医药理论研究和临床研究的新天地。中医药领域使用的数据挖掘方法众多,其中关联分析应用广泛[3]。当前大多数中医药数据关联分析采用通用的挖掘平台,如WEKA、SPSSClementine、Intelligent Miner等,需要研究者投入大量精力学习工具的使用。鉴于此,本文根据中医药数据特点,设计中医药数据关联分析平台XMiner,用于解决中医药数据的清洗、分析和展示问题,提高中医药数据分析和挖掘效率。1 FP-Growth算法简介常见的关联规则算法有Apriori[4]和FP-Growth[5]算法。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集,需要多次扫描原始数据,当数据量较大时效率低下。FP-Growth算法则只需扫描两次数据库,通过FP-Tree数据结构对原始数据进行压缩,效率较高。FP-Growth算法主要分为两个步骤:FP-Tr(本文共计3页)......[继续阅读本文]

下载阅读本文    订阅本刊

相关文章推荐

看看这些杂志对你有没有帮助...

更多杂志>>