基于节点列表的项集表示框架的频繁模式(项集)挖掘研究进展
我们小组提出了基于模式树节点集的新颖数据结构,并把这类结构应用到数据挖掘核心任务-频繁模式挖掘中,形成了一系列的算法。这种结构从底层改变了频繁项集的挖掘方式和效率,有效地提升了挖掘速度,可以重写所有与频繁项集挖掘相关的任务,如闭模式、最长模式和TOP-K模式等。
我们已发表的算法包括2010年发表在《International Journal of Computational Intelligence Systems》的PPV算法、2012年发表在《SCIENCE CHINA Information Sciences》上的PrePost算法以及2014年发表在《Expert Systems with Applications》的FIN算,对这三个算法有兴趣的人可以从以下网址免费下载。
PPV算法(论文题目:A New Fast Vertical Method for Mining Frequent Patterns)下载地址:http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm
PrePost算法(论文题目:A New Algorithm for Fast Mining Frequent Itemsets Using N-Lists)下载地址:http://info.scichina.com:8084/sciFe/EN/abstract/abstract508369.shtml 或http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm
FIN算法(论文题目:Fast mining frequent itemsets using Nodesets)下载地址:http://www.sciencedirect.com/science/article/pii/S0957417414000463或http://www.cis.pku.edu.cn/faculty/system/dengzhihong/dengzhihong.htm