日期:2014-05-16  浏览次数:20442 次

数据挖掘之挖掘大型数据库中的关联规则学习笔记

挖掘大型数据库中的关联规则

?

?

关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析。

?

关联规则挖掘寻找给定数据集中项之间的有趣联系

?

规则的支持度和置信度是两个规则兴趣度度量,它们分别反映发现规则的有用性和确定性,。关联规则是有趣的,如果它满足最小支持度阈值和最小置信度阈值。这些阈值可以由用户或领域专家设定。

?

I = { i1 , i2 ,..., im }是项的集合。设任务相关的数据D 是数据库事务的集合,其中每个事务T

是项的集合,使得T í I。每一个事务有一个标识符,称作TID。设A 是一个项集,事务T 包含A当且仅当A í T。关联规则是形如A T B 的蕴涵式,其中A ì IB ì