apriori算法实现_Apriori算法小试

1、安装Python apriori算法包

$ pip install akapriori

2、生成测试集

decbe28445d4587cd4668048bbb588b2.png

3、计算关联规则

20ebdbc91f302694a5e1788fd915aac4.png

4、结果

(frozenset({'melon'}), frozenset({'persimmon'}), 0.06666666666666667, 1.0, 5.0)

(frozenset({'kiwi fruit'}), frozenset({'pear'}), 0.06666666666666667, 1.0, 5.0)

(frozenset({'persimmon'}), frozenset({'melon'}), 0.06666666666666667, 0.3333333333333333, 5.0)

(frozenset({'pear'}), frozenset({'kiwi fruit'}), 0.06666666666666667, 0.3333333333333333, 5.0)

(frozenset({'apricot'}), frozenset({'banana'}), 0.13333333333333333, 1.0, 2.5)

(frozenset({'apricot'}), frozenset({'cherry'}), 0.13333333333333333, 1.0, 2.5)

(frozenset({'grape'}), frozenset({'cherry'}), 0.06666666666666667, 1.0, 2.5)

(frozenset({'strawberry'}), frozenset({'cherry'}), 0.06666666666666667, 1.0, 2.5)

(frozenset({'mandarin'}), frozenset({'persimmon'}), 0.06666666666666667, 0.5, 2.5)

(frozenset({'apricot'}), frozenset({'pear'}), 0.06666666666666667, 0.5, 2.5)

(frozenset({'banana'}), frozenset({'apricot'}), 0.13333333333333333, 0.3333333333333333, 2.5)

(frozenset({'cherry'}), frozenset({'apricot'}), 0.13333333333333333, 0.3333333333333333, 2.5)

(frozenset({'persimmon'}), frozenset({'mandarin'}), 0.06666666666666667, 0.3333333333333333, 2.5)

(frozenset({'pear'}), frozenset({'apricot'}), 0.06666666666666667, 0.3333333333333333, 2.5)

截图形式的结果:

87ca818cc09a9c0f29cf9fbc3110d808.png

    关联规则挖掘是数据挖掘中最活跃的研究方法之一 。最早是由 Agrawal 等人提出的1993最初提出的动机是针对购物篮分析问题提出的,其目的是为了发现交易数据库中不同商品之间的联系规则。这些规则刻画了顾客购买行为模式,可以用来指导商家科学地安排进货,库存以及货架设计等。之后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作涉及到关联规则的挖掘理论的探索,原有的算法的改进和新算法的设计,并行关联规则挖掘Parallel Association Rule Mining,以及数量关联规则挖掘Quantitive Association Rule Mining 等问题。在提高挖掘规则算法的效率、适应性、可用性以及应用推广等方面,许多学者进行了不懈的努力。

    Apriori算法是种挖掘关联规则的频繁项集算法,一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。Apriori算法已经被广泛的应用到商业、网络安全等各个领域。Apriori算法采用了逐层搜索的迭代的方法,算法简单明了,没有复杂的理论推导,也易于实现。

参考:

https://github.com/aknd/akapriori


版权声明:本文为weixin_34368368原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。