ApacheCN 机器学习实战讲义十二、使用FP-growth算法来高效发现频繁项集

2018-05-03 00:03 作者:绝不原创的飞龙 0人读过 | 我要投稿

前言

在第11章时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则。
本章将继续关注发现 频繁项集 这一任务，并使用 FP-growth 算法更有效的挖掘 频繁项集。

class treeNode:

def __init__(self, nameValue, numOccur, parentNode):

self.name = nameValue # 节点名称

self.count = numOccur # 节点出现次数

self.nodeLink = None # 不同项集的相同项通过nodeLink连接在一起

# needs to be updated

self.parent = parentNode # 指向父节点

self.children = {} # 存储叶子节点

阅读全文：http://ml.apachecn.org/mlia/fp-growth/

标签：