R语言 Apriori算法

您所在的位置：网站首页 › 导入apriori函数的代码 › R语言 Apriori算法

R语言 Apriori算法

2024-07-11 02:45:38| 来源: 网络整理| 查看: 265

R语言 Apriori算法

Apriori算法用于寻找数据集中的频繁项集，用于关联规则挖掘。它被称为Apriori，因为它使用了关于频繁项集属性的先验知识。我们采用迭代法或逐级搜索法，用k个频繁项集来寻找k+1个项集。为了提高频繁项目集的逐级生成的效率，我们使用了一个重要的属性，叫做Apriori属性，它有助于减少搜索空间。使用R编程语言来实现这个算法非常容易。

Apriori属性：频繁项集的所有非空子集必须是频繁的。Apriori假设一个频繁项集的所有子集必须是频繁的（Apriori属性）。如果一个项目集是不频繁的，它的所有超集都是不频繁的。

从本质上讲，Apriori算法将一个更大的数据集的每一部分，以某种有序的方式与其他集进行对比。所得到的分数被用来生成被归类为在更大的数据库中频繁出现的集合，用于收集汇总数据。在实际意义上，人们可以通过查看一些应用来更好地了解该算法，如市场篮子工具，它有助于弄清哪些物品是在市场篮子中一起购买的，或金融分析工具，它有助于显示各种股票的共同趋势。Apriori算法可与其他算法结合使用，以有效地对数据进行分类和对比，从而更好地展示复杂系统如何反映模式和趋势。

重要的术语支持度：支持度是项目集在数据集中出现的频率的一种指示。它是包含一个项目’x’的记录数除以数据库中的记录总数。置信度：置信度是一个衡量时间的标准，即如果一个项目’x’被购买，那么项目’y’也会被一起购买。它是（x U y）的支持数除以’x’的支持数。提升：提升是观察到的支持率与如果’x’和’y’是独立的预期支持率的比率。它是(x U y)的支持数除以’x’和’y’的单独支持数的乘积。算法读取交易中的每个项目。计算每个项目的支持度。如果支持度小于最小支持度，则丢弃该条目。否则，将其插入频繁项目集。计算每个非空子集的置信度。如果置信度小于最小置信度，丢弃该子集。否则，将其放入强规则中。 Apriori算法在R中的实现

RStudio为R统计计算环境提供流行的开源和企业就绪的专业软件。R是一种为支持统计计算和图形计算/可视化而开发的语言。它有一个内置的库函数，称为 arules ，它实现了市场篮子分析的Apriori算法，并通过关联规则挖掘计算出强规则，一旦我们根据我们的需要指定最小支持度和最小置信度。下面是Apriori算法所需的代码和相应的输出。 Groceries 数据集也被用于此，它在R的默认数据库中可用。它包含9,835条交易/记录，每条都有’n’个从杂货店购买的物品。

例子

第1步：加载所需的库

arules “包为表示、操作和分析交易数据和模式提供了基础设施。

library(arules)

‘arulesviz ‘ 包用于关联规则和频繁项集的可视化。它用关联规则和项目集的各种可视化技术扩展了包’arules’。该包还包括几个用于规则探索的交互式可视化。

library(arulesViz)

RColorBrewer “是一个ColorBrewer调色板，为地图和其他图形提供颜色方案。

library(RColorBrewer)

第2步：导入数据集

Groceries “数据集是在R包中预定义的。它是一组9835条记录/交易，每条记录都有’n’个项目，都是从杂货店购买的。

data("Groceries")

第3步：应用apriori()函数

apriori() “函数是内置在R中的，使用Apriori算法挖掘频繁项集和关联规则。这里，’Groceries’是交易数据。’参数’是一个命名的列表，指定了寻找关联规则的最小支持度和置信度。默认行为是挖掘最小支持度为0.1，最小置信度为0.8的规则。这里，我们指定最小支持度为0.01，最小置信度为0.2。

rules

【本文地址】

公司简介

联系我们

今日新闻

使用apriori算法

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

R语言 Apriori算法

R语言 Apriori算法

今日新闻

点击排行

推荐新闻

图片新闻

专题文章