设为首页收藏本站

开启辅助访问

r语言实现关联分析

您所在的位置：网站首页 › 数据挖掘apriori算法使用 › r语言实现关联分析

r语言实现关联分析

2024-07-16 18:20:25| 来源: 网络整理| 查看: 265

r语言实现关联分析–关联规则挖掘关联分析：

引子：我们一般把一件事情发生，对另一间事情也会产生影响的关系叫做关联。而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系（形如“由于某些事件的发生而引起另外一些事件的发生”）。我们的生活中有许多关联，一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系，分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买，这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。

关联分析的基本概念：

关联规则是指形如 x→y 的形式，x 和 y 分别成为关联规则的前项和后项。关联规则挖掘的数据是事务数据集，它包含事务ID和项的子集两个属性。（类似下面的数据框）在这里插入图片描述根据上面的数据介绍一些关联分析涉及到的基本概念项集：包含0个或多个项的集合，例如{A、B}，含有k个项就是k-项集。关联规则：形如A→B的关联，其中A∩B非空。支持度计数：包含特定项集的个数，由示例可知 σ(A→B)=2 表示同时包含AB的项集数为2. 支持度：包含特定项集的个数占总项集数的比值。频繁项集：满足最小支持度的所有项集置信度：用条件概率表示，c(A→B)=p(A|B) A发生的条件下B发生的概率. 期望置信度：在没有任何条件影响的情况下，事件A出现的概率提升度：关联规则A→B下 A事件发生对B事件产生的影响程度

关联分析有两个目标： 1.发现频繁项集（频繁项集是满足最小支持度要求的项集，它给出经常在一起出现的元素项） 2.发现关联规则（关联规则意味着元素项之间“如果…那么…”的关系）

常用的关联规则挖掘算法有Aprior算法 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。Apriori算法可挖掘出关联规则

Apriori算法

Apriori定律1：如果某个项集是频繁的，那么它的所有子集也是频繁的 Apriori定律2：如果某个项集是非频繁的，那么它的所有超集也是非频繁的 Apriori定律3：基于此，Apriori算法从单元素项集开始，通过组合满足最小支持度的项集来形成更大的集合

两个步骤：1.通过迭代找出事务数据集中所有频繁项集，即支持度不低于设定阈值的项集。 2.利用频繁项集构造出满足用户最小置信度的关联准则，利用支持度对候选项集进行剪枝。

此处以示例事务数据集演示手动计算过程，设置最小支持度阈值minsup=0.3.从生成c1开始，到不能找到任何频繁k项集为止，过程如下所示。

在这里插入图片描述在第一次扫描（1st scan）中，minsup=2，{D}不符合要求，因此剪掉，生成频繁1项集L1，L1自动链接生成候选2项集c2。L1中各项集只有一个项，因此两两组合。后面的操作与第一步操作类似。最终得到的频繁项集 L3={B、C、E} 它的任何2项子集都是频繁的。

此时便达到了关联分析的第一个目标：发现频繁项集。接着要寻找（构造）关联规则

关联规则：对每个频繁项集L，产生L的非空真子集，对L的每个非空真子集S，若都能满足置信度大于等于给定的最小置信度的情况下，即C(S→CS)≧min-conf，（CS表示S在L中的补集），那么就是强关联规则。。

对于L3，它的非空自己为{B},{C},{E},{B,C},{B,E},{C,E},假设置信度min-conf=0.5，则获得的关联规则及置信度如下在这里插入图片描述可见，置信度都大于最小置信水平，说明得到的关联规则都是强关联规则。

Apriori算法流程图：在这里插入图片描述

r语言实现Apriori算法

r语言中，arules包主要用于挖掘频繁项集和关联规则，该包中的apriori函数可以实现这个算法。下面是函数定义及参数说明函数定义：

apriori(data,parameter=NULL,appearance=NULL,control=NULL)

在这里插入图片描述

在这里插入图片描述

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

推荐新闻

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

专题文章

CopyRight 2018-2019 实验室设备网版权所有 win10的实时保护怎么永久关闭