关联分析是什么意思
关联分析就是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现.一个典型的例子就是购物篮分析,其目的是发现交易数据中不同商品之间的联系规则,让营销商制定更好的营销策略.例如,经典的啤酒和尿布案例,数据挖掘发现在大型超市中购买啤酒的男士经常同时购买小孩的纸尿裤,基于这一发现,超市把啤酒和纸尿裤摆放在一起,结果两种商品的销售量都有明显提升.消费者行为海量数据的关联分析在电商精准销售中得到广泛应用,对其货品种类、库存、仓储、物流和广告业务都有极大的效益回馈。
关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。
或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。
关联分析的作用是什么?
购买了Diaper的顾客会购买Beer.这个关系不是必然的,但是可能性很大,这就已经足够用来辅助商家调整Diaper和Beer的摆放位置了,例如摆放在相近的位置,进行捆绑促销来提高销售量。
1、事务:每一条交易称为一个事务,例如示例1中的数据集就包含四个事务。
2、项:交易的每一个物品称为一个项,例如Cola、Egg等。
3、项集:包含零个或多个项的集合叫做项集,例如{Cola, Egg, Ham}。
4、k?项集:包含k个项的项集叫做k-项集,例如{Cola}叫做1-项集,{Cola, Egg}叫做2-项集。
5、支持度计数:一个项集出现在几个事务当中,它的支持度计数就是几.例如{Diaper, Beer}出现在事务 002、003和004中,所以它的支持度计数是3。
6、支持度:支持度计数除于总的事务数.例如上例中总的事务数为4,{Diaper, Beer}的支持度计数为3,所以它的支持度是3÷4=75%,说明有75%的人同时买了Diaper和Beer。
7、频繁项集:支持度大于或等于某个阈值的项集就叫做频繁项集.例如阈值设为50%时,因为{Diaper, Beer}的支持度是75%,所以它是频繁项集。
8、前件和后件:对于规则{Diaper}→{Beer},{Diaper}叫做前件,{Beer}叫做后件。
9、置信度:对于规则{Diaper}→{Beer},{Diaper, Beer}的支持度计数除于{Diaper}的支持度计数,为这个规则的置信度.例如规则{Diaper}→{Beer}的置信度为3÷3=100%.说明买了Diaper的人100%也买了Beer。
10、强关联规则:大于或等于最小支持度阈值和最小置信度阈值的规则叫做强关联规则.关联分析的最终目标就是要找出强关联规则?。
以上详细介绍了关联分析是什么意思,也介绍了关联分析的作用是什么.通过本文的介绍,我们可以知道,关联分析是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现。
猜你喜欢内容
-
会计信息化用户是什么
会计信息化的用户主要包括 内部使用者和外部使用者两类。企业管理层:包括高管、部门经理、财务人员等,...
-
什么是决策分析管理会计
管理会计决策分析是 现代企业管理中不可或缺的一部分,它通过对企业财务数据的收集、整理、分析和评估,...
-
会计内部银行是什么样的
会计内部银行,也称为企业财务公司或内部结算中心,是企业内部设立的一种资金管理机构。它主要服务于企...
-
学会计有什么问题和难点
学会计可能会遇到以下问题和难点:会计涉及大量的知识点,如会计原理、会计准则、税法等,需要不断学习...
-
财务会计的财务什么意思
财务会计中的“财务”主要指的是 与资金的筹集、分配和使用相关的活动。具体来说,财务涉及企业或组织的...
-
会计为什么被称为背锅侠
会计被称为“背锅侠”的原因主要有以下几点:会计人员在工作中经常面临道德与利益的抉择。管理层为了短...
-
农村会计四个明细是什么
农村会计的四个明细主要包括以下几类:记录了每天的收支情况,包括农产品销售、农资采购等。详细记录了...
-
总办会计一般是什么职位
总办会计一般指的是 总账会计或 主办会计,这是单位内部设立的会计职位,负责全盘账务处理、财务报表编...
-
餐费发票记什么会计分录
餐费发票的会计分录需要根据餐费的具体用途和受益对象来确定。以下是几种常见情况的会计科目归类及相应...
-
注册会计师什么积称
注册会计师, 简称为CPA,是指通过注册会计师全国统一考试并取得注册会计师证书,在会计师事务所执业的...