关联分析是什么意思

2024-03-15 18:11:30
会计小百科
会计小百科认证

会计小百科为您分享以下优质知识

关联分析就是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现.一个典型的例子就是购物篮分析,其目的是发现交易数据中不同商品之间的联系规则,让营销商制定更好的营销策略.例如,经典的啤酒和尿布案例,数据挖掘发现在大型超市中购买啤酒的男士经常同时购买小孩的纸尿裤,基于这一发现,超市把啤酒和纸尿裤摆放在一起,结果两种商品的销售量都有明显提升.消费者行为海量数据的关联分析在电商精准销售中得到广泛应用,对其货品种类、库存、仓储、物流和广告业务都有极大的效益回馈。

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。

或者说,关联分析是发现交易数据库中不同商品(项)之间的联系。

关联分析的作用是什么?

购买了Diaper的顾客会购买Beer.这个关系不是必然的,但是可能性很大,这就已经足够用来辅助商家调整Diaper和Beer的摆放位置了,例如摆放在相近的位置,进行捆绑促销来提高销售量。

1、事务:每一条交易称为一个事务,例如示例1中的数据集就包含四个事务。

2、项:交易的每一个物品称为一个项,例如Cola、Egg等。

3、项集:包含零个或多个项的集合叫做项集,例如{Cola, Egg, Ham}。

4、k?项集:包含k个项的项集叫做k-项集,例如{Cola}叫做1-项集,{Cola, Egg}叫做2-项集。

5、支持度计数:一个项集出现在几个事务当中,它的支持度计数就是几.例如{Diaper, Beer}出现在事务 002、003和004中,所以它的支持度计数是3。

6、支持度:支持度计数除于总的事务数.例如上例中总的事务数为4,{Diaper, Beer}的支持度计数为3,所以它的支持度是3÷4=75%,说明有75%的人同时买了Diaper和Beer。

7、频繁项集:支持度大于或等于某个阈值的项集就叫做频繁项集.例如阈值设为50%时,因为{Diaper, Beer}的支持度是75%,所以它是频繁项集。

8、前件和后件:对于规则{Diaper}→{Beer},{Diaper}叫做前件,{Beer}叫做后件。

9、置信度:对于规则{Diaper}→{Beer},{Diaper, Beer}的支持度计数除于{Diaper}的支持度计数,为这个规则的置信度.例如规则{Diaper}→{Beer}的置信度为3÷3=100%.说明买了Diaper的人100%也买了Beer。

10、强关联规则:大于或等于最小支持度阈值和最小置信度阈值的规则叫做强关联规则.关联分析的最终目标就是要找出强关联规则?。

以上详细介绍了关联分析是什么意思,也介绍了关联分析的作用是什么.通过本文的介绍,我们可以知道,关联分析是对数据集中反复出现的相关关系和关联性进行挖掘提取,从而可以根据一个数据项的出现预测其他数据项的出现。