當前位置:首頁 » 網購平台 » r平台的關聯分析購物籃
擴展閱讀
寧波奧德賽優惠價格 2021-03-15 14:26:02
丹尼斯購物卡能掛失么 2021-03-15 14:25:58
淘寶購物指紋驗證失敗 2021-03-15 14:24:44

r平台的關聯分析購物籃

發布時間: 2021-02-16 01:10:44

『壹』 什麼是購物籃分析(Market Basket Analysis)

將單個客戶一次購買商品的總和(以收銀台結賬為准)稱為一個購物籃。那麼購物籃分析就是針對商品的相關性進行分析。因為最初這種關聯分析主要是在超市應用廣泛,所以也稱為「購物籃分析」。

購買一種商品的顧客佔全部顧客的一個比率。反映的是全品類的關聯能力,行業參考值為40%,該值越小越好,越小說明關聯能力越強。

客品次指一段時間里平均每位顧客購買的商品品種數。這里主要指中西成葯。其反映的中西成葯的關聯能力。客品次=累計商品品種數/客流量,行業參考值是1.8。

(1)r平台的關聯分析購物籃擴展閱讀

如果在研究的問題中,一個用戶購買的所有產品假定是同時一次性購買的,分析的重點就是所有用戶購買的產品之間關聯性;如果假定一個用戶購買的產品的時間是不同的,而且分析時需要突出時間先後上的關聯,如先買了什麼,然後後買什麼。

那麼這類問題稱之為序列問題,它是關聯問題的一種特殊情況。從某種意義上來說,序列問題也可以按照關聯問題來操作。

關聯分析有三個非常重要的概念,那就是「三度」:支持度、可信度、提升度。假設有10000個人購買了產品,其中購買A產品的人是1000個,購買B產品的人是2000個,AB同時購買的人是800個。支持度指的是關聯的產品(假定A產品和B產品關聯)同時購買的人數占總人數的比例,即800/10000=8%。

有8%的用戶同時購買了A和B兩個產品;可信度指的是在購買了一個產品之後購買另外一個產品的可能性,例如購買了A產品之後購買B產品的可信度=800/1000=80%。

『貳』 請問excel怎麼做商品關聯數據透視

這個需求是一個購物籃分析。從您的描述來看,我能想到的最簡單辦法是:

  1. 在原始數版據表裡權,把一個訂單的商品名稱組合成一個欄位,如您所說的abcd這樣的

  2. 直接用數據透視表對這個商品組合欄位進行計數。再按從大到小排列,這樣就可以看出哪些商品組合購買次數最多了。

『叄』 如何用r語言把關聯分析中數據做成ld圖

: 主要介紹R語言繪制圖琢磨思路繪制圖步驟三: 需要繪制圖;(約等於廢) 要繪制圖理信息經緯度啊邊界啊等等; 利用2數據R畫 步驟目前關鍵2r語言編寫數據用關系圖展示前端頁面

『肆』 R語言做關聯分析

tr=read.transactions(file="apri.txt",format = "single",cols = c(2,1))

cols錯了

『伍』 從資料庫中查詢每位顧客購買的情況,想知道怎麼轉化成購物籃數據的格式,用於R語言上

直接上SQL語句襲

create table tb(顧客 varchar(10),商品 varchar(10),價格 int);

insert into tb VALUES ('張三','手錶',74);
insert into tb VALUES ('張三','錢包',22);
insert into tb VALUES ('張三','食物',8);
insert into tb VALUES ('李四','手錶',260);
insert into tb VALUES ('李四','錢包',100);

insert into tb VALUES ('李四','食物',100);

select * from tb;

select * from tb pivot( MAX(價格) for 商品 in (手錶,錢包,食物))a

『陸』 我有一批保存在excel中的超市數據,分別是訂單號和產品名稱,想做一個購物籃分析,請問如何做呢急求~

有關置信來度分析,按照所基於的分析模自型的不同,應該有很多演算法吧,而且,會牽涉到需要精確邏輯的編程。這樣籠統地一個提問,貌似很難幫到你。再說,一個復雜的大數據問題,在網路知道這樣的簡單交互平台也很難細致地溝通啊。

『柒』 多維關聯規則挖掘演算法r語言能實現嗎

一下自己學習關聯規則經典演算法Apriori的筆記。
1、概述
Apriori演算法是用一種稱為逐層搜索的迭代方法,從項集長度k=1開始,選出頻繁的k=1項集,根據先驗性質:頻繁項集的子集一定是頻繁的(逆否命題:非頻繁項集的超集一定是非頻繁的,通俗的說就是某件事發生的概率很低,比這件事發生條件更嚴苛的事情發生的概率會更低),篩選k=2項集中的頻繁項集,以此迭代k=3...。每迭代一次都要完整的掃描一次資料庫。
2、關聯規則三度:
支持度:佔比
置信度:條件概率
提升度:相關性
3、R語言示例代碼如下:(小眾語言的辛酸:選項里沒有。。)
[plain] view plain
library(arules)
#從rattle包中讀入數據
dvdtrans <- read.csv(system.file("csv", "dvdtrans.csv",package="rattle"))
str(dvdtrans)
#將數據轉化為合適的格式
data <- as(split(dvdtrans$Item,dvdtrans$ID),"transactions")
data

#用 apriori命令生成頻繁項集,設其支持度為0.5,置信度為0.8
rules <- apriori(data, parameter=list(support=0.5,confidence=0.8,minlen = 2))

#用inspect命令查看提取規則
inspect(rules)
常用數據形式有data.frame格式和list格式,前者即A項集為一列B項集為另一列,後者為A和B放在同一個購物籃中。

去除冗餘規則以及提取子規則代碼如下:

[plain] view plain
rendant.rm <- function(rule,by="lift")
{
#rule:需要進行簡化的規則
#by:在清除的時候根據那個變數來選擇,
#可能取值為"support","lift","confidence"
a <- sort(rule,by=by)
m<- is.subset(a,a,proper=TRUE)
m[lower.tri(m, diag=TRUE)] <- NA
r <- colSums(m, na.rm=TRUE) >= 1
finall.rules <- a[!r]
return(finall.rules)
}
rules <- rendant.rm(rules)
rules.sub <- subset(rules, subset = lhs %in% "篩選項集名稱" & lift > 1)

『捌』 r關聯分析可視化圖grouped matrix怎麼解釋

規則來挖掘包arules
規則可視自化包arulesViz
2.數據源選取載入
源數據:groceries 數據集,每一行代表一筆交易所購買的產品(item),形如:
citrus fruit,semi-finished bread,margarine,ready soups
tropical fruit,yogurt,coffee
whole milk
pip fruit,yogurt,cream cheese,meat spreads
other vegetables,whole milk,condensed m

『玖』 急需一份關於數據挖掘的數據集,是做關聯演算法Apriori演算法的數據集,

可以搜索weka bank-data。回答不能用超鏈接,你自己搜索一下吧。