隨著數(shù)據(jù)分析的不斷應(yīng)用與發(fā)展,用戶畫像已經(jīng)廣為人知。其中的核心原理就是對(duì)用戶進(jìn)行分群,而用戶分群的主要邏輯就是將數(shù)據(jù)進(jìn)行標(biāo)簽化。
RFM模型是我們常用來分析客戶價(jià)值的數(shù)據(jù)分析模型,使用這個(gè)模型分析后配合匹配的營(yíng)銷方法,能夠讓業(yè)績(jī)進(jìn)行大幅度提升。
RFM模型具有分析結(jié)構(gòu)簡(jiǎn)單,易用、數(shù)據(jù)容易獲取等特性,通過這個(gè)模型可以衡量客戶價(jià)值和創(chuàng)造利潤(rùn)能力。
通過3個(gè)簡(jiǎn)單的指標(biāo),可以將客戶按照價(jià)值分成8個(gè)類別,從而使用不同的銷售策略提升業(yè)績(jī)。
下面給大家介紹一個(gè)關(guān)于RFM模型的標(biāo)簽化應(yīng)用案例。
首先拿到數(shù)據(jù)集,導(dǎo)入數(shù)據(jù)集。
然后我們會(huì)進(jìn)行數(shù)據(jù)讀取,看一下數(shù)據(jù)的基本信息數(shù)據(jù)是否有無缺失。
第二步我們將數(shù)據(jù)集進(jìn)行特征篩選。
首先我們發(fā)現(xiàn)導(dǎo)入的原始數(shù)據(jù)的時(shí)間格式有一些問題,因此將時(shí)間進(jìn)行了處理。
通過一些掉包的方式將時(shí)間格式處理成了我們想要的時(shí)間格式,然后我們將數(shù)據(jù)集進(jìn)行RFM的計(jì)算。
首先,計(jì)算R。
因?yàn)镽是取消費(fèi)的時(shí)間間隔,所以我們?nèi)〕隽嗣總€(gè)客戶ID下的最近的一次消費(fèi)時(shí)間,然后定義了一個(gè)最大的消費(fèi)時(shí)間,然后與其做相減得出來了每個(gè)客戶的最近一次的消費(fèi)時(shí)間間隔。
第二個(gè)是計(jì)算F。
F是計(jì)算客戶對(duì)于打折商品的偏好程度。
所以我們將數(shù)據(jù)進(jìn)行了處理之后,計(jì)算出來了特價(jià)商品占特價(jià)商品跟普通商品的比例,這樣得出來了用戶對(duì)于打折商品的用戶的偏好程度。
第三個(gè)是計(jì)算M。
M是用戶的消費(fèi)金額,我們將數(shù)據(jù)進(jìn)行加加減減,最后得出來了用戶關(guān)于特價(jià)商品跟普通商品的消費(fèi)金額。
然后我們將所計(jì)算的RFM進(jìn)行了特征的整合,得出來了每個(gè)客戶ID下的RFM具體的數(shù)值。
然后下一步將RFM進(jìn)行分段打分。
這里給出兩個(gè)方法。
一是函數(shù)映射。
我們將數(shù)據(jù)當(dāng)中的RFM進(jìn)行了等級(jí)分箱的處理,然后定義了分段函數(shù),將每個(gè)RFM的值對(duì)分段函數(shù)進(jìn)行比較,得出來了一個(gè)01RFM的數(shù)據(jù)集。
第二個(gè)方法是利用Python自帶的算法庫。
我們將閾值取出,然后將閾值進(jìn)行01編碼,最后也是同樣能夠得到RFM的01數(shù)據(jù)。
然后我們將RFM模型定性的輸出,將01進(jìn)行標(biāo)簽化的處理,從而給用戶打上各種各樣的標(biāo)簽:興趣是否高,價(jià)值是否活躍……
我們可以通過這些標(biāo)簽給到業(yè)務(wù)端人員進(jìn)行更好的營(yíng)銷活動(dòng)。
好的,以上就是今天的分享。如果大家還有數(shù)據(jù)分析方面相關(guān)的疑問,就在評(píng)論區(qū)留言。
文:CDA資深講師 張藉予
本文經(jīng)授權(quán)發(fā)布,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/quan/61820.html