在推薦系統(tǒng)當中有一個經(jīng)典的問題:EE問題。
EE具體是指:Explanation和Explorer。
這兩個實際上對應(yīng)了衡量推薦系統(tǒng)做的好壞的兩個核心指標:可解釋性和探索性。
直白點講:可解釋性是指為什么給用戶推薦這個item,它是有理由的,一定程度上代表了推薦系統(tǒng)的準確性;探索性是指如何基于推薦結(jié)構(gòu)來挖掘更多用戶潛在的興趣點,一定程度上代表了推薦系統(tǒng)的新穎性,有時候也叫驚喜度。
準確性我們通常能夠通過更精準的用戶畫像來保證,那么新穎性怎么保證?
熱門召回策略就是是一個很好的方法,用來挖掘用戶潛在的偏好點。
所謂的熱門召回通常是指基于特定維度下去計算每個item的得分,一般命名為熱度得分,得分越高,表明在平臺的熱度越高,按照熱度選出TopN的item。
比如:
對于商品我們可以衡量商品的銷量,好評,下單轉(zhuǎn)化,點擊轉(zhuǎn)化,優(yōu)惠力度等等;
對于短視頻我們可以衡量短視頻的播放量、點贊量、收藏量,完播率,點贊率,轉(zhuǎn)發(fā)率等等。
當然,需要特別注意的是,在選取表征每個item熱度的特征時候,要盡量能反映商品的真實熱度,同時給與不同的權(quán)重。例如,對于一件商品來說,下單率比點擊率往往更能反映買家對商品的喜愛程度,較高點擊率而較低下單率的商品可能存在標題黨問題;同樣對于一個視頻,完播率可能更重要些。
還需要注意的是,不同的商品由于推薦系統(tǒng)分發(fā)策略的問題存在曝光量不同甚至差別很大的情況,因此直接比較各種指標會存在公平性問題。比如薯片銷量為10W和電腦銷量為100臺明顯不具有可比性,在實踐中,通常可以采用歸一化的方法,使得各商品間指標具有可比性。
這個我們上上周的視頻號直播提到了,感謝興趣的可以回復(fù)【數(shù)據(jù)能力直播】,觀看回放。
接下來,給大家重點介紹一種我之前在京東做過的熱門召回中熱度計算的策略,用在其他類型的業(yè)務(wù)其實也可以。
基于牛頓冷卻定律
牛頓冷卻定律是指我們在物品熱度計算當中增加了時間衰減因素,進而使得熱度計算更加合理,一定程度上能夠減輕基于得分排序的一些不良問題,比如馬太效應(yīng)。
熱度分 = 初始熱度分 + 用戶交互產(chǎn)生的熱度分 – 隨時間衰減的熱度分
其中:
S0:按照商品類別給予商品不同的初始熱度,讓用戶關(guān)注度高的類別獲得更高的初始熱度分,從而獲得更多的曝光,通常會參考商品本身的特征,比如上面提到的銷量(sale),好評(comment),下單轉(zhuǎn)點擊轉(zhuǎn)化(CXR),優(yōu)惠力度(discount)。這樣我們就能夠得到商品本身的初始熱度:
S0=W1*saleScore+W2*commentScore+W3*CXRScore+W4*discountScore
S(Users):對于單個商品,用戶可以點擊閱讀(click),收藏(favor),分享(share),評論(comment)這四種行為,我們?yōu)椴煌男袨橘x予分數(shù),就能得到商品的實時用戶行為分為:
S(Users) = W1*clickScore + W2*favorScore + W3*commentScore + W4*shareScore
牛頓冷卻定律: 本期溫度 = 上一期溫度 x exp(-(冷卻系數(shù)) x 間隔的小時數(shù))
相應(yīng)的我們可以在熱度計算當中加入時間的因素:
T(Time) = e ^ (k*(T1 – T0)) 其中T0是商品發(fā)布時間,T1是當前時間。
以上就是之前常用的一種熱度策略的設(shè)計方法。
本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/product/70083.html