大家好,我是張濤,在加入神策數(shù)據(jù)之前的 10 年中,我一直在 C 端產(chǎn)品中從事產(chǎn)品設(shè)計(jì)和運(yùn)營管理相關(guān)的工作,做的產(chǎn)品包括工具類、電商類、內(nèi)容類等,在這個(gè)過程中,關(guān)于搜索推薦操盤過很多實(shí)踐的項(xiàng)目,有從 0 開始做的,也有在中后期介入做優(yōu)化迭代的。因此,今天關(guān)于推薦的分享可能不那么偏技術(shù)視角,這有一個(gè)好處,是幫助產(chǎn)品和運(yùn)營人員更加了解推薦,也讓技術(shù)更了解業(yè)務(wù)產(chǎn)品視角下的推薦。
今天的分享將為大家解答以下幾個(gè)問題。你的公司是否適合采用個(gè)性化推薦?如果需要個(gè)性化推薦,該如何做好?產(chǎn)品運(yùn)營在參與到一個(gè)推薦系統(tǒng)的構(gòu)建當(dāng)中,有哪些常見的坑?有哪些可以避開這些坑的一些簡單方法?以及如何修煉成一個(gè)優(yōu)秀的推薦產(chǎn)品經(jīng)理?
一、 “四個(gè)關(guān)鍵”為你揭開推薦系統(tǒng)的神秘面紗
個(gè)人認(rèn)為,推薦系統(tǒng)是根據(jù)用戶以及不同的場景差異,對信息進(jìn)行合理的排序、過濾,解決信息過載問題的一套機(jī)制。這個(gè)定義中包含四個(gè)關(guān)鍵點(diǎn),如下:
1.“根據(jù)用戶以及不同的場景差異”
對于很多剛開始做推薦的人可能會(huì)忽略這一點(diǎn),大部分人在思考推薦時(shí)想的更多的可能是基于用戶來做,但其實(shí)我從眾多實(shí)踐中發(fā)現(xiàn),很多時(shí)候推薦產(chǎn)生價(jià)值不僅僅只是說以用戶進(jìn)行區(qū)分,相關(guān)場景的差異會(huì)對于最后推薦效果產(chǎn)生巨大的影響。
2.“推薦的本質(zhì)是對信息進(jìn)行合理的排序、過濾”
很多人認(rèn)為推薦是一個(gè)魔盒,非常神奇,其實(shí)究其本質(zhì)是企業(yè)有成千上萬甚至上億的 item,不管這些 item 是文章、視頻,還是電商里面的商品,然后現(xiàn)在有某個(gè)人在一個(gè)具體的場景里面,企業(yè)需要把這些 item 給他看,那應(yīng)該把哪個(gè)放在第一個(gè)?這就是推薦系統(tǒng)背后的運(yùn)作原理。
3.“推薦系統(tǒng)要解決信息過載的問題”
舉個(gè)例子,如果你的企業(yè)只做爆款商品,整個(gè)公司只賣兩個(gè)商品,這樣用戶一看就明白了,顯然也不需要推薦,所以做推薦的一個(gè)前提條件是你公司本身提供的業(yè)務(wù)里面的信息太多了,對于一個(gè)正常的自然人來說,他處理不了那么多信息的時(shí)候,企業(yè)才需要去幫助用戶解決信息過載的問題,從而為用戶設(shè)計(jì)這樣一套機(jī)制。
4.“一套機(jī)制”
這點(diǎn)很好理解,推薦系統(tǒng)是由不同的算法、規(guī)則等構(gòu)成的一套機(jī)制。這四點(diǎn)是我從產(chǎn)品視角為你解讀了什么是推薦系統(tǒng),以及他的一些簡單作用。
二、推薦系統(tǒng)、廣告系統(tǒng)、搜索系統(tǒng)三者有何不同?
事實(shí)上,解決我在前面提到的一系列問題,推薦系統(tǒng)并不是唯一的方法。比如,前面所提到的排序、過濾,做技術(shù)的同學(xué)應(yīng)該很容易聯(lián)想到,搜索和廣告系統(tǒng)也涉及排序、過濾,且搜索也一定程度上解決了信息過載。那么,這三個(gè)系統(tǒng),它到底有什么區(qū)別呢?我從 5 個(gè)方面對其進(jìn)行了對比,下面將一一講述:
1.用戶獲取信息的方式。
廣告與推薦系統(tǒng),用戶都是被動(dòng)的,但搜索不一樣,用戶是主動(dòng)搜索的,他需要輸入一些關(guān)鍵詞,會(huì)加入一些自己的意見和重點(diǎn)。
2.點(diǎn)擊率要求。
這三個(gè)系統(tǒng)對點(diǎn)擊率都有要求,僅在要求上有些區(qū)別,這就不祥述了。
3.驚喜度要求。
對于廣告和搜索系統(tǒng)來說,不需要太多的驚喜度。比如,如果我搜一個(gè)關(guān)鍵詞,搜索到我想要的資料時(shí),并不會(huì)覺得很驚喜,甚至認(rèn)為是理所當(dāng)然,但是在推薦系統(tǒng)里,用戶往往對驚喜度是有要求的。
具體來說,用戶對于一個(gè)推薦系統(tǒng)的期望是希望產(chǎn)品能夠給他們一些驚喜,如用戶 A 雖然不知道產(chǎn)品用了什么數(shù)據(jù)、什么方法,但如果突然推薦了一首可能他已經(jīng)快遺忘的自己卻很喜歡的歌時(shí),他就會(huì)因感到產(chǎn)品“好懂我”而驚喜。
4.個(gè)性化要求。
在廣告和搜索系統(tǒng),個(gè)性化的需求是可有可無的,不管有沒有系統(tǒng)也能正常運(yùn)作。但是,對于推薦系統(tǒng)來說,個(gè)性化要求非常高,甚至越高越好。因?yàn)閭€(gè)性化推薦針對的是差異化的單個(gè)場景,一定會(huì)有個(gè)性化的要求。
5.用戶反饋。
廣告和搜索系統(tǒng)存在比較隱性的反饋,即對于搜索結(jié)果好不好?一般很少有搜索引擎廠商會(huì)直接問用戶,你喜不喜歡搜索結(jié)果,更多是廠商去判定廣告效果和搜索效果,一般是通過 CTR,或通過整個(gè)產(chǎn)品的某些長期留存表現(xiàn)來判定。但是,對于推薦系統(tǒng)來說,很多推薦產(chǎn)品會(huì)直接地問用戶的喜好,存在很明顯的顯性主觀表達(dá)。
因此,同樣是解決類似的一系列問題。 但是這三個(gè)不同的系統(tǒng)存在極大的差異(如下圖),這些區(qū)別直接決定了企業(yè)去判斷某個(gè)業(yè)務(wù)適不適合使用個(gè)性化推薦,以及該如何做好個(gè)性化推薦。
三、什么樣的產(chǎn)品或業(yè)務(wù)適合采用個(gè)性化推薦?
個(gè)人認(rèn)為,具有媒體性的產(chǎn)品(Media Product)適合使用個(gè)性化推薦,這里指的不是只有與媒體相關(guān)的才能使用推薦,公司業(yè)務(wù)為電商的就不行,其實(shí)它只是一個(gè)概念,包含四個(gè)點(diǎn),但不一定要同時(shí)滿足,下面我將一一解說。
1.口味很重要(Taste)
產(chǎn)品中的 Taste 本身很重要。舉個(gè)例子,網(wǎng)上曾有一個(gè)很火的梗,在淘寶搜索連衣裙,排在第二位的連衣裙價(jià)格,代表了在整個(gè)淘寶體系里判定你個(gè)人的客單價(jià)范圍。我們當(dāng)時(shí)試了一下,發(fā)現(xiàn)一個(gè)特別有趣的現(xiàn)象,就是一般女生搜索出來的價(jià)格都會(huì)很低,大概一兩百元,而我和一些男同事搜索出來會(huì)高很多,如我搜索的基本上是一千八左右的連衣裙,仔細(xì)想一想也有原因,像女生天天逛淘寶,大大小小什么商品都買,但我上淘寶基本上都是要買相機(jī)、電腦,這些價(jià)格都在幾千或上萬元。很容易發(fā)現(xiàn),我們所有人對于買的東西的方向和口味是有差異的。
事實(shí)上除了存在差異還存在要求,很多人不希望被一個(gè)平臺判定其口味是某個(gè)方向。比如一個(gè)具備推薦系統(tǒng)的網(wǎng)站總給你推薦一些下三濫、低俗的東西,他會(huì)想“天哪!我是這樣一個(gè)人嗎?”因此,大家對于一個(gè)平臺的口味和自己的口味都是有要求的。
2.單位成本不重要(Cost)
“單位成本不重要”我們可以通過這個(gè)例子來理解,比如以前我們每天看報(bào)紙,因?yàn)閳?bào)紙的單價(jià)較便宜,對應(yīng)到現(xiàn)在的產(chǎn)品,比如我聽一首歌、看一篇文章、買一個(gè)常規(guī)的商品,你的消費(fèi)行為的 cost 消耗都不高,且不那么重要。
3.有瀑布效應(yīng)(Information Cascade)
瀑布效應(yīng)指的是,一旦在社區(qū)或平臺里產(chǎn)生了一個(gè)趨勢,那么整個(gè)平臺的其他人都會(huì)跟隨這個(gè)趨勢,比如,微博上轉(zhuǎn)發(fā)超過三四千的動(dòng)態(tài),可能會(huì)慢慢地被轉(zhuǎn)發(fā)的更多,整個(gè)社區(qū)會(huì)形成這樣的一些趨勢和傾向,瀑布效應(yīng)在平臺和社區(qū)較容易形成。
4.多樣性(Diversity)
這一點(diǎn)指的是你的平臺的內(nèi)容本身是具有多樣性的,這是推薦的基礎(chǔ)。如果整個(gè)平臺的內(nèi)容在各種維度、屬性上都一致,那么很難做推薦。
基本上,只要滿足以上 1-2 個(gè)點(diǎn),我們就可以說它是一個(gè)偏媒體型的產(chǎn)品。這方面一個(gè)很經(jīng)典的例子,我們可以看下圖,在圖中的王守崑是原來負(fù)責(zé)豆瓣最早的推薦系統(tǒng)的架構(gòu)師,這是他在很早之前分享中的一頁 PPT,我覺得這是講一個(gè)產(chǎn)品適不適合上推薦最直觀的一個(gè)例子。
當(dāng)時(shí)他們在做豆瓣推薦的時(shí)候,首先思考到底應(yīng)該優(yōu)先在什么頻道上推薦,為此設(shè)置了一個(gè)判斷的標(biāo)準(zhǔn),開始列一些指標(biāo),如下:
豆瓣會(huì)根據(jù)各個(gè)頻道的用戶數(shù)、條目數(shù)(豆瓣收錄的圖書、電影、音樂多少)計(jì)算稀疏性,比如圖書的條目數(shù)是 300 萬,同時(shí)記錄圖書用戶群體人均會(huì)在豆瓣收藏幾本書(點(diǎn)看過的視為收藏),豆瓣用人均的看過的次數(shù)除以總的條目數(shù)算出的值叫做稀疏性。如果一個(gè)產(chǎn)品稀疏性太低,那么繼續(xù)使用現(xiàn)行的推薦系統(tǒng)的相關(guān)算法就會(huì)出現(xiàn)問題,因?yàn)檎麄€(gè)待推薦的內(nèi)容面臨很大的群體,如果每一個(gè)人喜歡的東西太少時(shí),他就會(huì)散落在整個(gè)大群體的各各方面,你很難找到人和人之間具體的關(guān)系,因?yàn)槊總€(gè)人在整個(gè)系統(tǒng)里面的表達(dá)興趣太少了。因此,稀疏性低的產(chǎn)品做推薦,要么是工程難度比較高,那么效果可能不太好,一般說稀疏性高一點(diǎn)的產(chǎn)品更容易找到人與人之間契合的東西,當(dāng)然稀疏性也不能過高,如果稀疏性達(dá)到百分之八九十,那所有的用戶可能就過于相似,所以豆瓣比較強(qiáng)調(diào)稀疏性。
關(guān)于多樣性,有一個(gè)有趣的點(diǎn)需要注意。比如圖書的多樣性高,大家可能理解圖書僅根據(jù)一個(gè)偵探小說就能分出幾十個(gè)類型;電影的多樣性低,好像和常規(guī)的理解不一樣,事實(shí)上因?yàn)殡娪艾F(xiàn)在是高度工業(yè)化和商業(yè)化的產(chǎn)品,他們的類型聚集度是相當(dāng)高的。所以這給了大家一個(gè)啟示,在判斷自身產(chǎn)品時(shí),不要完全憑直覺,而要真的拿自己公司的實(shí)際數(shù)據(jù)說話。
時(shí)效性很好理解,我就不解釋了。反饋是指在某個(gè)品類中,企業(yè)做出一個(gè)推薦行為,用戶什么時(shí)候能給企業(yè)一個(gè)反饋,也就是用戶表達(dá)自己喜好的反饋時(shí)間周期是快還是慢。比如圖書就會(huì)很慢,讀完可能需要十天半個(gè)月,拖延癥的人可能還要讀半年左右;文章就會(huì)很快,只要點(diǎn)我的文章就可以定義為偏好,把這篇文章滾動(dòng)到底就是喜歡;音樂也是,聽完就是喜歡,很快跳過就是不喜歡。
最后,豆瓣會(huì)綜合前面所有的這些維度屬性來判斷推薦效果。在圖中他們認(rèn)為推薦效果最好的是單曲,原因是單曲的稀疏性特別高,雖然多樣性相對來說低級別,但是因?yàn)橄∈栊愿?,加上反饋周期特別快,綜合起來效果最好。事實(shí)上,這也是為什么大家在互聯(lián)網(wǎng)的花花世界中,還能記得豆瓣 FM 這個(gè)產(chǎn)品。不過,豆瓣在其他方面的推薦效果也不錯(cuò),比如圖書。
以上,就是豆瓣當(dāng)時(shí)內(nèi)部的一個(gè)評估過程,揭示了企業(yè)想要做一個(gè)推薦產(chǎn)品的時(shí),到底該如何去衡量這個(gè)業(yè)務(wù)適不適合做,效果將怎樣,需要定一個(gè)衡量的標(biāo)準(zhǔn)。
四、以商業(yè)為目的,推薦要做成什么樣?
推薦的商業(yè)目的一般分為以下幾種:
1.用計(jì)算機(jī)經(jīng)驗(yàn)取代運(yùn)營經(jīng)驗(yàn)(節(jié)省成本、提高效率)
這一點(diǎn)非常重要,很多人提到推薦系統(tǒng)會(huì)認(rèn)為是由公司的技術(shù)部門負(fù)責(zé),像變魔法一樣,就把某個(gè)事情從人工運(yùn)營變成了機(jī)器運(yùn)營,然后運(yùn)營的同學(xué)就好像沒活干了,但事實(shí)不是如此,其實(shí)本質(zhì)上來說它是取代運(yùn)營經(jīng)驗(yàn),但是有個(gè)前提條件是你們公司本來有運(yùn)營經(jīng)驗(yàn),我很少見到公司使用推薦系統(tǒng)是完全拋開運(yùn)營團(tuán)隊(duì),單靠技術(shù)團(tuán)隊(duì)自己的力量,把推薦系統(tǒng)運(yùn)作得很好。
事實(shí)上,我們可以這樣理解這一點(diǎn):運(yùn)營積累了一些經(jīng)驗(yàn),但是只能通過運(yùn)營人工的進(jìn)行一次次干預(yù),這樣往往只能對整個(gè)區(qū)域進(jìn)行干預(yù),沒有辦法把經(jīng)驗(yàn)落地到每一個(gè)具體的用戶身上,干預(yù)每一個(gè)用戶的體驗(yàn)還是很難。因此,推薦系統(tǒng)就可以幫助解決提升每個(gè)用戶的體驗(yàn)問題。
2.充分利用流量(提高變現(xiàn)能力)
事實(shí)上,很多企業(yè)的產(chǎn)品設(shè)計(jì)以及各種運(yùn)營方案,可能只能解決眾多流量的其中 60% 的需求,另外 40% 的需求被忽略了,或者是不得不忽略,因?yàn)槠髽I(yè)沒有辦法給每一個(gè)用戶或者每一群用戶單獨(dú)配一個(gè)運(yùn)營。此時(shí),推薦系統(tǒng)就可以起到類似分流量的精細(xì)化運(yùn)營的作用。
3.促進(jìn)信息流動(dòng)(留住小眾用戶)
這個(gè)價(jià)值點(diǎn)可能很多企業(yè)沒有注意到,因?yàn)榇蠖鄶?shù)想使用個(gè)性化推薦的公司,都在考慮公司如何賺錢?或用戶如何能得到更好的體驗(yàn)?但是,很多產(chǎn)品的推薦系統(tǒng)還有一個(gè)很重要的作用是促進(jìn)信息流動(dòng),從而留住小眾用戶。在很多形態(tài)的產(chǎn)品中,不管是社區(qū)型的產(chǎn)品,還是電商型的產(chǎn)品,它都會(huì)存在一些商品,如果產(chǎn)品的機(jī)制運(yùn)營的不錯(cuò),這些商品會(huì)在短時(shí)間之內(nèi)成為整個(gè)社區(qū)的話題和爆款。
但是可能社區(qū)本身的積淀或產(chǎn)品的話題程度,不可能讓它持續(xù)地成為話題,但是一定要制造話題,因?yàn)槠湟豢梢哉蔑@整個(gè)社區(qū)多樣性,其二小眾的群體也覺得自己能在大平臺得到展現(xiàn),會(huì)更容易留下來,但如果整個(gè)社區(qū)缺乏這種能力,展示在推薦位置的永遠(yuǎn)是熱門的大眾內(nèi)容,那么長尾的小眾社區(qū)、小眾用戶、小眾商品就會(huì)涌入其他平臺,企業(yè)便很難養(yǎng)起來那一部分的風(fēng)。
回到當(dāng)下來看,像抖音這樣的產(chǎn)品,為什么能夠讓那么多人參與進(jìn)去?核心在于聚集了多樣化的用戶,比如經(jīng)常在抖音上看到一些播放量、點(diǎn)贊量都是幾十萬的用戶,你點(diǎn)進(jìn)去他的主頁來看歷史的視頻播放,你會(huì)發(fā)現(xiàn)這個(gè)用戶可能只有那一個(gè)視頻幾十萬,其他的視頻只有幾百、幾千的播放量。但這就是推薦系統(tǒng)的魅力,用戶不需要一直是一個(gè)大 V,只要偶爾一個(gè)內(nèi)容能夠成為爆款,那么平臺就能夠把這類用戶篩選出來,讓他吸引更多的人參與進(jìn)來,而避免說被少數(shù)的大 V、頭部流量把整個(gè)平臺給遏制住,這是一個(gè)比較有意思的商業(yè)目的。
五、產(chǎn)品、運(yùn)營必知的推薦系統(tǒng)算法
這里是針對常見的一些做推薦的基礎(chǔ)思想和算法進(jìn)行簡單的掃盲(之后神策數(shù)據(jù)公眾號會(huì)有一篇文章“推薦系統(tǒng)的實(shí)踐與思考”會(huì)對最新的一些推薦系統(tǒng)的架構(gòu)構(gòu)建進(jìn)行專門的介紹),以下三種是比較常見的:
協(xié)調(diào)過濾(CF)、隱語義模型(LFM)、優(yōu)勢排行(Edgerank),我們最常見到的是CF、其中 Edgerank 主要用于類似 Facebook 做社交的企業(yè)。
1.協(xié)調(diào)過濾(CF)
事實(shí)上,大部分的推薦系統(tǒng)的本質(zhì)是“物以類聚,人以群分”,思路大概可分為兩個(gè)方面:其一,研究物品,即研究被推薦系統(tǒng)推薦的 item 進(jìn)行推薦,被稱為基于物品的推薦(Item-based);其二,研究人,即根據(jù)人的喜好進(jìn)行推薦,被稱為基于用戶的推薦(User-based)。
基于物品的協(xié)同過濾是什么意思呢?舉個(gè)例子,某個(gè)電商企業(yè)的商品 i 和 j 被同一類人喜歡,因此可以將其歸為一類,當(dāng)用戶 u 喜歡 i 但是沒有看過 j,就可以把 j 推薦給 u。
基于用戶的協(xié)同過濾又是什么意思呢?前面提到的物品的協(xié)同過濾是先把物品歸為一類,然后再推薦相同類的,而基于用戶的協(xié)調(diào)過濾是我們先分析用戶。舉個(gè)例子,我們把用戶 A 和 B 歸為一類,然后,就可以把 B 喜歡的商品,A 還沒看過的 i 也推薦給 A。
2.隱語義模型(LFM)
隱語義模型相對協(xié)同過濾會(huì)復(fù)雜一些,但是本質(zhì)上也較相似,這根據(jù)用戶的行為和物品的特征,用機(jī)器學(xué)習(xí)的方法先把物品進(jìn)行分類,然后再計(jì)算用戶 A 對每一個(gè)類別的興趣程度。舉個(gè)例子,某個(gè)企業(yè)通過機(jī)器學(xué)習(xí)把物品分成了十個(gè)類,然后該企業(yè)計(jì)算用戶 A 對每個(gè)類別的興趣程度,可以劃分為 1、0.8、0.7、0.5、0.3 等。之后,企業(yè)繼續(xù)計(jì)算一個(gè)物品 i 對于每個(gè)類別的權(quán)重,也就是物品 i 到底該被劃分到哪個(gè)類別,最后,企業(yè)根據(jù)這兩個(gè)信息和權(quán)重計(jì)算出用戶對物品 i 的喜愛程度。相比協(xié)同過濾,LFM 分的更精細(xì),事實(shí)上,現(xiàn)實(shí)中不管是人的屬性還是物品的屬性都千差萬別,很難通過單純的把物品或人分為一類就能滿足推薦的需求。
3.優(yōu)勢排行(Edgerank)
Edgerank 是 Facebook 完全基于自身信息流分發(fā)構(gòu)建的一個(gè)算法。這能幫助大家理解有時(shí)候推薦算法不是簡單采用市面上恒定的算法,而要根據(jù)公司實(shí)際的需求調(diào)整。Edgerank 會(huì)算三個(gè)指標(biāo):親密度(Affinity Score)、邊的權(quán)重(Edge Weight)、新鮮程度(Time Decay)。
親密度(Affinity Score)。比如用戶 A 發(fā)了一些文字信息、視頻、圖片等,用戶 B 從一些第三方應(yīng)用分享的這些文字、視頻、圖片來到用戶 A 的信息流,F(xiàn)acebook 就會(huì)首先算用戶 B 與用戶 A 的親密程度(同學(xué)?情侶?曾經(jīng)互動(dòng)過?),通過系統(tǒng)來計(jì)算出 AS 的親密度分?jǐn)?shù),當(dāng)判定為存在親密度,就會(huì)再計(jì)算邊的權(quán)重。
邊的權(quán)重(Edge Weight)。這指的是用戶 B 通過什么樣子的邊連接到你,是圖片?文字?還是通過分享自己喜歡的文章,像這種不同的連接類型,叫做邊。 邊的權(quán)重的不同會(huì)幫助更好的推薦。舉個(gè)例子,如果發(fā)現(xiàn) Facebook 的用戶更喜歡看照片,照片的邊的權(quán)重就會(huì)更高;如果用戶總發(fā)一些沒有營養(yǎng)的雞湯文,這些文章邊的權(quán)重就會(huì)下降。
新鮮程度(Time Decay)指的是內(nèi)容本身的發(fā)布時(shí)間的早晚,越近發(fā)布的權(quán)重會(huì)越高。
Facebook 會(huì)綜合這三個(gè)指標(biāo)給用戶做推薦,但是對大多數(shù)企業(yè)來說無法直接套用,因?yàn)檫@是根據(jù) Facebook 自身信息流的分發(fā)需求提煉出的影響因子。
之所以為大家介紹這三種模型,是想讓大家簡單了解現(xiàn)在做推薦的常規(guī)手段,但事實(shí)上現(xiàn)在的工程實(shí)踐遠(yuǎn)比上面的這些基礎(chǔ)模型復(fù)雜,我們再來看一下推薦系統(tǒng)的架構(gòu)圖,這不是純技術(shù)角度的架構(gòu)圖,比較偏產(chǎn)品視角。事實(shí)上,做推薦系統(tǒng)往往是一個(gè)過程,通過多種算法得到一個(gè)初步結(jié)果,然后再對初步結(jié)果進(jìn)行過濾、排序,再生成一些推薦原因,最后展示推薦結(jié)果。在整個(gè)過程里面,產(chǎn)品運(yùn)營參與的環(huán)節(jié)也比較多,這就是我的一個(gè)理解。
六、個(gè)性化推薦產(chǎn)品經(jīng)理的修煉秘籍
做推薦系統(tǒng)往往不是一蹴而就的,中間會(huì)有很多失敗的因素。我認(rèn)為常見的失敗原因主要分為三個(gè)方向:數(shù)據(jù)質(zhì)量、太過魯莽、不理解用戶。
很多公司讓我?guī)兔ε袛嗍欠襁m合做推薦時(shí),往往發(fā)現(xiàn)公司在數(shù)據(jù)層面上沒有什么積累。比如有些企業(yè)完全沒有統(tǒng)一的地方存儲用戶信息,可能分散在不同系統(tǒng)、不同部門。這導(dǎo)致做推薦建模時(shí),完全不知道數(shù)據(jù)在哪找。還有些企業(yè)用戶的行為信息保存太少,基本上只有一些關(guān)鍵交易信息保留,但整個(gè)交易的前置環(huán)節(jié),比如用戶在首頁搜索哪些關(guān)鍵詞?在一個(gè)頁面詳情頁上反復(fù)瀏覽了幾次?是否添加購物車?是否使用優(yōu)惠券?類似這些信息全部沒有保存。雖然推薦系統(tǒng)中的某些關(guān)鍵行為非常重要,但是大部分的推薦系統(tǒng)中的關(guān)鍵行為極少。
對于推薦系統(tǒng)來說,數(shù)據(jù)越多越好。很多公司,你會(huì)發(fā)現(xiàn)其用戶行為數(shù)據(jù)收集的相當(dāng)少。除此之外,當(dāng)我?guī)退麄儼褦?shù)據(jù)找全了想合到一起來使用,卻發(fā)現(xiàn)合不到一起。比如,公司的瀏覽數(shù)據(jù)沒有記錄 UID,直接只記錄了網(wǎng)站上的 cookie,因此只能用 cookie 來判定用戶訂單,但訂單后臺直接記錄了用戶的 UID 或訂單號,多個(gè)數(shù)據(jù)源之間沒有統(tǒng)一的 ID 識別機(jī)制,企業(yè)無法把用戶的行為數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)連通。 這些主要是數(shù)據(jù)質(zhì)量導(dǎo)致推薦系統(tǒng)失敗的原因,缺少一個(gè)好的數(shù)據(jù)基礎(chǔ)打地基。
過于魯莽和不理解用戶也是企業(yè)會(huì)常犯的錯(cuò)誤,這些會(huì)在下面的秘籍中體現(xiàn)。
秘籍 1 :明確推薦場景
當(dāng)大家做推薦系統(tǒng)時(shí),一定要想明白推薦的場景是什么?頭條因個(gè)性化推薦而爆火,很多人一想到推薦可能就是信息流,這就是過于魯莽的判定,但其實(shí)推薦場景有很多,比如信息流、猜你喜歡、關(guān)聯(lián)推薦以及針對不同的用戶推薦不同的產(chǎn)品界面等。
舉個(gè)例子,現(xiàn)在同樣的一個(gè)產(chǎn)品,可能 Web 端、移動(dòng)端都有入口,甚至還存在車載設(shè)備的入口等。那么,同樣的產(chǎn)品功能,在這三個(gè)場景下給用戶推薦肯定應(yīng)該有所不同,而且往往是當(dāng)產(chǎn)品、運(yùn)營認(rèn)知到了這種區(qū)別之后,反饋到算法部門,讓他們進(jìn)行調(diào)整最終得到某些效果進(jìn)行對比,不難發(fā)現(xiàn)對于這點(diǎn),認(rèn)知的經(jīng)驗(yàn)效果遠(yuǎn)比調(diào)節(jié)算法的細(xì)節(jié)來得更加有用。
另一個(gè)典型的例子是用戶在售前、售中、售后的不同場景,針對其整個(gè)作用的方向不一樣。
比如,企業(yè)做商品推薦,在售前應(yīng)該推薦什么商品,能把用戶的興趣激發(fā)出來?售中有什么策略能促進(jìn)用戶盡快下單?售后又該怎么做?如果用戶剛剛買了一個(gè)電視機(jī),又被推薦買另外一個(gè)電視機(jī),就是一個(gè)典型的糟糕的推薦場景。事實(shí)上,用戶處在不同周期,推薦算法要解決的問題是不一樣的,推薦邏輯也隨之不同,所以推薦算法要根據(jù)用戶在你產(chǎn)品的生命周期進(jìn)行不同的設(shè)計(jì)。
秘籍 2:明確目標(biāo)
這一點(diǎn)指的是推薦系統(tǒng)能解決的問題,個(gè)人認(rèn)為,可以分為從眾、興趣、發(fā)現(xiàn)三個(gè)方向。
- 解決從眾的需求
很多人認(rèn)為“從眾”是貶義詞,事實(shí)上,我們大部分人從生理和心理上都有從眾的需求,因?yàn)閺谋娛侨俗非蟀踩械囊粋€(gè)體現(xiàn),所以推薦系統(tǒng)首先解決從眾需求。比如,讓產(chǎn)品的推薦能告訴用戶在這個(gè)社區(qū)里面現(xiàn)在最流行什么,來幫助其跟隨潮流,從而獲得歸屬感和安全感,這個(gè)需求通常是穩(wěn)定的,而且非常重要。
- 解決興趣的需求
簡單來說,這個(gè)平臺上有很多內(nèi)容,但時(shí)間、精力有限,用戶只想看與自己興趣相關(guān)的。
- 解決發(fā)現(xiàn)的需求
如果產(chǎn)品上的內(nèi)容我看的差不多了,有沒有點(diǎn)新鮮的內(nèi)容,這就是發(fā)現(xiàn)的需求。比如,我是一個(gè)愛好做模型的人,但該網(wǎng)站上關(guān)于模型的內(nèi)容已經(jīng)看的差不多了,網(wǎng)站給我推薦了一些我可能感興趣,但不是模型相關(guān)的內(nèi)容來解決我發(fā)現(xiàn)的需求。
以上就是推薦系統(tǒng)解決的三方面需求目標(biāo),不同的目標(biāo)與之相關(guān)的要求也不一樣。
對于從眾的需求來說,企業(yè)希望用戶的滿意度非常高。當(dāng)你推薦的流行內(nèi)容如果被用戶發(fā)現(xiàn)不是最近流行的,用戶的滿意度就會(huì)很低。然而,對于發(fā)現(xiàn)的需求來說,企業(yè)對滿意度要求就沒有那么高,用戶自己的預(yù)期也不會(huì)那么高,所以有時(shí)候?qū)τ诎l(fā)現(xiàn)的需求,企業(yè)為用戶推薦錯(cuò)一個(gè)或者推薦一個(gè)沒那么滿意的東西,用戶很可能會(huì)認(rèn)為機(jī)器猜錯(cuò)了很正常,不會(huì)介意。就推薦準(zhǔn)確率而言,從眾一般準(zhǔn)確率較低,因?yàn)橛脩舨粫?huì)對所有流行的內(nèi)容都會(huì)仔細(xì)查看,但是,興趣的準(zhǔn)確率就要求很高。對于覆蓋率,從眾因?yàn)槭怯险麄€(gè)社區(qū)的潮流需求,覆蓋率肯定是低的。而興趣因?yàn)獒槍Σ煌娜藖砀采w不同的興趣,覆蓋的會(huì)越來越多。發(fā)現(xiàn)往往能使產(chǎn)品中很多可能冷門的庫存內(nèi)容重新得到展示。以此類推,多樣性、新穎性、驚喜度也是類似。
因此,如果你的企業(yè)使用推薦系統(tǒng),從這個(gè)三個(gè)方向,最后的考核指標(biāo)完全不一樣。舉個(gè)例子,我們經(jīng)常聽到產(chǎn)品現(xiàn)在的目標(biāo)是提高用戶收聽時(shí)長,但逐漸會(huì)發(fā)現(xiàn)產(chǎn)品處于不同階段,推薦的目標(biāo)是完全不一樣的,就個(gè)人經(jīng)驗(yàn)總結(jié),一個(gè)正常產(chǎn)品的發(fā)展軌跡往往如下圖。
推薦系統(tǒng)一般最開始都是為了解決從眾的需求,也就是如何把社區(qū)中流行、熱門的內(nèi)容盡可能地通過推薦系統(tǒng)篩選出來,讓更多的人來看。然后慢慢地用戶增加,產(chǎn)品內(nèi)容越來越豐富,便需要做更精細(xì)化的運(yùn)營,這個(gè)階段更注重推薦系統(tǒng)解決單個(gè)群體或單個(gè)用戶的興趣需求。最后,產(chǎn)品在后期逐漸穩(wěn)定時(shí)便要著手于發(fā)現(xiàn)。
舉個(gè)例子,機(jī)核網(wǎng)是神策數(shù)據(jù)的一個(gè)客戶,一個(gè)專注游戲文化的媒體網(wǎng)站,我是其忠實(shí)用戶,第一次接觸時(shí),我被網(wǎng)站上的深度文章所吸引,我花了大概半年多的時(shí)間,把歷史文章、電臺、視頻內(nèi)容都看了一遍,這個(gè)時(shí)候作為一個(gè)老用戶,已經(jīng)把我興趣范圍之內(nèi)的東西探索的差不多了,產(chǎn)品提供的價(jià)值受到了限制,這個(gè)時(shí)候企業(yè)便需要使用推薦系統(tǒng)去解決和發(fā)現(xiàn)一些需求,如何讓這一批老用戶能夠在產(chǎn)品中找到一些新東西,激發(fā)新的需求變得非常重要。所以,往往做推薦系統(tǒng)會(huì)分為幾個(gè)階段。
秘籍 3:大膽拍腦袋
在工作中,很多時(shí)候不可避免的需要拍腦袋。下圖是 Facebook 的首席產(chǎn)品官 Chris Cox 說的一句話。
大概意思是,在最開始,News feedranking 是 Facebook 最核心的時(shí)間流,他們像扳開關(guān)一樣,有時(shí)認(rèn)為圖片的權(quán)重不夠高,就把圖片權(quán)重調(diào)高一點(diǎn),然后把故事權(quán)重調(diào)低一點(diǎn)。比如可能一個(gè)圖片值五分,如果一個(gè)用戶加入某個(gè)小組只值一分。事實(shí)上,給這些行為打 5 分與 1 分沒有特別科學(xué)的說法,但是,剛開始一定要大膽的拍腦袋,而不是大家都停在一個(gè)點(diǎn),什么都不做。
有時(shí)候做推薦系統(tǒng),關(guān)于某些關(guān)鍵行為的權(quán)重該如何設(shè)置的問題,如果產(chǎn)品運(yùn)營完全不參與,把這個(gè)問題推給技術(shù),技術(shù)有時(shí)候?qū)I(yè)務(wù)的理解沒有那么深,他可能傾向于用一個(gè)很復(fù)雜的算法來算權(quán)重。
當(dāng)然,最好的方式更多還是需要產(chǎn)品給技術(shù)更多的輸入。如果產(chǎn)品告訴技術(shù),在產(chǎn)品里面用戶很喜歡圖片,可以先把圖片權(quán)重調(diào)高一點(diǎn),把故事權(quán)重調(diào)低一點(diǎn),技術(shù)按照這個(gè)規(guī)則先嘗試一下,事實(shí)上,在推薦系統(tǒng)整個(gè)開發(fā)迭代過程中經(jīng)常會(huì)反復(fù)的調(diào)高調(diào)低權(quán)重,并且在這個(gè)實(shí)踐應(yīng)用過程中也會(huì)發(fā)現(xiàn)其中的優(yōu)劣勢。
再舉個(gè)例子,之前我在 A 站早期帶 A 站的時(shí)候,因?yàn)楫?dāng)時(shí)還較小,養(yǎng)不起一個(gè)算法團(tuán)隊(duì),所以我們買了市面上的一些黑盒推薦服務(wù),企業(yè)只需要提供數(shù)據(jù),服務(wù)商就可以把推薦結(jié)果給你,最終發(fā)現(xiàn)效果特別差,而且你想做相關(guān)的調(diào)整把某個(gè)受歡迎的頻道權(quán)重調(diào)高一點(diǎn),但因?yàn)槭羌兒诤型扑],企業(yè)自身根本無法直接調(diào)整,或企業(yè)給服務(wù)商提需求,可能需要等幾個(gè)月才能拿到結(jié)果,那么推薦的最終效果就很難保證。所以即使市面上有很多黑盒推薦,接入成本也比較低,但企業(yè)會(huì)發(fā)現(xiàn)推薦系統(tǒng)不是一個(gè)接入一次就完成的事情,推薦系統(tǒng)需要在這個(gè)過程中不斷地去調(diào)整,不斷地根據(jù)業(yè)務(wù)去反饋。
因此,企業(yè)在拍腦袋的時(shí)候,需要產(chǎn)品和運(yùn)營定義到底哪些「用戶行為」更重要、或者意味著什么,這是靠機(jī)器無法做的。比如,用戶看一篇文章滾動(dòng)到底部,機(jī)器并不會(huì)認(rèn)為這有什么價(jià)值,但我們會(huì)認(rèn)為該用戶對這篇文章真的感興趣。也就是一個(gè)無用的信息,加入了人工的判斷認(rèn)知之后,就可能變成在整個(gè)推薦系統(tǒng)里很關(guān)鍵的信號。這個(gè)系統(tǒng)里還有很多這種類似的行為需要人為的給這些行為打上一個(gè)標(biāo)記,判定為喜歡或不喜歡的信號,這種信號極其重要,不是大家想象的推薦是根據(jù)一些很明確的行為定義的,很多用戶的喜歡和不喜歡判斷都不是用戶主動(dòng)表達(dá)出來的,都是依靠產(chǎn)品、運(yùn)營、技術(shù)一起研究業(yè)務(wù)、用戶流程推斷出來的。
那么行為如何彰顯喜歡程度或者討厭程度呢?舉個(gè)例子,對于電商產(chǎn)品,通常會(huì)認(rèn)為一個(gè)用戶對于商品的興趣表達(dá)公式是:購買遠(yuǎn)大于收藏,收藏大于瀏覽。在做推薦系統(tǒng)時(shí),這些權(quán)重就需要考慮進(jìn)去。
秘籍 4:反復(fù)檢閱推薦結(jié)果
企業(yè)不是只要推薦系統(tǒng)上線就可以了,還需要反復(fù)檢閱推薦結(jié)果。一般檢閱分兩種:離線和在線。
第一個(gè)是在線的檢閱。在線檢閱的核心是企業(yè)要理解用戶的行為模式,產(chǎn)品要像用戶一樣去用自身的產(chǎn)品以及推薦模塊,設(shè)身處地感受一下現(xiàn)在推薦的內(nèi)容是否是自己想要的,如果推薦的內(nèi)容不是想看的,就需要和運(yùn)營、技術(shù)溝通,為什么這次推薦的是一個(gè)我不想看的內(nèi)容,就是你要把推薦放到一個(gè)實(shí)際的場景里,真正地自己去體會(huì)去理解用戶的行為。
第二個(gè)是離線的檢閱。過去做產(chǎn)品時(shí),我們有時(shí)候會(huì)仔細(xì)分析給用戶推薦的歷史結(jié)果中是否存在一些很明顯的 Bad case,這也是企業(yè)改善推薦質(zhì)量很常見的一種方式。
豆瓣電臺過去做中文英文曲庫分割就是一個(gè)典型例子,當(dāng)時(shí)豆瓣的收聽率一直無法上升,最后豆瓣員工進(jìn)入用戶狀態(tài),換位思考發(fā)現(xiàn)有些人喜歡聽中文歌,完全不喜歡英文歌,而還有些人喜歡聽英文歌,卻反感中文歌。從推薦角度思考,只需要做一個(gè)簡單的事,把中文跟英文的曲風(fēng)直接區(qū)隔開,區(qū)隔開后豆瓣的推薦準(zhǔn)確率瞬間提升。
另外一個(gè)例子是,有一次我們做商品推薦遇到了瓶頸,我們采取了一個(gè)方法,在每次推薦批次的商品中加入幾個(gè) 10 元包郵或 20 元包郵的商品,最后整個(gè)點(diǎn)擊率、轉(zhuǎn)化率都提升了,這并不是科學(xué)的方法,但當(dāng)企業(yè)做一些在線的體驗(yàn)優(yōu)化或是離線的 Bad case 校驗(yàn)時(shí),你會(huì)發(fā)現(xiàn)一些粗暴的解決方法,但是這些對于整體的效果提升很有效。
秘籍 5:多學(xué)習(xí)一些算法知識
非技術(shù)出身的產(chǎn)品、運(yùn)營,如果真的想把推薦業(yè)務(wù)做好,建議學(xué)一些算法知識,至少簡單知道每一個(gè)算法的基本優(yōu)劣勢,這樣才能為你的優(yōu)化方向提供目標(biāo)和思路,溝通更順暢,更容易碰撞出火花。
比如,當(dāng)做協(xié)同過濾的推薦系統(tǒng)時(shí),當(dāng)企業(yè)有 6000 萬的歷史用戶,平均每個(gè)人喜歡十個(gè)商品,但是只能推薦 1000 萬個(gè)商品。對于沒有做過推薦系統(tǒng)的大部分人,對其背后的的工程難度是無法想象的,但是你需要配合工程師去理解,如果你不理解工程難度在哪,就提不出比較好的建議。
比如產(chǎn)品、運(yùn)營需要知道,過熱、過冷、太 low 是一些很常見的 Bad case。過熱指的是推薦的永遠(yuǎn)是很重要的內(nèi)容;過冷就是總推薦一些最冷門的內(nèi)容,導(dǎo)致用戶點(diǎn)擊率低;太 low,也是很常見的,內(nèi)容質(zhì)量低,用戶不喜歡。這也是我認(rèn)為有時(shí)候產(chǎn)品運(yùn)營參與推進(jìn)業(yè)務(wù)可以幫助技術(shù)解決的一個(gè)特別好的點(diǎn)。在我做產(chǎn)品時(shí),一旦發(fā)現(xiàn)有 Bad case,就直接干掉,在這過程中不僅優(yōu)化了整個(gè)推薦的質(zhì)量,還通過不斷地干掉這個(gè)動(dòng)作本身發(fā)現(xiàn)一些問題和規(guī)律。
再分享一個(gè)經(jīng)典問題——如何做冷啟動(dòng)?現(xiàn)在已經(jīng)集中在幾個(gè)大概的方向:1.主動(dòng)收集,讓用戶去選一些感興趣的一些方向,如豆瓣注冊后讓你選擇感興趣的類目;2.被動(dòng)收集,如在淘寶網(wǎng)頁收集用戶的一些點(diǎn)擊、瀏覽等行為數(shù)據(jù)。
七、推薦系統(tǒng)的未來走向
下面簡單聊聊我對推薦系統(tǒng)的未來走向的想法。事實(shí)上,現(xiàn)在的一些企業(yè)的推薦系統(tǒng),大部分算法都是混合發(fā)揮作用的,也就是復(fù)合算法。企業(yè)還可以在復(fù)合算法基礎(chǔ)上加入競爭機(jī)制,如在同樣一個(gè)推薦場景,多個(gè)窗口同時(shí)運(yùn)作,這些窗口之間存在相互競爭,最后判定在同一個(gè)場景下,到底哪個(gè)算法、推薦機(jī)制更有效果。又或者企業(yè)直接使用機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)會(huì)自主做一些 utem、 item 的建模,甚至是算法之間的競爭關(guān)系。
事實(shí)上,相比我在 2008 年剛?cè)胄械臅r(shí),現(xiàn)在的推薦系統(tǒng)已經(jīng)非常復(fù)雜,我認(rèn)為之后這些會(huì)更復(fù)雜、越來越抽象,如今任何一個(gè)公司想自己從 0 開始做推薦系統(tǒng)都會(huì)非常困難。但是不管基于我過去的產(chǎn)品經(jīng)驗(yàn),還是現(xiàn)在在神策數(shù)據(jù)的經(jīng)驗(yàn),總結(jié)發(fā)現(xiàn)其實(shí)構(gòu)建推薦系統(tǒng)的價(jià)值觀、企業(yè)對于自己公司業(yè)務(wù)的理解,在整個(gè)推薦的搭建過程當(dāng)中起著至關(guān)重要的作用。
文:?策小編@神策數(shù)據(jù)?(SensorsDataCrop)
首席增長官CGO薦讀小紅書推廣:
更多精彩,關(guān)注:增長黑客(GrowthHK.cn)
增長黑客(Growth Hacker)是依靠技術(shù)和數(shù)據(jù)來達(dá)成各種營銷目標(biāo)的新型團(tuán)隊(duì)角色。從單線思維者時(shí)常忽略的角度和高度,梳理整合產(chǎn)品發(fā)展的因素,實(shí)現(xiàn)低成本甚至零成本帶來的有效增長…
本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/quan/18982.html