国产成人剧情av麻豆果冻,福利中文字幕最新永久

大家好，我是張濤，在加入神策數(shù)據(jù)之前的 10 年中，我一直在 C 端產(chǎn)品中從事產(chǎn)品設(shè)計(jì)和運(yùn)營管理相關(guān)的工作，做的產(chǎn)品包括工具類、電商類、內(nèi)容類等，在這個(gè)過程中，關(guān)于搜索推薦操盤過很多實(shí)踐的項(xiàng)目，有從 0 開始做的，也有在中后期介入做優(yōu)化迭代的。因此，今天關(guān)于推薦的分享可能不那么偏技術(shù)視角，這有一個(gè)好處，是幫助產(chǎn)品和運(yùn)營人員更加了解推薦，也讓技術(shù)更了解業(yè)務(wù)產(chǎn)品視角下的推薦。

今天的分享將為大家解答以下幾個(gè)問題。你的公司是否適合采用個(gè)性化推薦？如果需要個(gè)性化推薦，該如何做好？產(chǎn)品運(yùn)營在參與到一個(gè)推薦系統(tǒng)的構(gòu)建當(dāng)中，有哪些常見的坑？有哪些可以避開這些坑的一些簡單方法？以及如何修煉成一個(gè)優(yōu)秀的推薦產(chǎn)品經(jīng)理？

一、 “四個(gè)關(guān)鍵”為你揭開推薦系統(tǒng)的神秘面紗

個(gè)人認(rèn)為，推薦系統(tǒng)是根據(jù)用戶以及不同的場景差異，對信息進(jìn)行合理的排序、過濾，解決信息過載問題的一套機(jī)制。這個(gè)定義中包含四個(gè)關(guān)鍵點(diǎn)，如下：

1.“根據(jù)用戶以及不同的場景差異”

對于很多剛開始做推薦的人可能會(huì)忽略這一點(diǎn)，大部分人在思考推薦時(shí)想的更多的可能是基于用戶來做，但其實(shí)我從眾多實(shí)踐中發(fā)現(xiàn)，很多時(shí)候推薦產(chǎn)生價(jià)值不僅僅只是說以用戶進(jìn)行區(qū)分，相關(guān)場景的差異會(huì)對于最后推薦效果產(chǎn)生巨大的影響。

2.“推薦的本質(zhì)是對信息進(jìn)行合理的排序、過濾”

很多人認(rèn)為推薦是一個(gè)魔盒，非常神奇，其實(shí)究其本質(zhì)是企業(yè)有成千上萬甚至上億的 item，不管這些 item 是文章、視頻，還是電商里面的商品，然后現(xiàn)在有某個(gè)人在一個(gè)具體的場景里面，企業(yè)需要把這些 item 給他看，那應(yīng)該把哪個(gè)放在第一個(gè)？這就是推薦系統(tǒng)背后的運(yùn)作原理。

3.“推薦系統(tǒng)要解決信息過載的問題”

舉個(gè)例子，如果你的企業(yè)只做爆款商品，整個(gè)公司只賣兩個(gè)商品，這樣用戶一看就明白了，顯然也不需要推薦，所以做推薦的一個(gè)前提條件是你公司本身提供的業(yè)務(wù)里面的信息太多了，對于一個(gè)正常的自然人來說，他處理不了那么多信息的時(shí)候，企業(yè)才需要去幫助用戶解決信息過載的問題，從而為用戶設(shè)計(jì)這樣一套機(jī)制。

4.“一套機(jī)制”

這點(diǎn)很好理解，推薦系統(tǒng)是由不同的算法、規(guī)則等構(gòu)成的一套機(jī)制。這四點(diǎn)是我從產(chǎn)品視角為你解讀了什么是推薦系統(tǒng)，以及他的一些簡單作用。

二、推薦系統(tǒng)、廣告系統(tǒng)、搜索系統(tǒng)三者有何不同？

事實(shí)上，解決我在前面提到的一系列問題，推薦系統(tǒng)并不是唯一的方法。比如，前面所提到的排序、過濾，做技術(shù)的同學(xué)應(yīng)該很容易聯(lián)想到，搜索和廣告系統(tǒng)也涉及排序、過濾，且搜索也一定程度上解決了信息過載。那么，這三個(gè)系統(tǒng)，它到底有什么區(qū)別呢？我從 5 個(gè)方面對其進(jìn)行了對比，下面將一一講述：

1．用戶獲取信息的方式。

廣告與推薦系統(tǒng)，用戶都是被動(dòng)的，但搜索不一樣，用戶是主動(dòng)搜索的，他需要輸入一些關(guān)鍵詞，會(huì)加入一些自己的意見和重點(diǎn)。

2.點(diǎn)擊率要求。

這三個(gè)系統(tǒng)對點(diǎn)擊率都有要求，僅在要求上有些區(qū)別，這就不祥述了。

3.驚喜度要求。

對于廣告和搜索系統(tǒng)來說，不需要太多的驚喜度。比如，如果我搜一個(gè)關(guān)鍵詞，搜索到我想要的資料時(shí)，并不會(huì)覺得很驚喜，甚至認(rèn)為是理所當(dāng)然，但是在推薦系統(tǒng)里，用戶往往對驚喜度是有要求的。

具體來說，用戶對于一個(gè)推薦系統(tǒng)的期望是希望產(chǎn)品能夠給他們一些驚喜，如用戶 A 雖然不知道產(chǎn)品用了什么數(shù)據(jù)、什么方法，但如果突然推薦了一首可能他已經(jīng)快遺忘的自己卻很喜歡的歌時(shí)，他就會(huì)因感到產(chǎn)品“好懂我”而驚喜。

4.個(gè)性化要求。

在廣告和搜索系統(tǒng)，個(gè)性化的需求是可有可無的，不管有沒有系統(tǒng)也能正常運(yùn)作。但是，對于推薦系統(tǒng)來說，個(gè)性化要求非常高，甚至越高越好。因?yàn)閭€(gè)性化推薦針對的是差異化的單個(gè)場景，一定會(huì)有個(gè)性化的要求。

5.用戶反饋。

廣告和搜索系統(tǒng)存在比較隱性的反饋，即對于搜索結(jié)果好不好？一般很少有搜索引擎廠商會(huì)直接問用戶，你喜不喜歡搜索結(jié)果，更多是廠商去判定廣告效果和搜索效果，一般是通過 CTR，或通過整個(gè)產(chǎn)品的某些長期留存表現(xiàn)來判定。但是，對于推薦系統(tǒng)來說，很多推薦產(chǎn)品會(huì)直接地問用戶的喜好，存在很明顯的顯性主觀表達(dá)。

因此，同樣是解決類似的一系列問題。但是這三個(gè)不同的系統(tǒng)存在極大的差異（如下圖），這些區(qū)別直接決定了企業(yè)去判斷某個(gè)業(yè)務(wù)適不適合使用個(gè)性化推薦，以及該如何做好個(gè)性化推薦。

三、什么樣的產(chǎn)品或業(yè)務(wù)適合采用個(gè)性化推薦？

個(gè)人認(rèn)為，具有媒體性的產(chǎn)品（Media Product）適合使用個(gè)性化推薦，這里指的不是只有與媒體相關(guān)的才能使用推薦，公司業(yè)務(wù)為電商的就不行，其實(shí)它只是一個(gè)概念，包含四個(gè)點(diǎn)，但不一定要同時(shí)滿足，下面我將一一解說。

1.口味很重要（Taste）

產(chǎn)品中的 Taste 本身很重要。舉個(gè)例子，網(wǎng)上曾有一個(gè)很火的梗，在淘寶搜索連衣裙，排在第二位的連衣裙價(jià)格，代表了在整個(gè)淘寶體系里判定你個(gè)人的客單價(jià)范圍。我們當(dāng)時(shí)試了一下，發(fā)現(xiàn)一個(gè)特別有趣的現(xiàn)象，就是一般女生搜索出來的價(jià)格都會(huì)很低，大概一兩百元，而我和一些男同事搜索出來會(huì)高很多，如我搜索的基本上是一千八左右的連衣裙，仔細(xì)想一想也有原因，像女生天天逛淘寶，大大小小什么商品都買，但我上淘寶基本上都是要買相機(jī)、電腦，這些價(jià)格都在幾千或上萬元。很容易發(fā)現(xiàn)，我們所有人對于買的東西的方向和口味是有差異的。

事實(shí)上除了存在差異還存在要求，很多人不希望被一個(gè)平臺判定其口味是某個(gè)方向。比如一個(gè)具備推薦系統(tǒng)的網(wǎng)站總給你推薦一些下三濫、低俗的東西，他會(huì)想“天哪！我是這樣一個(gè)人嗎？”因此，大家對于一個(gè)平臺的口味和自己的口味都是有要求的。

2.單位成本不重要（Cost）

“單位成本不重要”我們可以通過這個(gè)例子來理解，比如以前我們每天看報(bào)紙，因?yàn)閳?bào)紙的單價(jià)較便宜，對應(yīng)到現(xiàn)在的產(chǎn)品，比如我聽一首歌、看一篇文章、買一個(gè)常規(guī)的商品，你的消費(fèi)行為的 cost 消耗都不高，且不那么重要。

3.有瀑布效應(yīng)（Information Cascade）

瀑布效應(yīng)指的是，一旦在社區(qū)或平臺里產(chǎn)生了一個(gè)趨勢，那么整個(gè)平臺的其他人都會(huì)跟隨這個(gè)趨勢，比如，微博上轉(zhuǎn)發(fā)超過三四千的動(dòng)態(tài)，可能會(huì)慢慢地被轉(zhuǎn)發(fā)的更多，整個(gè)社區(qū)會(huì)形成這樣的一些趨勢和傾向，瀑布效應(yīng)在平臺和社區(qū)較容易形成。

4.多樣性（Diversity）

這一點(diǎn)指的是你的平臺的內(nèi)容本身是具有多樣性的，這是推薦的基礎(chǔ)。如果整個(gè)平臺的內(nèi)容在各種維度、屬性上都一致，那么很難做推薦。

基本上，只要滿足以上 1-2 個(gè)點(diǎn)，我們就可以說它是一個(gè)偏媒體型的產(chǎn)品。這方面一個(gè)很經(jīng)典的例子，我們可以看下圖，在圖中的王守崑是原來負(fù)責(zé)豆瓣最早的推薦系統(tǒng)的架構(gòu)師，這是他在很早之前分享中的一頁 PPT，我覺得這是講一個(gè)產(chǎn)品適不適合上推薦最直觀的一個(gè)例子。

當(dāng)時(shí)他們在做豆瓣推薦的時(shí)候，首先思考到底應(yīng)該優(yōu)先在什么頻道上推薦，為此設(shè)置了一個(gè)判斷的標(biāo)準(zhǔn)，開始列一些指標(biāo)，如下：

豆瓣會(huì)根據(jù)各個(gè)頻道的用戶數(shù)、條目數(shù)（豆瓣收錄的圖書、電影、音樂多少）計(jì)算稀疏性，比如圖書的條目數(shù)是 300 萬，同時(shí)記錄圖書用戶群體人均會(huì)在豆瓣收藏幾本書（點(diǎn)看過的視為收藏），豆瓣用人均的看過的次數(shù)除以總的條目數(shù)算出的值叫做稀疏性。如果一個(gè)產(chǎn)品稀疏性太低，那么繼續(xù)使用現(xiàn)行的推薦系統(tǒng)的相關(guān)算法就會(huì)出現(xiàn)問題，因?yàn)檎麄€(gè)待推薦的內(nèi)容面臨很大的群體，如果每一個(gè)人喜歡的東西太少時(shí)，他就會(huì)散落在整個(gè)大群體的各各方面，你很難找到人和人之間具體的關(guān)系，因?yàn)槊總€(gè)人在整個(gè)系統(tǒng)里面的表達(dá)興趣太少了。因此，稀疏性低的產(chǎn)品做推薦，要么是工程難度比較高，那么效果可能不太好，一般說稀疏性高一點(diǎn)的產(chǎn)品更容易找到人與人之間契合的東西，當(dāng)然稀疏性也不能過高，如果稀疏性達(dá)到百分之八九十，那所有的用戶可能就過于相似，所以豆瓣比較強(qiáng)調(diào)稀疏性。

關(guān)于多樣性，有一個(gè)有趣的點(diǎn)需要注意。比如圖書的多樣性高，大家可能理解圖書僅根據(jù)一個(gè)偵探小說就能分出幾十個(gè)類型；電影的多樣性低，好像和常規(guī)的理解不一樣，事實(shí)上因?yàn)殡娪艾F(xiàn)在是高度工業(yè)化和商業(yè)化的產(chǎn)品，他們的類型聚集度是相當(dāng)高的。所以這給了大家一個(gè)啟示，在判斷自身產(chǎn)品時(shí)，不要完全憑直覺，而要真的拿自己公司的實(shí)際數(shù)據(jù)說話。

時(shí)效性很好理解，我就不解釋了。反饋是指在某個(gè)品類中，企業(yè)做出一個(gè)推薦行為，用戶什么時(shí)候能給企業(yè)一個(gè)反饋，也就是用戶表達(dá)自己喜好的反饋時(shí)間周期是快還是慢。比如圖書就會(huì)很慢，讀完可能需要十天半個(gè)月，拖延癥的人可能還要讀半年左右；文章就會(huì)很快，只要點(diǎn)我的文章就可以定義為偏好，把這篇文章滾動(dòng)到底就是喜歡；音樂也是，聽完就是喜歡，很快跳過就是不喜歡。

最后，豆瓣會(huì)綜合前面所有的這些維度屬性來判斷推薦效果。在圖中他們認(rèn)為推薦效果最好的是單曲，原因是單曲的稀疏性特別高，雖然多樣性相對來說低級別，但是因?yàn)橄∈栊愿?，加上反饋周期特別快，綜合起來效果最好。事實(shí)上，這也是為什么大家在互聯(lián)網(wǎng)的花花世界中，還能記得豆瓣 FM 這個(gè)產(chǎn)品。不過，豆瓣在其他方面的推薦效果也不錯(cuò)，比如圖書。

以上，就是豆瓣當(dāng)時(shí)內(nèi)部的一個(gè)評估過程，揭示了企業(yè)想要做一個(gè)推薦產(chǎn)品的時(shí)，到底該如何去衡量這個(gè)業(yè)務(wù)適不適合做，效果將怎樣，需要定一個(gè)衡量的標(biāo)準(zhǔn)。

四、以商業(yè)為目的，推薦要做成什么樣？

推薦的商業(yè)目的一般分為以下幾種：

1.用計(jì)算機(jī)經(jīng)驗(yàn)取代運(yùn)營經(jīng)驗(yàn)（節(jié)省成本、提高效率）

這一點(diǎn)非常重要，很多人提到推薦系統(tǒng)會(huì)認(rèn)為是由公司的技術(shù)部門負(fù)責(zé)，像變魔法一樣，就把某個(gè)事情從人工運(yùn)營變成了機(jī)器運(yùn)營，然后運(yùn)營的同學(xué)就好像沒活干了，但事實(shí)不是如此，其實(shí)本質(zhì)上來說它是取代運(yùn)營經(jīng)驗(yàn)，但是有個(gè)前提條件是你們公司本來有運(yùn)營經(jīng)驗(yàn)，我很少見到公司使用推薦系統(tǒng)是完全拋開運(yùn)營團(tuán)隊(duì)，單靠技術(shù)團(tuán)隊(duì)自己的力量，把推薦系統(tǒng)運(yùn)作得很好。

事實(shí)上，我們可以這樣理解這一點(diǎn)：運(yùn)營積累了一些經(jīng)驗(yàn)，但是只能通過運(yùn)營人工的進(jìn)行一次次干預(yù)，這樣往往只能對整個(gè)區(qū)域進(jìn)行干預(yù)，沒有辦法把經(jīng)驗(yàn)落地到每一個(gè)具體的用戶身上，干預(yù)每一個(gè)用戶的體驗(yàn)還是很難。因此，推薦系統(tǒng)就可以幫助解決提升每個(gè)用戶的體驗(yàn)問題。

2.充分利用流量（提高變現(xiàn)能力）

事實(shí)上，很多企業(yè)的產(chǎn)品設(shè)計(jì)以及各種運(yùn)營方案，可能只能解決眾多流量的其中 60% 的需求，另外 40% 的需求被忽略了，或者是不得不忽略，因?yàn)槠髽I(yè)沒有辦法給每一個(gè)用戶或者每一群用戶單獨(dú)配一個(gè)運(yùn)營。此時(shí)，推薦系統(tǒng)就可以起到類似分流量的精細(xì)化運(yùn)營的作用。

3.促進(jìn)信息流動(dòng)（留住小眾用戶）

這個(gè)價(jià)值點(diǎn)可能很多企業(yè)沒有注意到，因?yàn)榇蠖鄶?shù)想使用個(gè)性化推薦的公司，都在考慮公司如何賺錢？或用戶如何能得到更好的體驗(yàn)？但是，很多產(chǎn)品的推薦系統(tǒng)還有一個(gè)很重要的作用是促進(jìn)信息流動(dòng)，從而留住小眾用戶。在很多形態(tài)的產(chǎn)品中，不管是社區(qū)型的產(chǎn)品，還是電商型的產(chǎn)品，它都會(huì)存在一些商品，如果產(chǎn)品的機(jī)制運(yùn)營的不錯(cuò)，這些商品會(huì)在短時(shí)間之內(nèi)成為整個(gè)社區(qū)的話題和爆款。

但是可能社區(qū)本身的積淀或產(chǎn)品的話題程度，不可能讓它持續(xù)地成為話題，但是一定要制造話題，因?yàn)槠湟豢梢哉蔑@整個(gè)社區(qū)多樣性，其二小眾的群體也覺得自己能在大平臺得到展現(xiàn)，會(huì)更容易留下來，但如果整個(gè)社區(qū)缺乏這種能力，展示在推薦位置的永遠(yuǎn)是熱門的大眾內(nèi)容，那么長尾的小眾社區(qū)、小眾用戶、小眾商品就會(huì)涌入其他平臺，企業(yè)便很難養(yǎng)起來那一部分的風(fēng)。

回到當(dāng)下來看，像抖音這樣的產(chǎn)品，為什么能夠讓那么多人參與進(jìn)去？核心在于聚集了多樣化的用戶，比如經(jīng)常在抖音上看到一些播放量、點(diǎn)贊量都是幾十萬的用戶，你點(diǎn)進(jìn)去他的主頁來看歷史的視頻播放，你會(huì)發(fā)現(xiàn)這個(gè)用戶可能只有那一個(gè)視頻幾十萬，其他的視頻只有幾百、幾千的播放量。但這就是推薦系統(tǒng)的魅力，用戶不需要一直是一個(gè)大 V，只要偶爾一個(gè)內(nèi)容能夠成為爆款，那么平臺就能夠把這類用戶篩選出來，讓他吸引更多的人參與進(jìn)來，而避免說被少數(shù)的大 V、頭部流量把整個(gè)平臺給遏制住，這是一個(gè)比較有意思的商業(yè)目的。

五、產(chǎn)品、運(yùn)營必知的推薦系統(tǒng)算法

這里是針對常見的一些做推薦的基礎(chǔ)思想和算法進(jìn)行簡單的掃盲（之后神策數(shù)據(jù)公眾號會(huì)有一篇文章“推薦系統(tǒng)的實(shí)踐與思考”會(huì)對最新的一些推薦系統(tǒng)的架構(gòu)構(gòu)建進(jìn)行專門的介紹），以下三種是比較常見的：

協(xié)調(diào)過濾（CF）、隱語義模型（LFM）、優(yōu)勢排行（Edgerank），我們最常見到的是CF、其中 Edgerank 主要用于類似 Facebook 做社交的企業(yè)。

1.協(xié)調(diào)過濾（CF）

事實(shí)上，大部分的推薦系統(tǒng)的本質(zhì)是“物以類聚，人以群分”，思路大概可分為兩個(gè)方面：其一，研究物品，即研究被推薦系統(tǒng)推薦的 item 進(jìn)行推薦，被稱為基于物品的推薦（Item-based）；其二，研究人，即根據(jù)人的喜好進(jìn)行推薦，被稱為基于用戶的推薦（User-based）。

基于物品的協(xié)同過濾是什么意思呢？舉個(gè)例子，某個(gè)電商企業(yè)的商品 i 和 j 被同一類人喜歡，因此可以將其歸為一類，當(dāng)用戶 u 喜歡 i 但是沒有看過 j，就可以把 j 推薦給 u。

基于用戶的協(xié)同過濾又是什么意思呢？前面提到的物品的協(xié)同過濾是先把物品歸為一類，然后再推薦相同類的，而基于用戶的協(xié)調(diào)過濾是我們先分析用戶。舉個(gè)例子，我們把用戶 A 和 B 歸為一類，然后，就可以把 B 喜歡的商品，A 還沒看過的 i 也推薦給 A。

2.隱語義模型（LFM）

隱語義模型相對協(xié)同過濾會(huì)復(fù)雜一些，但是本質(zhì)上也較相似，這根據(jù)用戶的行為和物品的特征，用機(jī)器學(xué)習(xí)的方法先把物品進(jìn)行分類，然后再計(jì)算用戶 A 對每一個(gè)類別的興趣程度。舉個(gè)例子，某個(gè)企業(yè)通過機(jī)器學(xué)習(xí)把物品分成了十個(gè)類，然后該企業(yè)計(jì)算用戶 A 對每個(gè)類別的興趣程度，可以劃分為 1、0.8、0.7、0.5、0.3 等。之后，企業(yè)繼續(xù)計(jì)算一個(gè)物品 i 對于每個(gè)類別的權(quán)重，也就是物品 i 到底該被劃分到哪個(gè)類別，最后，企業(yè)根據(jù)這兩個(gè)信息和權(quán)重計(jì)算出用戶對物品 i 的喜愛程度。相比協(xié)同過濾，LFM 分的更精細(xì)，事實(shí)上，現(xiàn)實(shí)中不管是人的屬性還是物品的屬性都千差萬別，很難通過單純的把物品或人分為一類就能滿足推薦的需求。

3.優(yōu)勢排行（Edgerank）

Edgerank 是 Facebook 完全基于自身信息流分發(fā)構(gòu)建的一個(gè)算法。這能幫助大家理解有時(shí)候推薦算法不是簡單采用市面上恒定的算法，而要根據(jù)公司實(shí)際的需求調(diào)整。Edgerank 會(huì)算三個(gè)指標(biāo)：親密度（Affinity Score）、邊的權(quán)重（Edge Weight）、新鮮程度（Time Decay）。

親密度（Affinity Score）。比如用戶 A 發(fā)了一些文字信息、視頻、圖片等，用戶 B 從一些第三方應(yīng)用分享的這些文字、視頻、圖片來到用戶 A 的信息流，F(xiàn)acebook 就會(huì)首先算用戶 B 與用戶 A 的親密程度（同學(xué)？情侶？曾經(jīng)互動(dòng)過？），通過系統(tǒng)來計(jì)算出 AS 的親密度分?jǐn)?shù)，當(dāng)判定為存在親密度，就會(huì)再計(jì)算邊的權(quán)重。

邊的權(quán)重（Edge Weight）。這指的是用戶 B 通過什么樣子的邊連接到你，是圖片？文字？還是通過分享自己喜歡的文章，像這種不同的連接類型，叫做邊。邊的權(quán)重的不同會(huì)幫助更好的推薦。舉個(gè)例子，如果發(fā)現(xiàn) Facebook 的用戶更喜歡看照片，照片的邊的權(quán)重就會(huì)更高；如果用戶總發(fā)一些沒有營養(yǎng)的雞湯文，這些文章邊的權(quán)重就會(huì)下降。

新鮮程度（Time Decay）指的是內(nèi)容本身的發(fā)布時(shí)間的早晚，越近發(fā)布的權(quán)重會(huì)越高。

Facebook 會(huì)綜合這三個(gè)指標(biāo)給用戶做推薦，但是對大多數(shù)企業(yè)來說無法直接套用，因?yàn)檫@是根據(jù) Facebook 自身信息流的分發(fā)需求提煉出的影響因子。

之所以為大家介紹這三種模型，是想讓大家簡單了解現(xiàn)在做推薦的常規(guī)手段，但事實(shí)上現(xiàn)在的工程實(shí)踐遠(yuǎn)比上面的這些基礎(chǔ)模型復(fù)雜，我們再來看一下推薦系統(tǒng)的架構(gòu)圖，這不是純技術(shù)角度的架構(gòu)圖，比較偏產(chǎn)品視角。事實(shí)上，做推薦系統(tǒng)往往是一個(gè)過程，通過多種算法得到一個(gè)初步結(jié)果，然后再對初步結(jié)果進(jìn)行過濾、排序，再生成一些推薦原因，最后展示推薦結(jié)果。在整個(gè)過程里面，產(chǎn)品運(yùn)營參與的環(huán)節(jié)也比較多，這就是我的一個(gè)理解。

六、個(gè)性化推薦產(chǎn)品經(jīng)理的修煉秘籍

做推薦系統(tǒng)往往不是一蹴而就的，中間會(huì)有很多失敗的因素。我認(rèn)為常見的失敗原因主要分為三個(gè)方向：數(shù)據(jù)質(zhì)量、太過魯莽、不理解用戶。

很多公司讓我?guī)兔ε袛嗍欠襁m合做推薦時(shí)，往往發(fā)現(xiàn)公司在數(shù)據(jù)層面上沒有什么積累。比如有些企業(yè)完全沒有統(tǒng)一的地方存儲用戶信息，可能分散在不同系統(tǒng)、不同部門。這導(dǎo)致做推薦建模時(shí)，完全不知道數(shù)據(jù)在哪找。還有些企業(yè)用戶的行為信息保存太少，基本上只有一些關(guān)鍵交易信息保留，但整個(gè)交易的前置環(huán)節(jié)，比如用戶在首頁搜索哪些關(guān)鍵詞？在一個(gè)頁面詳情頁上反復(fù)瀏覽了幾次？是否添加購物車？是否使用優(yōu)惠券？類似這些信息全部沒有保存。雖然推薦系統(tǒng)中的某些關(guān)鍵行為非常重要，但是大部分的推薦系統(tǒng)中的關(guān)鍵行為極少。

對于推薦系統(tǒng)來說，數(shù)據(jù)越多越好。很多公司，你會(huì)發(fā)現(xiàn)其用戶行為數(shù)據(jù)收集的相當(dāng)少。除此之外，當(dāng)我?guī)退麄儼褦?shù)據(jù)找全了想合到一起來使用，卻發(fā)現(xiàn)合不到一起。比如，公司的瀏覽數(shù)據(jù)沒有記錄 UID，直接只記錄了網(wǎng)站上的 cookie，因此只能用 cookie 來判定用戶訂單，但訂單后臺直接記錄了用戶的 UID 或訂單號，多個(gè)數(shù)據(jù)源之間沒有統(tǒng)一的 ID 識別機(jī)制，企業(yè)無法把用戶的行為數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)連通。這些主要是數(shù)據(jù)質(zhì)量導(dǎo)致推薦系統(tǒng)失敗的原因，缺少一個(gè)好的數(shù)據(jù)基礎(chǔ)打地基。

過于魯莽和不理解用戶也是企業(yè)會(huì)常犯的錯(cuò)誤，這些會(huì)在下面的秘籍中體現(xiàn)。

秘籍 1 ：明確推薦場景

當(dāng)大家做推薦系統(tǒng)時(shí)，一定要想明白推薦的場景是什么？頭條因個(gè)性化推薦而爆火，很多人一想到推薦可能就是信息流，這就是過于魯莽的判定，但其實(shí)推薦場景有很多，比如信息流、猜你喜歡、關(guān)聯(lián)推薦以及針對不同的用戶推薦不同的產(chǎn)品界面等。

舉個(gè)例子，現(xiàn)在同樣的一個(gè)產(chǎn)品，可能 Web 端、移動(dòng)端都有入口，甚至還存在車載設(shè)備的入口等。那么，同樣的產(chǎn)品功能，在這三個(gè)場景下給用戶推薦肯定應(yīng)該有所不同，而且往往是當(dāng)產(chǎn)品、運(yùn)營認(rèn)知到了這種區(qū)別之后，反饋到算法部門，讓他們進(jìn)行調(diào)整最終得到某些效果進(jìn)行對比，不難發(fā)現(xiàn)對于這點(diǎn)，認(rèn)知的經(jīng)驗(yàn)效果遠(yuǎn)比調(diào)節(jié)算法的細(xì)節(jié)來得更加有用。

另一個(gè)典型的例子是用戶在售前、售中、售后的不同場景，針對其整個(gè)作用的方向不一樣。

比如，企業(yè)做商品推薦，在售前應(yīng)該推薦什么商品，能把用戶的興趣激發(fā)出來？售中有什么策略能促進(jìn)用戶盡快下單？售后又該怎么做？如果用戶剛剛買了一個(gè)電視機(jī)，又被推薦買另外一個(gè)電視機(jī)，就是一個(gè)典型的糟糕的推薦場景。事實(shí)上，用戶處在不同周期，推薦算法要解決的問題是不一樣的，推薦邏輯也隨之不同，所以推薦算法要根據(jù)用戶在你產(chǎn)品的生命周期進(jìn)行不同的設(shè)計(jì)。

秘籍 2：明確目標(biāo)

這一點(diǎn)指的是推薦系統(tǒng)能解決的問題，個(gè)人認(rèn)為，可以分為從眾、興趣、發(fā)現(xiàn)三個(gè)方向。

解決從眾的需求

很多人認(rèn)為“從眾”是貶義詞，事實(shí)上，我們大部分人從生理和心理上都有從眾的需求，因?yàn)閺谋娛侨俗非蟀踩械囊粋€(gè)體現(xiàn)，所以推薦系統(tǒng)首先解決從眾需求。比如，讓產(chǎn)品的推薦能告訴用戶在這個(gè)社區(qū)里面現(xiàn)在最流行什么，來幫助其跟隨潮流，從而獲得歸屬感和安全感，這個(gè)需求通常是穩(wěn)定的，而且非常重要。

解決興趣的需求

簡單來說，這個(gè)平臺上有很多內(nèi)容，但時(shí)間、精力有限，用戶只想看與自己興趣相關(guān)的。

解決發(fā)現(xiàn)的需求

如果產(chǎn)品上的內(nèi)容我看的差不多了，有沒有點(diǎn)新鮮的內(nèi)容，這就是發(fā)現(xiàn)的需求。比如，我是一個(gè)愛好做模型的人，但該網(wǎng)站上關(guān)于模型的內(nèi)容已經(jīng)看的差不多了，網(wǎng)站給我推薦了一些我可能感興趣，但不是模型相關(guān)的內(nèi)容來解決我發(fā)現(xiàn)的需求。

以上就是推薦系統(tǒng)解決的三方面需求目標(biāo)，不同的目標(biāo)與之相關(guān)的要求也不一樣。

對于從眾的需求來說，企業(yè)希望用戶的滿意度非常高。當(dāng)你推薦的流行內(nèi)容如果被用戶發(fā)現(xiàn)不是最近流行的，用戶的滿意度就會(huì)很低。然而，對于發(fā)現(xiàn)的需求來說，企業(yè)對滿意度要求就沒有那么高，用戶自己的預(yù)期也不會(huì)那么高，所以有時(shí)候?qū)τ诎l(fā)現(xiàn)的需求，企業(yè)為用戶推薦錯(cuò)一個(gè)或者推薦一個(gè)沒那么滿意的東西，用戶很可能會(huì)認(rèn)為機(jī)器猜錯(cuò)了很正常，不會(huì)介意。就推薦準(zhǔn)確率而言，從眾一般準(zhǔn)確率較低，因?yàn)橛脩舨粫?huì)對所有流行的內(nèi)容都會(huì)仔細(xì)查看，但是，興趣的準(zhǔn)確率就要求很高。對于覆蓋率，從眾因?yàn)槭怯险麄€(gè)社區(qū)的潮流需求，覆蓋率肯定是低的。而興趣因?yàn)獒槍Σ煌娜藖砀采w不同的興趣，覆蓋的會(huì)越來越多。發(fā)現(xiàn)往往能使產(chǎn)品中很多可能冷門的庫存內(nèi)容重新得到展示。以此類推，多樣性、新穎性、驚喜度也是類似。

因此，如果你的企業(yè)使用推薦系統(tǒng)，從這個(gè)三個(gè)方向，最后的考核指標(biāo)完全不一樣。舉個(gè)例子，我們經(jīng)常聽到產(chǎn)品現(xiàn)在的目標(biāo)是提高用戶收聽時(shí)長，但逐漸會(huì)發(fā)現(xiàn)產(chǎn)品處于不同階段，推薦的目標(biāo)是完全不一樣的，就個(gè)人經(jīng)驗(yàn)總結(jié)，一個(gè)正常產(chǎn)品的發(fā)展軌跡往往如下圖。

推薦系統(tǒng)一般最開始都是為了解決從眾的需求，也就是如何把社區(qū)中流行、熱門的內(nèi)容盡可能地通過推薦系統(tǒng)篩選出來，讓更多的人來看。然后慢慢地用戶增加，產(chǎn)品內(nèi)容越來越豐富，便需要做更精細(xì)化的運(yùn)營，這個(gè)階段更注重推薦系統(tǒng)解決單個(gè)群體或單個(gè)用戶的興趣需求。最后，產(chǎn)品在后期逐漸穩(wěn)定時(shí)便要著手于發(fā)現(xiàn)。

舉個(gè)例子，機(jī)核網(wǎng)是神策數(shù)據(jù)的一個(gè)客戶，一個(gè)專注游戲文化的媒體網(wǎng)站，我是其忠實(shí)用戶，第一次接觸時(shí)，我被網(wǎng)站上的深度文章所吸引，我花了大概半年多的時(shí)間，把歷史文章、電臺、視頻內(nèi)容都看了一遍，這個(gè)時(shí)候作為一個(gè)老用戶，已經(jīng)把我興趣范圍之內(nèi)的東西探索的差不多了，產(chǎn)品提供的價(jià)值受到了限制，這個(gè)時(shí)候企業(yè)便需要使用推薦系統(tǒng)去解決和發(fā)現(xiàn)一些需求，如何讓這一批老用戶能夠在產(chǎn)品中找到一些新東西，激發(fā)新的需求變得非常重要。所以，往往做推薦系統(tǒng)會(huì)分為幾個(gè)階段。

秘籍 3：大膽拍腦袋

在工作中，很多時(shí)候不可避免的需要拍腦袋。下圖是 Facebook 的首席產(chǎn)品官 Chris Cox 說的一句話。

大概意思是，在最開始，News feedranking 是 Facebook 最核心的時(shí)間流，他們像扳開關(guān)一樣，有時(shí)認(rèn)為圖片的權(quán)重不夠高，就把圖片權(quán)重調(diào)高一點(diǎn)，然后把故事權(quán)重調(diào)低一點(diǎn)。比如可能一個(gè)圖片值五分，如果一個(gè)用戶加入某個(gè)小組只值一分。事實(shí)上，給這些行為打 5 分與 1 分沒有特別科學(xué)的說法，但是，剛開始一定要大膽的拍腦袋，而不是大家都停在一個(gè)點(diǎn)，什么都不做。

有時(shí)候做推薦系統(tǒng)，關(guān)于某些關(guān)鍵行為的權(quán)重該如何設(shè)置的問題，如果產(chǎn)品運(yùn)營完全不參與，把這個(gè)問題推給技術(shù)，技術(shù)有時(shí)候?qū)I(yè)務(wù)的理解沒有那么深，他可能傾向于用一個(gè)很復(fù)雜的算法來算權(quán)重。

當(dāng)然，最好的方式更多還是需要產(chǎn)品給技術(shù)更多的輸入。如果產(chǎn)品告訴技術(shù)，在產(chǎn)品里面用戶很喜歡圖片，可以先把圖片權(quán)重調(diào)高一點(diǎn)，把故事權(quán)重調(diào)低一點(diǎn)，技術(shù)按照這個(gè)規(guī)則先嘗試一下，事實(shí)上，在推薦系統(tǒng)整個(gè)開發(fā)迭代過程中經(jīng)常會(huì)反復(fù)的調(diào)高調(diào)低權(quán)重，并且在這個(gè)實(shí)踐應(yīng)用過程中也會(huì)發(fā)現(xiàn)其中的優(yōu)劣勢。

再舉個(gè)例子，之前我在 A 站早期帶 A 站的時(shí)候，因?yàn)楫?dāng)時(shí)還較小，養(yǎng)不起一個(gè)算法團(tuán)隊(duì)，所以我們買了市面上的一些黑盒推薦服務(wù)，企業(yè)只需要提供數(shù)據(jù)，服務(wù)商就可以把推薦結(jié)果給你，最終發(fā)現(xiàn)效果特別差，而且你想做相關(guān)的調(diào)整把某個(gè)受歡迎的頻道權(quán)重調(diào)高一點(diǎn)，但因?yàn)槭羌兒诤型扑]，企業(yè)自身根本無法直接調(diào)整，或企業(yè)給服務(wù)商提需求，可能需要等幾個(gè)月才能拿到結(jié)果，那么推薦的最終效果就很難保證。所以即使市面上有很多黑盒推薦，接入成本也比較低，但企業(yè)會(huì)發(fā)現(xiàn)推薦系統(tǒng)不是一個(gè)接入一次就完成的事情，推薦系統(tǒng)需要在這個(gè)過程中不斷地去調(diào)整，不斷地根據(jù)業(yè)務(wù)去反饋。

因此，企業(yè)在拍腦袋的時(shí)候，需要產(chǎn)品和運(yùn)營定義到底哪些「用戶行為」更重要、或者意味著什么，這是靠機(jī)器無法做的。比如，用戶看一篇文章滾動(dòng)到底部，機(jī)器并不會(huì)認(rèn)為這有什么價(jià)值，但我們會(huì)認(rèn)為該用戶對這篇文章真的感興趣。也就是一個(gè)無用的信息，加入了人工的判斷認(rèn)知之后，就可能變成在整個(gè)推薦系統(tǒng)里很關(guān)鍵的信號。這個(gè)系統(tǒng)里還有很多這種類似的行為需要人為的給這些行為打上一個(gè)標(biāo)記，判定為喜歡或不喜歡的信號，這種信號極其重要，不是大家想象的推薦是根據(jù)一些很明確的行為定義的，很多用戶的喜歡和不喜歡判斷都不是用戶主動(dòng)表達(dá)出來的，都是依靠產(chǎn)品、運(yùn)營、技術(shù)一起研究業(yè)務(wù)、用戶流程推斷出來的。

那么行為如何彰顯喜歡程度或者討厭程度呢？舉個(gè)例子，對于電商產(chǎn)品，通常會(huì)認(rèn)為一個(gè)用戶對于商品的興趣表達(dá)公式是：購買遠(yuǎn)大于收藏，收藏大于瀏覽。在做推薦系統(tǒng)時(shí)，這些權(quán)重就需要考慮進(jìn)去。

秘籍 4：反復(fù)檢閱推薦結(jié)果

企業(yè)不是只要推薦系統(tǒng)上線就可以了，還需要反復(fù)檢閱推薦結(jié)果。一般檢閱分兩種：離線和在線。

第一個(gè)是在線的檢閱。在線檢閱的核心是企業(yè)要理解用戶的行為模式，產(chǎn)品要像用戶一樣去用自身的產(chǎn)品以及推薦模塊，設(shè)身處地感受一下現(xiàn)在推薦的內(nèi)容是否是自己想要的，如果推薦的內(nèi)容不是想看的，就需要和運(yùn)營、技術(shù)溝通，為什么這次推薦的是一個(gè)我不想看的內(nèi)容，就是你要把推薦放到一個(gè)實(shí)際的場景里，真正地自己去體會(huì)去理解用戶的行為。

第二個(gè)是離線的檢閱。過去做產(chǎn)品時(shí)，我們有時(shí)候會(huì)仔細(xì)分析給用戶推薦的歷史結(jié)果中是否存在一些很明顯的 Bad case，這也是企業(yè)改善推薦質(zhì)量很常見的一種方式。

豆瓣電臺過去做中文英文曲庫分割就是一個(gè)典型例子，當(dāng)時(shí)豆瓣的收聽率一直無法上升，最后豆瓣員工進(jìn)入用戶狀態(tài)，換位思考發(fā)現(xiàn)有些人喜歡聽中文歌，完全不喜歡英文歌，而還有些人喜歡聽英文歌，卻反感中文歌。從推薦角度思考，只需要做一個(gè)簡單的事，把中文跟英文的曲風(fēng)直接區(qū)隔開，區(qū)隔開后豆瓣的推薦準(zhǔn)確率瞬間提升。

另外一個(gè)例子是，有一次我們做商品推薦遇到了瓶頸，我們采取了一個(gè)方法，在每次推薦批次的商品中加入幾個(gè) 10 元包郵或 20 元包郵的商品，最后整個(gè)點(diǎn)擊率、轉(zhuǎn)化率都提升了，這并不是科學(xué)的方法，但當(dāng)企業(yè)做一些在線的體驗(yàn)優(yōu)化或是離線的 Bad case 校驗(yàn)時(shí)，你會(huì)發(fā)現(xiàn)一些粗暴的解決方法，但是這些對于整體的效果提升很有效。

秘籍 5：多學(xué)習(xí)一些算法知識

非技術(shù)出身的產(chǎn)品、運(yùn)營，如果真的想把推薦業(yè)務(wù)做好，建議學(xué)一些算法知識，至少簡單知道每一個(gè)算法的基本優(yōu)劣勢，這樣才能為你的優(yōu)化方向提供目標(biāo)和思路，溝通更順暢，更容易碰撞出火花。

比如，當(dāng)做協(xié)同過濾的推薦系統(tǒng)時(shí)，當(dāng)企業(yè)有 6000 萬的歷史用戶，平均每個(gè)人喜歡十個(gè)商品，但是只能推薦 1000 萬個(gè)商品。對于沒有做過推薦系統(tǒng)的大部分人，對其背后的的工程難度是無法想象的，但是你需要配合工程師去理解，如果你不理解工程難度在哪，就提不出比較好的建議。

比如產(chǎn)品、運(yùn)營需要知道，過熱、過冷、太 low 是一些很常見的 Bad case。過熱指的是推薦的永遠(yuǎn)是很重要的內(nèi)容；過冷就是總推薦一些最冷門的內(nèi)容，導(dǎo)致用戶點(diǎn)擊率低；太 low，也是很常見的，內(nèi)容質(zhì)量低，用戶不喜歡。這也是我認(rèn)為有時(shí)候產(chǎn)品運(yùn)營參與推進(jìn)業(yè)務(wù)可以幫助技術(shù)解決的一個(gè)特別好的點(diǎn)。在我做產(chǎn)品時(shí)，一旦發(fā)現(xiàn)有 Bad case，就直接干掉，在這過程中不僅優(yōu)化了整個(gè)推薦的質(zhì)量，還通過不斷地干掉這個(gè)動(dòng)作本身發(fā)現(xiàn)一些問題和規(guī)律。

再分享一個(gè)經(jīng)典問題——如何做冷啟動(dòng)？現(xiàn)在已經(jīng)集中在幾個(gè)大概的方向：1.主動(dòng)收集，讓用戶去選一些感興趣的一些方向，如豆瓣注冊后讓你選擇感興趣的類目；2.被動(dòng)收集，如在淘寶網(wǎng)頁收集用戶的一些點(diǎn)擊、瀏覽等行為數(shù)據(jù)。

七、推薦系統(tǒng)的未來走向

下面簡單聊聊我對推薦系統(tǒng)的未來走向的想法。事實(shí)上，現(xiàn)在的一些企業(yè)的推薦系統(tǒng)，大部分算法都是混合發(fā)揮作用的，也就是復(fù)合算法。企業(yè)還可以在復(fù)合算法基礎(chǔ)上加入競爭機(jī)制，如在同樣一個(gè)推薦場景，多個(gè)窗口同時(shí)運(yùn)作，這些窗口之間存在相互競爭，最后判定在同一個(gè)場景下，到底哪個(gè)算法、推薦機(jī)制更有效果。又或者企業(yè)直接使用機(jī)器學(xué)習(xí)，機(jī)器學(xué)習(xí)會(huì)自主做一些 utem、 item 的建模，甚至是算法之間的競爭關(guān)系。

事實(shí)上，相比我在 2008 年剛?cè)胄械臅r(shí)，現(xiàn)在的推薦系統(tǒng)已經(jīng)非常復(fù)雜，我認(rèn)為之后這些會(huì)更復(fù)雜、越來越抽象，如今任何一個(gè)公司想自己從 0 開始做推薦系統(tǒng)都會(huì)非常困難。但是不管基于我過去的產(chǎn)品經(jīng)驗(yàn)，還是現(xiàn)在在神策數(shù)據(jù)的經(jīng)驗(yàn)，總結(jié)發(fā)現(xiàn)其實(shí)構(gòu)建推薦系統(tǒng)的價(jià)值觀、企業(yè)對于自己公司業(yè)務(wù)的理解，在整個(gè)推薦的搭建過程當(dāng)中起著至關(guān)重要的作用。

文：?策小編@神策數(shù)據(jù)?(SensorsDataCrop)

首席增長官CGO薦讀小紅書推廣：

更多精彩，關(guān)注：增長黑客（GrowthHK.cn）

增長黑客（Growth Hacker）是依靠技術(shù)和數(shù)據(jù)來達(dá)成各種營銷目標(biāo)的新型團(tuán)隊(duì)角色。從單線思維者時(shí)常忽略的角度和高度，梳理整合產(chǎn)品發(fā)展的因素，實(shí)現(xiàn)低成本甚至零成本帶來的有效增長…

本文經(jīng)授權(quán)發(fā)布，不代表增長黑客立場，如若轉(zhuǎn)載，請注明出處：http://gptmaths.com/quan/18982.html

神策數(shù)據(jù) VP 張濤：個(gè)性化推薦從入門到精通

關(guān)于作者

小鉆風(fēng)

發(fā)表回復(fù)

神策數(shù)據(jù) VP 張濤：個(gè)性化推薦從入門到精通

關(guān)于作者

小鉆風(fēng)

增長黑客Growthhk.cn薦讀更多>>

品牌如何布局微信生態(tài)，玩轉(zhuǎn)私域運(yùn)營｜神策數(shù)據(jù)

神策數(shù)據(jù)CEO桑文鋒：以數(shù)據(jù)思維與數(shù)據(jù)價(jià)值驅(qū)動(dòng)增長

羅文：神策系統(tǒng)的拆解與分析｜羅文正雄

神策數(shù)據(jù)桑文鋒：產(chǎn)品與市場需求雙重 Ready，才能做好PMF

100%還原小仙燉 618 私域個(gè)性化服務(wù)實(shí)踐丨神策數(shù)據(jù)

撕開大促活動(dòng)內(nèi)核：前、中、后期的完美操作

發(fā)表回復(fù)

神策數(shù)據(jù)桑文鋒：產(chǎn)品與市場需求雙重 Ready，才能做好PMF

撕開大促活動(dòng)內(nèi)核：前、中、后期的完美操作