1 前言
本篇文章不會涉及過多背景介紹與基礎(chǔ)信息的講解,默認(rèn)大家都對于推薦本身,對于推薦為何要追求新熱有一定認(rèn)知。
一句話而言:內(nèi)容推薦是將用戶喜歡的,同時符合平臺意志的內(nèi)容按照一定順序展現(xiàn)給用戶,而熱點事件是最吸引眼球的,對于新熱內(nèi)容,如果能更快更及時地展現(xiàn)給用戶,就能夠?qū)⒂脩舻淖⒁饬卫蔚刈ピ谄脚_手中。
基于策略PM視角,內(nèi)容社區(qū)應(yīng)該從以下幾個方面去服務(wù)滿足用戶獲取新熱內(nèi)容的需求:
熱點獲取、熱點內(nèi)容挖掘、熱點內(nèi)容推薦、熱點感知提升&評估體系搭建。
下面我也會從這幾個維度來聊聊新熱推薦在內(nèi)容社區(qū)的實施,包含一些可能存在的坑,以及一些需要注意的關(guān)鍵點。
2 新熱推薦的社區(qū)應(yīng)用
2.1 熱點獲取
熱點事件分為兩種,一種是全網(wǎng)熱點事件,比如前段時間的吳亦凡被捕、東航墜機(jī)事件、最近的上海疫情進(jìn)展,第二種是原生熱點事件,基于社區(qū)文化,在內(nèi)部產(chǎn)生,具備一定破圈能力的事件,這方面的案例最典型的是古早的“賈君鵬,你媽媽喊你回家吃飯”、最近的“蔡徐坤周杰倫超話打榜”。
全網(wǎng)熱點事件是全民關(guān)注的,其特征是發(fā)酵非常迅速,能吸引大多數(shù)人的目光,通常不具備過高的理解門檻,但足夠重要或者足夠勁爆。當(dāng)事件發(fā)生時,人工往往會比機(jī)器有更強(qiáng)的先驗判斷能力,比如吳亦凡事件,當(dāng)被捕的消息剛發(fā)布微博的時候,機(jī)器可能需要計算同時段爆發(fā)的相關(guān)討論情況才能判斷事件等級,但人工就很容易判斷其一定是一個全網(wǎng)熱點事件。
原生熱點則一般是社區(qū)內(nèi)部先小范圍發(fā)酵,是社區(qū)用戶一段時間最關(guān)心熱議的話題,初期一般具備具備鮮明的領(lǐng)域?qū)傩?,或者存在一定理解門檻。但當(dāng)討論議題足夠具備爭議性,且衍生出了一些不需要了解事情完整情況也能get到的梗的時候,原生熱點也完成了進(jìn)階,具備了拓圈,成為全網(wǎng)熱點事件的可能。
扯了一大堆終于到了正題,作為平臺方,我們應(yīng)該如何更快更準(zhǔn)確的獲取到熱點信號呢?
同樣需要分熱點類型來看,對于全網(wǎng)熱點事件,著重看三方面信號:競品push內(nèi)容(微博、頭條、百度等)、頭部媒體號發(fā)布內(nèi)容(人民日報、共青團(tuán)中央等)、競品熱榜內(nèi)容。
其中push通常是最快的,熱榜是最準(zhǔn)的,頭部媒體號發(fā)布的通常是最具價值的。
這三類信號都存在雜音,比如push還包括很多非新熱向的個性化push,熱榜也通常有平臺意志強(qiáng)加的內(nèi)容,策略在這步中需要做好的是信號的獲取與處理,接入更豐富的信號源,做好信號處理,包括事件聚合(同一事件在不同平臺存在不同表述)、事件交叉驗證(同時間出現(xiàn)在多個競品熱榜高位的大概率是全網(wǎng)熱點事件)。
不可或缺的還是運營的介入,提供一個人工的判斷界定,可能更快的熱點事件發(fā)現(xiàn)、修正策略對事件重要性的判斷結(jié)果,這方面需要策略團(tuán)隊與運營的通力協(xié)作,通常還需要設(shè)置一些中間指標(biāo),來衡量策略和運營在熱點發(fā)現(xiàn)這一環(huán)節(jié)的表現(xiàn),這塊可以自行設(shè)置,就不再展開。
而對于原生熱點事件,就更讓人頭疼了,對于頭部社區(qū)來說,如微博,由于用戶形成了較強(qiáng)的#話題感知,通過計算一段時間內(nèi)話題的熱點躥升情況,是能夠很好發(fā)現(xiàn)熱點的,而對于其他ugc內(nèi)容社區(qū),熱度躥升的德爾塔值同樣具備很強(qiáng)的參考價值,因為具備討論的熱點一定會在短時間具備強(qiáng)虹吸效應(yīng),將附近的注意力與流量聚集起來,這就會帶來一些置信的熱點判斷信號,包括用戶層面的集群、內(nèi)容層面的集群。
策略團(tuán)隊通過與數(shù)據(jù)團(tuán)隊協(xié)作,定義獲取熱點置信信號,定義熱點爆發(fā)度信號(用于計算熱點內(nèi)容的爆發(fā)擴(kuò)散能力)、來挖掘可能的原生熱點事件。
2.2 熱點內(nèi)容挖掘
這部分尤其針對全網(wǎng)熱點,從外站獲取到了熱點事件,通常以一串文字的形式呈現(xiàn),比如#鄧倫偷稅1.06億,這就是策略用以內(nèi)容挖掘的主要抓手,而在ugc內(nèi)容社區(qū),用戶發(fā)布的內(nèi)容并不具備很強(qiáng)的結(jié)構(gòu)化,很多時候標(biāo)題就是“xdm,出大事了”,然后截圖的熱點事件的外站截圖,這就給策略做內(nèi)容匹配出了一道大難題。
要平衡準(zhǔn)確性和召回能力,怎么解呢?
傳統(tǒng)的做法是通過切詞匹配&事件聚合策略,匹配的主體分別是熱點事件名的切詞結(jié)果和社區(qū)內(nèi)容標(biāo)題,這種做法的優(yōu)點是匹配的準(zhǔn)確性較好,但缺點是沒法匹配到上一段我們所說的那種內(nèi)容,而這種內(nèi)容可能在社區(qū)中占比比高結(jié)構(gòu)化的內(nèi)容多得多。
筆者嘗試過加入正文內(nèi)容,以及ocr識圖結(jié)果來做匹配,結(jié)果是匹配的相關(guān)性很差,幾乎是不可用的程度,和策略rd討論過后,有幾種可嘗試的方法,也po出來和大家討論:
- 梯度匹配,同樣引入正文內(nèi)容和ocr結(jié)果,但加入限制,對于這部分內(nèi)容,要求匹配相關(guān)性更高,再加入召回。
- 策略嘗試,在jarcard相似度的基礎(chǔ)上嘗試其他算法,進(jìn)行bagging,提升匹配的準(zhǔn)確性。
- 獲取熱點title及落地頁內(nèi)容、社區(qū)內(nèi)容title和內(nèi)容,基于KeyGraph算法做匹配。
同樣,運營在這步中可以做為人工內(nèi)容補(bǔ)充的一個源泉,同時對策略挖掘的內(nèi)容做二次審核和不相關(guān)剔除,同樣需要制定相應(yīng)的中間指標(biāo),共背指標(biāo)才能互相約束。
這部分就不細(xì)拆了,如果想要進(jìn)一步討論,可以找筆者私聊~
2.3 熱點內(nèi)容推薦
這部分反倒是最簡單的,三個步驟需要關(guān)注一下:熱點事件的定向人群冷啟、熱點事件的擴(kuò)散、熱點事件的LCN及時退場。
定向人群依賴于對用戶畫像的刻畫,需要對新熱用戶進(jìn)行定義,對這部分喜歡看熱點事件的用戶,優(yōu)先將熱點事件推薦展現(xiàn),根據(jù)他們的表現(xiàn),來決定下一步是否需要進(jìn)行熱點推薦的擴(kuò)散(提權(quán))、熱點事件同樣需要做好LCN退場,即對于同一個事件下,內(nèi)容推薦超過X條,無點擊行為,需要對該用戶及時退場,避免搶占曝光資源。
這步策略主要聚焦的核心指標(biāo),可以通過“事件發(fā)生xx min時間內(nèi)的用戶覆蓋”來衡量。
2.4 熱點感知提升&評估體系搭建
推薦出新熱內(nèi)容,并不直接意味著用戶新熱感知自提升了,需要結(jié)合功能側(cè)的一些改動,比如典型如微博,推薦帶推薦理由,搜索框?qū)崟r展現(xiàn)熱點事件等,都是從功能側(cè)驅(qū)動,配合策略實現(xiàn)用戶切實對新熱事件感知的提升。
那么怎么評估用戶新熱感知提升了呢?
包括月度的用戶評估報告(最好有和競品的對比,新熱感知月報)和數(shù)據(jù)維度的例行評估。
數(shù)據(jù)維度的評估主要從四個方面進(jìn)行:
- 全面:事件覆蓋全、事件推薦角度全;
- 及時:是否在事件發(fā)生第一時間給用戶推薦出來;
- 準(zhǔn)確:是否內(nèi)容是熱點事件相關(guān)的,是否推給了對該熱點事件感興趣的人;
- 適度:是否推薦適度,不存在霸屏、連出、退場不及時的問題;
3 新熱推薦的拓展想法
有幾個問題筆者一直在思考:
- 內(nèi)容社區(qū)真的把新熱做起來,應(yīng)該是一個什么樣的狀態(tài)?
- 熱點事件,更應(yīng)該以什么形式承載,單內(nèi)容?話題?
- 話題榜中,全網(wǎng)熱點和原生熱點,應(yīng)該怎么分布才算合理?
- 新熱線條,產(chǎn)品和運營應(yīng)該怎么分工,究竟是哪方主導(dǎo)?
作者:隨心將夜 從一隅觀察互聯(lián)網(wǎng)產(chǎn)品,見證菜鳥產(chǎn)品的進(jìn)階之旅。
本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/coo/63338.html