關(guān)于UGC內(nèi)容社區(qū)新熱推薦的一些思考記錄

本篇文章不會涉及過多背景介紹與基礎(chǔ)信息的講解,默認大家都對于推薦本身,對于推薦為何要追求新熱有一定認知。

一句話而言:內(nèi)容推薦是將用戶喜歡的,同時符合平臺意志的內(nèi)容按照一定順序展現(xiàn)給用戶,而熱點事件是最吸引眼球的,對于新熱內(nèi)容,如果能更快更及時地展現(xiàn)給用戶,就能夠?qū)⒂脩舻淖⒁饬卫蔚刈ピ谄脚_手中。

基于策略PM視角,內(nèi)容社區(qū)應(yīng)該從以下幾個方面去服務(wù)滿足用戶獲取新熱內(nèi)容的需求:

熱點獲取、熱點內(nèi)容挖掘、熱點內(nèi)容推薦、熱點感知提升&評估體系搭建。

下面我也會從這幾個維度來聊聊新熱推薦在內(nèi)容社區(qū)的實施,包含一些可能存在的坑,以及一些需要注意的關(guān)鍵點。

2 新熱推薦的社區(qū)應(yīng)用

2.1 熱點獲取

熱點事件分為兩種,一種是全網(wǎng)熱點事件,比如前段時間的吳亦凡被捕、東航墜機事件、最近的上海疫情進展,第二種是原生熱點事件,基于社區(qū)文化,在內(nèi)部產(chǎn)生,具備一定破圈能力的事件,這方面的案例最典型的是古早的“賈君鵬,你媽媽喊你回家吃飯”、最近的“蔡徐坤周杰倫超話打榜”。

全網(wǎng)熱點事件是全民關(guān)注的,其特征是發(fā)酵非常迅速,能吸引大多數(shù)人的目光,通常不具備過高的理解門檻,但足夠重要或者足夠勁爆。當事件發(fā)生時,人工往往會比機器有更強的先驗判斷能力,比如吳亦凡事件,當被捕的消息剛發(fā)布微博的時候,機器可能需要計算同時段爆發(fā)的相關(guān)討論情況才能判斷事件等級,但人工就很容易判斷其一定是一個全網(wǎng)熱點事件。

原生熱點則一般是社區(qū)內(nèi)部先小范圍發(fā)酵,是社區(qū)用戶一段時間最關(guān)心熱議的話題,初期一般具備具備鮮明的領(lǐng)域?qū)傩?,或者存在一定理解門檻。但當討論議題足夠具備爭議性,且衍生出了一些不需要了解事情完整情況也能get到的梗的時候,原生熱點也完成了進階,具備了拓圈,成為全網(wǎng)熱點事件的可能。

扯了一大堆終于到了正題,作為平臺方,我們應(yīng)該如何更快更準確的獲取到熱點信號呢?

同樣需要分熱點類型來看,對于全網(wǎng)熱點事件,著重看三方面信號:競品push內(nèi)容(微博、頭條、百度等)、頭部媒體號發(fā)布內(nèi)容(人民日報、共青團中央等)、競品熱榜內(nèi)容。

其中push通常是最快的,熱榜是最準的,頭部媒體號發(fā)布的通常是最具價值的。

這三類信號都存在雜音,比如push還包括很多非新熱向的個性化push,熱榜也通常有平臺意志強加的內(nèi)容,策略在這步中需要做好的是信號的獲取與處理,接入更豐富的信號源,做好信號處理,包括事件聚合(同一事件在不同平臺存在不同表述)、事件交叉驗證(同時間出現(xiàn)在多個競品熱榜高位的大概率是全網(wǎng)熱點事件)。

不可或缺的還是運營的介入,提供一個人工的判斷界定,可能更快的熱點事件發(fā)現(xiàn)、修正策略對事件重要性的判斷結(jié)果,這方面需要策略團隊與運營的通力協(xié)作,通常還需要設(shè)置一些中間指標,來衡量策略和運營在熱點發(fā)現(xiàn)這一環(huán)節(jié)的表現(xiàn),這塊可以自行設(shè)置,就不再展開。

而對于原生熱點事件,就更讓人頭疼了,對于頭部社區(qū)來說,如微博,由于用戶形成了較強的#話題感知,通過計算一段時間內(nèi)話題的熱點躥升情況,是能夠很好發(fā)現(xiàn)熱點的,而對于其他ugc內(nèi)容社區(qū),熱度躥升的德爾塔值同樣具備很強的參考價值,因為具備討論的熱點一定會在短時間具備強虹吸效應(yīng),將附近的注意力與流量聚集起來,這就會帶來一些置信的熱點判斷信號,包括用戶層面的集群、內(nèi)容層面的集群。

策略團隊通過與數(shù)據(jù)團隊協(xié)作,定義獲取熱點置信信號,定義熱點爆發(fā)度信號(用于計算熱點內(nèi)容的爆發(fā)擴散能力)、來挖掘可能的原生熱點事件。

2.2 熱點內(nèi)容挖掘

這部分尤其針對全網(wǎng)熱點,從外站獲取到了熱點事件,通常以一串文字的形式呈現(xiàn),比如#鄧倫偷稅1.06億,這就是策略用以內(nèi)容挖掘的主要抓手,而在ugc內(nèi)容社區(qū),用戶發(fā)布的內(nèi)容并不具備很強的結(jié)構(gòu)化,很多時候標題就是“xdm,出大事了”,然后截圖的熱點事件的外站截圖,這就給策略做內(nèi)容匹配出了一道大難題。

要平衡準確性和召回能力,怎么解呢?

傳統(tǒng)的做法是通過切詞匹配&事件聚合策略,匹配的主體分別是熱點事件名的切詞結(jié)果和社區(qū)內(nèi)容標題,這種做法的優(yōu)點是匹配的準確性較好,但缺點是沒法匹配到上一段我們所說的那種內(nèi)容,而這種內(nèi)容可能在社區(qū)中占比比高結(jié)構(gòu)化的內(nèi)容多得多。

筆者嘗試過加入正文內(nèi)容,以及ocr識圖結(jié)果來做匹配,結(jié)果是匹配的相關(guān)性很差,幾乎是不可用的程度,和策略rd討論過后,有幾種可嘗試的方法,也po出來和大家討論:

  • 梯度匹配,同樣引入正文內(nèi)容和ocr結(jié)果,但加入限制,對于這部分內(nèi)容,要求匹配相關(guān)性更高,再加入召回。
  • 策略嘗試,在jarcard相似度的基礎(chǔ)上嘗試其他算法,進行bagging,提升匹配的準確性。
  • 獲取熱點title及落地頁內(nèi)容、社區(qū)內(nèi)容title和內(nèi)容,基于KeyGraph算法做匹配。
  • 同樣,運營在這步中可以做為人工內(nèi)容補充的一個源泉,同時對策略挖掘的內(nèi)容做二次審核和不相關(guān)剔除,同樣需要制定相應(yīng)的中間指標,共背指標才能互相約束。

這部分就不細拆了,如果想要進一步討論,可以找筆者私聊~

2.3 熱點內(nèi)容推薦

這部分反倒是最簡單的,三個步驟需要關(guān)注一下:熱點事件的定向人群冷啟、熱點事件的擴散、熱點事件的LCN及時退場。

定向人群依賴于對用戶畫像的刻畫,需要對新熱用戶進行定義,對這部分喜歡看熱點事件的用戶,優(yōu)先將熱點事件推薦展現(xiàn),根據(jù)他們的表現(xiàn),來決定下一步是否需要進行熱點推薦的擴散(提權(quán))、熱點事件同樣需要做好LCN退場,即對于同一個事件下,內(nèi)容推薦超過X條,無點擊行為,需要對該用戶及時退場,避免搶占曝光資源。

這步策略主要聚焦的核心指標,可以通過“事件發(fā)生xx min時間內(nèi)的用戶覆蓋”來衡量。

2.4 熱點感知提升&評估體系搭建

推薦出新熱內(nèi)容,并不直接意味著用戶新熱感知自提升了,需要結(jié)合功能側(cè)的一些改動,比如典型如微博,推薦帶推薦理由,搜索框?qū)崟r展現(xiàn)熱點事件等,都是從功能側(cè)驅(qū)動,配合策略實現(xiàn)用戶切實對新熱事件感知的提升。

關(guān)于UGC內(nèi)容社區(qū)新熱推薦的一些思考記錄

那么怎么評估用戶新熱感知提升了呢?

包括月度的用戶評估報告(最好有和競品的對比,新熱感知月報)和數(shù)據(jù)維度的例行評估。

數(shù)據(jù)維度的評估主要從四個方面進行:

  • 全面:事件覆蓋全、事件推薦角度全;
  • 及時:是否在事件發(fā)生第一時間給用戶推薦出來;
  • 準確:是否內(nèi)容是熱點事件相關(guān)的,是否推給了對該熱點事件感興趣的人;
  • 適度:是否推薦適度,不存在霸屏、連出、退場不及時的問題;

3 新熱推薦的拓展想法

有幾個問題筆者一直在思考:

  • 內(nèi)容社區(qū)真的把新熱做起來,應(yīng)該是一個什么樣的狀態(tài)?
  • 熱點事件,更應(yīng)該以什么形式承載,單內(nèi)容?話題?
  • 話題榜中,全網(wǎng)熱點和原生熱點,應(yīng)該怎么分布才算合理?
  • 新熱線條,產(chǎn)品和運營應(yīng)該怎么分工,究竟是哪方主導(dǎo)?

這幾個問題,限于篇幅,就不在這篇文章中展開了,如果大家有想法,可以在評論區(qū)發(fā)表自己的看法,也可以找我私聊討論。

若能拋磚引玉,不勝榮幸~

本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://gptmaths.com/cgo/coo/63832.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2022-04-08 10:46
下一篇 2022-04-08 11:00

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論