DataFun
高小青:Impala在神策數(shù)據(jù)實(shí)時(shí)分析引擎中的落地與優(yōu)化|DataFunTalk
導(dǎo)讀:今天分享的主題是“Impala落地與優(yōu)化:神策數(shù)據(jù)多維分析平臺(tái)構(gòu)建實(shí)戰(zhàn)”,分為五個(gè)部分: 神策產(chǎn)品技術(shù)架構(gòu) 基于Impala的實(shí)時(shí)分析引擎 查詢性能優(yōu)化 查詢資源預(yù)估 未來計(jì)…
周冰倩:廣告主視角下的信息流廣告算法探索|DataFunTalk
廣告主不能像廣告平臺(tái)一樣,獲取到比較多的用戶維度的曝光數(shù)據(jù),并且在廣告主側(cè)獲取不到端外新用戶的特征。本次分享會(huì)著重講一下哈啰出行作為廣告主,是如何在這些挑戰(zhàn)下進(jìn)行信息流廣告算法建模…
李翔:美團(tuán)到店綜合知識(shí)圖譜的構(gòu)建與應(yīng)用|DataFunTalk
美團(tuán)到店綜合業(yè)務(wù)涵蓋了本地生活中的休閑玩樂、麗人、親子、結(jié)婚、寵物等多個(gè)行業(yè)。為了不斷提升到店綜合業(yè)務(wù)場(chǎng)景下的供需匹配效率,美團(tuán)深入挖掘用戶在本地生活中的多樣化需求,構(gòu)建了以用戶需…
張宗耀:bilibili每天100T+的數(shù)據(jù)導(dǎo)入是如何實(shí)現(xiàn)的|DataFunTalk
導(dǎo)讀:B站千億級(jí)數(shù)據(jù)同步,每天100T+數(shù)據(jù)導(dǎo)入是如何實(shí)現(xiàn)的?本文將介紹Apache SeaTunnel在嗶哩嗶哩的實(shí)踐。包括以下幾方面內(nèi)容: 工具選擇 日志 提速/限流 監(jiān)控自理…
吳怡雯:騰訊數(shù)據(jù)湖元數(shù)據(jù)治理實(shí)踐|?DataFunTalk
導(dǎo)讀:大家好,今天分享的主題是騰訊數(shù)據(jù)湖的元數(shù)據(jù)治理實(shí)踐,跟大家一起聊聊騰訊云上DLC數(shù)據(jù)湖計(jì)算產(chǎn)品中統(tǒng)一元數(shù)據(jù)的設(shè)計(jì)思路和實(shí)踐經(jīng)驗(yàn),希望能給大家?guī)硪恍﹨⒖肌?本文的內(nèi)容主要包括…
蔣能學(xué):網(wǎng)易云音樂廣告算法實(shí)踐|?DataFunTalk
導(dǎo)讀:本次分享的主題為網(wǎng)易云音樂廣告算法實(shí)踐,內(nèi)容圍繞以下五個(gè)部分: 網(wǎng)易云音樂廣告系統(tǒng)簡介 廣告點(diǎn)擊率預(yù)估模型 廣告轉(zhuǎn)化率預(yù)估模型 用戶向量建模與應(yīng)用 總結(jié)與建議 網(wǎng)易云音樂廣告…
京東算法工程師張菡:深度學(xué)習(xí)下的京東搜索召回技術(shù)|?DataFunTalk
導(dǎo)讀:搜索主要經(jīng)歷四個(gè)階段:召回、粗排、精排和重排,最后呈現(xiàn)給用戶最終的結(jié)果。而召回的結(jié)果主要來自兩個(gè)部分:倒排檢索和語義召回。傳統(tǒng)的倒排檢索依賴字面匹配,很難去召回一些語義相似但…
谷維:快手如何提升數(shù)據(jù)化管理效率|DataFunTalk
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)對(duì)于每個(gè)企業(yè),每個(gè)人來說都是極其重要的,淘寶通過數(shù)據(jù)可以給每個(gè)客戶精準(zhǔn)推薦商品,抖音通過數(shù)據(jù)可以記錄每個(gè)用戶的使用習(xí)慣。但同時(shí),數(shù)據(jù)時(shí)代的到來,也讓眾多企…
Kevin:QQ音樂命名實(shí)體識(shí)別技術(shù)|DataFunTalk
導(dǎo)讀:命名實(shí)體識(shí)別(Named Entity Recognition,簡稱NER)是自然語言處理中的熱點(diǎn)研究方向之一,目的是識(shí)別文本中的命名實(shí)體,并將其歸納到相應(yīng)的實(shí)體類型中。命名…
李茶:虎牙直播推薦系統(tǒng)架構(gòu)詳解|DataFunTalk
大家好,我叫李茶,來自虎牙直播的推薦工程組,主要負(fù)責(zé)虎牙直播的推薦架構(gòu)工作。 直播推薦是一個(gè)頭部主播比較集中的場(chǎng)景,比較注重關(guān)系鏈、詞語以及長期的價(jià)值,業(yè)務(wù)訴求可能和其他推薦場(chǎng)景有…