疫情的這一年,似乎是所有公司對于數(shù)字化轉型開始重視的一年。
一、數(shù)據(jù)的發(fā)展
無數(shù)公司在加快數(shù)字化轉型的速度,而居家、在線、微信生態(tài)(小程序、視頻號)、抖音快手的加速下沉又為這一轉型構建了完善的基礎并提供助力。游戲、電商、直播、在線教育等互聯(lián)網(wǎng)C端業(yè)務隨著用戶需求激增而飛速發(fā)展,同時還帶動了之前并不是太受重視的SaaS、PaaS等To B業(yè)務。
在這一系列的變化下,數(shù)據(jù)的量級、多樣性以及分布的平臺都發(fā)生了不小的變化,而在各家的管理者口中,與數(shù)據(jù)相關的概念、平臺、工具、能力也開始越來越多地被提及。從早些年的Hadoop到數(shù)據(jù)中臺,再到“數(shù)據(jù)即能源”,從DMP到CDP,從公域再到私域,讓人感慨快跟不上節(jié)奏。
本文筆者將把目前比較常被提及的與數(shù)據(jù)相關的概念做一個通俗梳理,幫助那些之前沒接觸過或是剛接觸這方面信息,并有打算做些事情的創(chuàng)業(yè)者了解:現(xiàn)在在談論數(shù)據(jù)的那些場景,大家到底在講些什么?
二、基礎層面
- 數(shù)據(jù)庫
這個概念幾乎業(yè)內人都接觸過,簡單來說,數(shù)據(jù)庫就是按照數(shù)據(jù)結構來組織、 存儲和管理數(shù)據(jù)的倉庫。這個概念已經(jīng)有六十多年的歷史了,可以說后續(xù)所有跟數(shù)據(jù)相關的概念都是從這里衍生出來的。
這里主要介紹的是現(xiàn)在大家經(jīng)常提到的數(shù)據(jù)庫,分為SQL和NOSQL兩類,很多沒有接觸過的人就會感到疑惑,其實這兩個都是一種簡稱。
SQL型數(shù)據(jù)指的就是我們之前常用和常說的關系型數(shù)據(jù)庫,主要代表有SQL Serve、Oracle、MySQL等;而NoSQL泛指非關系型數(shù)據(jù)庫,主要代表有MongoDB、Redis、Hbase,這種數(shù)據(jù)庫具備更好的擴展性,我們經(jīng)常聽說的大數(shù)據(jù)集群往往就是指的這種。
不過這里面有個概念要明確,兩者并不是完全對立,NOSQL并不是說不要關系性了,而是指Not Only SQL。
對于非技術出身的人來說,不需要理解那么精準,只要了解自己的業(yè)務的數(shù)據(jù)是單一、結構化、穩(wěn)定的還是復雜、多樣、變化多的就好了,前者往往針對的是一些場景固定、長期的業(yè)務,如銀行、純線上電商等;而后者面對的往往是針對社交、網(wǎng)絡平臺等與內容相關的場景。
但對于目前的互聯(lián)網(wǎng)公司來說,業(yè)務往往都不那么單一了,所以往往都是選擇關系型數(shù)據(jù)庫(如MYSQL)和NOSQL數(shù)據(jù)庫的混合方案來針對不同場景的數(shù)據(jù)進行支持。
- 數(shù)據(jù)倉庫和數(shù)據(jù)集市
1、數(shù)據(jù)倉庫
數(shù)據(jù)倉庫這個概念很多人會跟數(shù)據(jù)庫等同,以為只是說法不同,但其實兩者還是有區(qū)別的。
數(shù)據(jù)庫更多的是面向事務處理的,我們經(jīng)常聽到技術同學提到說什么什么應用或是系統(tǒng),把數(shù)據(jù)寫入數(shù)據(jù)庫或是從數(shù)據(jù)庫讀取,就是因為往往這是直接的業(yè)務邏輯支持。
數(shù)據(jù)庫的表一般會結構復雜,以應對復雜的業(yè)務邏輯,同時存在較少的冗余數(shù)據(jù),且單次對應更少的數(shù)據(jù)(經(jīng)過優(yōu)化),適用更簡單的讀寫查詢,以減少時間,提高業(yè)務響應的速度。
而數(shù)據(jù)倉庫往往是面向數(shù)據(jù)分析的,里面的數(shù)據(jù)已經(jīng)經(jīng)過了一定的清洗和處理,相對結構會簡單一些。但由于經(jīng)過了邏輯對應,因此會存在一定的冗余數(shù)據(jù),不過數(shù)據(jù)倉庫可以支持更復雜的查詢,單次所要處理的數(shù)據(jù)量會更大。
之前看到過一種比喻,感覺挺有說服性的,就是數(shù)據(jù)倉庫就好像我們在宜家一樓看到的那個取貨的倉庫,按照貨品、位置分門別類的放好了。對于顧客來說,這種擺放雖然不太適合逛,但很適合快速找到自己要的產品,也便于宜家工作人員進行管理。
2、數(shù)據(jù)集市
數(shù)據(jù)集市,也是一個容易被人們和數(shù)據(jù)倉庫混淆的概念。
數(shù)據(jù)集市其實在某種程度上算是數(shù)據(jù)倉庫的子集,但是它的主題更集中,是面向某個業(yè)務部門或是某種角色而單獨出來的小型數(shù)據(jù)倉庫。
在這里所有相關的數(shù)據(jù)會被集中在一起,用更符合該業(yè)務或是角色需求的方式進行處理和存儲,這里面的數(shù)據(jù)一般就是來自于數(shù)據(jù)倉庫(當然也可能有部分來自外部,內部再做了整合)。所以可以把數(shù)據(jù)集市簡單理解成展廳,比如書房、臥室,把樓下的貨品用某種主題進行重新組合,便于服務對象(顧客,公司里是業(yè)務方)進行理解和使用。
因此數(shù)據(jù)集市的規(guī)模往往要小于數(shù)據(jù)倉庫,根據(jù)主題需求,可能只放一段時間或是一個方面的數(shù)據(jù)就夠了,并不需要像數(shù)據(jù)倉庫那樣存儲大量數(shù)據(jù)。
- 數(shù)據(jù)湖和數(shù)據(jù)河
上面的概念更偏技術,但數(shù)據(jù)湖和數(shù)據(jù)河,甚至數(shù)據(jù)沼澤好像就更多會出現(xiàn)在各家數(shù)據(jù)產品廠商或是云廠商的宣發(fā)資料里了,讓人覺得高深莫測。
1、數(shù)據(jù)湖
其實數(shù)據(jù)湖和數(shù)據(jù)倉庫都是一種數(shù)據(jù)處理的思路,只是數(shù)據(jù)倉庫更傾向有一定結構化的數(shù)據(jù),而數(shù)據(jù)湖旨在應對現(xiàn)在更加多元化的內容,以及人工學習發(fā)展的需求,因此數(shù)據(jù)湖是一種更加自由的存儲方式。
數(shù)據(jù)湖是依據(jù)被存儲數(shù)據(jù)原始數(shù)據(jù)格式進行的數(shù)據(jù)存儲,目的就是讓任何數(shù)據(jù)可以以最原始的形態(tài)儲存,既可以是結構化也可以是非結構化數(shù)據(jù),基于云的發(fā)展以及大數(shù)據(jù)集群技術的成熟發(fā)展,盡量不丟失任何數(shù)據(jù)細節(jié),這樣就能在后面的業(yè)務變化中拿到所需的數(shù)據(jù)用于機器學習或者數(shù)據(jù)分析。
所以簡單理解,就是隨著技術發(fā)展了,可以不受限制的保存更多數(shù)據(jù)了,而且不需要在一開始存儲時就進行處理,減少在數(shù)據(jù)處理時產生的信息丟失,而是僅在真的開始應用數(shù)據(jù)時再進行處理,隨時可以追溯原始記錄。
2、數(shù)據(jù)河
數(shù)據(jù)河的概念,以我個人來看,更像是一種美好愿望。我們前面提到的所有概念,都是要對數(shù)據(jù)最原始的數(shù)據(jù)源進行清洗、處理才能夠被使用,而這部分的工作量往往占據(jù)了數(shù)據(jù)工作60-70%的資源和精力。
因此就有人提出一種治理思路,讓源頭產生的數(shù)據(jù)基于某些規(guī)則或是方式,使其在源頭就是清晰干凈的(也有種說法叫去ETL化,意思就是業(yè)務邏輯清晰后就像生態(tài)水源一樣,不讓污水流下去,有點像農夫山泉那句廣告詞,“我們只是大自然的搬運工”),而干凈的數(shù)據(jù)通過各個數(shù)據(jù)河道網(wǎng)絡,就可以直接流向各個數(shù)據(jù)消費端。
在筆者看來,數(shù)據(jù)湖是為了應對目前大平臺的復雜度而應運而生的,是可以快速被企業(yè)接受和應用下去的;而數(shù)據(jù)河就像是目前的環(huán)境治理,可望而不可及,任重道遠,就我所接觸和見到的企業(yè),還沒有一個能具備這個能力,就不多展開了。
- DMP和CDP
這兩個概念已經(jīng)隨著數(shù)據(jù)中臺的火熱而被各家極盡宣傳,很多接觸的人只是簡單了解到CDP要比DMP先進,或是說更晚被提出來,但差異在哪里就講不清楚了。
簡單理解,DMP更多的是為了廣告服務的,所以早期都是隨著媒介、廣告、代理公司而一并被提出來的,比如阿里早期的達摩盤。而CDP更多的是貫穿整個業(yè)務的,圍繞著用戶建立一個整體的管理體系,再與各個部門進行結合。
CDP(Customer-Data-Platform)和DMP(Data-Management-Platform)其實都是做數(shù)據(jù)客戶管理,這也是大家對這兩個概念容易弄混的原因。
DMP的概念要更早,在PC時代就已經(jīng)被廣泛提及,基于當時的技術條件,DMP主要利用第三方數(shù)據(jù)作為數(shù)據(jù)源,再并入少量的一方數(shù)據(jù)。 當時對于用戶的識別基本是基于Cookie池的,這也造成了時效性有限,另外DMP的控制往往是放在技術同學手里的,靈活性和應用范圍都有一定限制。
CDP主要使用第一方數(shù)據(jù),同時也可以通過API中間件對接第三方數(shù)據(jù)。CDP使用PII(personallyidentifiable information 個人身份信息,比如微信ID,手機號,手機設備ID)進行用戶的唯一識別,因此具有更加長的時效性,可以做基于用戶生命周期(LTV)的轉化、留存、體驗和溝通的分析。而且CDP往往更加靈活,數(shù)據(jù)都以業(yè)務的視角來進行歸類、分析、整合和應用,因此具有更加廣泛的普適性,可以與多個業(yè)務部門或是角色進行結合。
三、認知層面
介紹了一些更偏技術背景的概念之后,我們也簡單聊聊與應用層面相關的概念。
- 消費者資產
這個概念可能在阿里的數(shù)據(jù)銀行經(jīng)常被提及,但在應用層面,其實是一個很好的方法論:通過把消費者看作資產,借助CDP等工具,把用戶的流轉、變化以及與動作之間的關系更好地分析和沉淀下來,以此來不斷打磨自己的業(yè)務能力。
無論是阿里的AIPL,還是騰訊的引入期、成長期、成熟期、休眠期、流失期,都是真正將用戶看成一個活生生的人進行分析,而不是只追求一個簡單的單點轉化。
因此也會聽到很多公司都在越來越多的提及用戶運營,而且周期也被拉的越來越長,而不是周五上架,周一才開始運作了。
這里作一個更正式的消費者資產解釋,方便大家理解:消費者資產是指企業(yè)所有消費者終身價值折現(xiàn)現(xiàn)值的總和,即消費者的價值不僅僅是當前盈利能力,也包括企業(yè)將從消費者整體生命周期中獲得的貢獻價值總值的折現(xiàn)凈值。
- 數(shù)據(jù)運營
我們一提及數(shù)據(jù)運營,往往都會簡單的理解成用數(shù)據(jù)來進行分析,一切以數(shù)據(jù)說話。但其實數(shù)據(jù)運營也是一個系統(tǒng)工程,是需要企業(yè)統(tǒng)一思路的一套體系。
數(shù)據(jù)運營更核心的其實在于運營數(shù)據(jù),數(shù)據(jù)不光是當前獲取的集合,更多的是基于業(yè)務大目標下各個業(yè)務已有動作和需要有的動作所能產生的數(shù)據(jù)的總和。
舉個簡單的例子,CDP依賴的用戶標識,如果在運營活動中沒有有意識地進行采集, 比如手機號留資,后續(xù)就無從把數(shù)據(jù)做統(tǒng)一,這不僅僅依賴于數(shù)據(jù)部門或是技術部門,更多是針對業(yè)務所需數(shù)據(jù)的共識后的動作統(tǒng)一。
過去我們規(guī)劃營銷體系,或是具體到一個活動的營銷,往往在意的是活動本身的效果,很少考慮該獲得什么數(shù)據(jù)。
但是今天,一個營銷體系,或是一個營銷活動,不能因此獲得到足夠的消費者的數(shù)據(jù),它的價值就折損了一半。甚至夸張點說,這個活動就是為了獲取為達到某個目的的消費者數(shù)據(jù)的,而活動本身的銷售額、效果等只是用來驗證對消費者數(shù)據(jù)應用理解的副產品而已。
只要這個理解始終在線,副產品就會源源不斷的產出了。
以我們常講的SCRM(SocialCRM,社會化客戶關系管理)來說,實際上如果把SCRM只是理解成一個工具或是SAAS系統(tǒng),就偏了。SCRM其實是一個管理工程的概念,里面可能包括工具但不只是工具和產品。
比如有些企業(yè)開了公眾號、做了小程序、有了抖音號,就認為自己變成了SCRM企業(yè),于是就會質疑這東西效果好像也沒什么用嘛,看不到有什么價值,然后再罵罵市場部某個管理公眾號的實習生,就結束了。這種概念顯然是不對的。
其實這里面更重要的概念是,企業(yè)有沒有消費者意識,有沒有社媒的概念,有沒有參與消費者的對話?只有真正理解這層關系,才能讓客戶不斷裂變,產生更多價值。因此企業(yè)要從消費者資產、運營數(shù)據(jù)的整體角度來考慮這些平臺、媒介該怎么使用。
四、結尾
上面我簡單地把目前與數(shù)據(jù)相關的一些概念做了解釋,最后也說兩句對于這部分的個人認知。
現(xiàn)在市面上最多的還是各類產品、工具、云產品的推銷在賣力的灌輸這些概念,但真正與客戶接觸時,往往還是為了售賣產品本身,管實施不管使用;或者雖然有代運營,但策略以及方法論還是依賴客戶自身能力,往往就造成客戶一邊抱怨,一邊廠商又做的苦哈哈的。
當然這種表象的解決并沒有什么良方,真正具備數(shù)據(jù)化思維、能力的企業(yè)和專家也就是最近五年才相對體系化地出現(xiàn)的,而那些中小企業(yè)很難接觸和招聘到這類專家。
更何況,一個好的方案并不是只從技術層面解決了就OK, 還要兼顧業(yè)務部門的長短期目標、部門之間的拉扯、向上向下管理等一系列隱性問題,如果不是自身真的經(jīng)歷過類似的項目,是不可能真的站在客戶角度來給出方案的。
因此我希望在越來越多的企業(yè)重視數(shù)據(jù)化轉型這個大趨勢下,更多的有經(jīng)驗的專家能夠從甲方跳出來,將自己的經(jīng)驗、思路和方法輸出到中小企業(yè)上,幫助大家能夠更好地邁過這道必須邁過的門檻。
—— 如果覺得文章還OK,請轉發(fā) ——
特別提示:關注本專欄,別錯過行業(yè)干貨!
PS:本司承接 小紅書 / 淘寶逛逛 / 抖音 / 百度系 / 知乎 / 微博/大眾點評 等 全網(wǎng)各平臺推廣;
咨詢微信:139 1053 2512 (同電話)
首席增長官CGO薦讀:
更多精彩,關注:增長黑客(GrowthHK.cn)
增長黑客(Growth Hacker)是依靠技術和數(shù)據(jù)來達成各種營銷目標的新型團隊角色。從單線思維者時常忽略的角度和高度,梳理整合產品發(fā)展的因素,實現(xiàn)低成本甚至零成本帶來的有效增長…
本文經(jīng)授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://gptmaths.com/quan/44254.html