數(shù)據(jù)中臺是什么
數(shù)據(jù)中臺是指通過數(shù)據(jù)技術,對海量數(shù)據(jù)進行采集、計算、存儲、加工,同時統(tǒng)一標準和口徑。數(shù)據(jù)中臺把數(shù)據(jù)統(tǒng)一之后,會形成標準數(shù)據(jù),再進行存儲,形成大數(shù)據(jù)資產(chǎn)層,進而為客戶提供高效服務。這些服務跟企業(yè)的業(yè)務有較強的關聯(lián)性,是這個企業(yè)獨有的且能復用的,它是企業(yè)業(yè)務和數(shù)據(jù)的沉淀,其不僅能降低重復建設、減少煙囪式協(xié)作的成本,也是差異化競爭優(yōu)勢所在。
廣義的數(shù)據(jù)中臺包括了數(shù)據(jù)技術,比如對海量數(shù)據(jù)進行采集、計算、存儲、加工的一系列技術集合,今天談到的數(shù)據(jù)中臺包括數(shù)據(jù)模型,算法服務,數(shù)據(jù)產(chǎn)品,數(shù)據(jù)管理等等,和企業(yè)的業(yè)務有較強的關聯(lián)性,是企業(yè)獨有的且能復用的,比如企業(yè)自建的2000個基礎模型,300個融合模型,5萬個標簽。它是企業(yè)業(yè)務和數(shù)據(jù)的沉淀,其不僅能降低重復建設,減少煙囪式協(xié)作的成本,也是差異化競爭優(yōu)勢所在。
建立數(shù)據(jù)中臺的原因
數(shù)據(jù)中臺和業(yè)務中臺相比,面臨的情況可能會更加復雜一點。建立數(shù)據(jù)中臺的原因:
大數(shù)據(jù)可以告訴決策者一些潛在的規(guī)律,以數(shù)據(jù)來證明或判斷決策。以往我們會用數(shù)據(jù)來證明我們的決策對錯,現(xiàn)在我們用數(shù)據(jù)來引導我們做出對的決策。在大數(shù)據(jù)時代,樣本就是全體,大數(shù)據(jù)可以防止偽造和偏差。
數(shù)據(jù)催生人工智能。數(shù)據(jù)是人工智能的根基,并且可以進行融合形成新的數(shù)據(jù)。數(shù)據(jù)給我們無限的創(chuàng)新,讓我們不停去嘗試。
數(shù)據(jù)是機器人的指令,我們形成數(shù)據(jù)服務思維。數(shù)據(jù)是不斷變化的,讓機器智能成為決策環(huán)節(jié),運營就可以智能化。
中臺的目標是提升效能、數(shù)據(jù)化運營、更好支持業(yè)務發(fā)展和創(chuàng)新,是多領域、多BU、多系統(tǒng)的負責協(xié)同。中臺是平臺化的自然演進,這種演進帶來“去中心化“的組織模式,突出對能力復用、協(xié)調(diào)控制的能力,以及業(yè)務創(chuàng)新的差異化構建能力。為什么數(shù)據(jù)中臺如此重要呢,大致有以下四個原因:
1、回歸服務的本質(zhì)-數(shù)據(jù)重用
浙江移動已經(jīng)將2000個基礎模型作為所有數(shù)據(jù)服務開發(fā)的基礎,這些基礎模型做到了“書同文,車同軌”,無論應用的 數(shù)據(jù)模型有多復雜,總是能溯源到2000張基礎表,這奠定了數(shù)據(jù)核對和認知的基礎,最大程度的避免了“重復數(shù)據(jù)抽取和維護帶來的成本浪費?!?/span>
曾經(jīng)企業(yè)的數(shù)據(jù)抽取就有多份,報表一份,數(shù)據(jù)倉庫一份,地市集市一份,無論是抽取壓力、維護難度及數(shù)據(jù)一致性要求都很高。同時,統(tǒng)一的基礎模型將相關業(yè)務領域的數(shù)據(jù)做了很好的匯聚,解決了數(shù)據(jù)互通的訴求,這點的意義巨大,誰都知道數(shù)據(jù)1+1>2的意思。
2、數(shù)據(jù)中臺需要不斷的業(yè)務滋養(yǎng)
在企業(yè)內(nèi),無論是專題、報表或取數(shù),當前基本是煙囪式數(shù)據(jù)生產(chǎn)模式或者是項目制建設方式,必然導致數(shù)據(jù)知識得不到沉淀和持續(xù)發(fā)展,從而造成模型不能真正成為可重用的組件,無法支撐數(shù)據(jù)分析的快速響應和創(chuàng)新。其實,業(yè)務最不需要的就是模型的穩(wěn)定,一個數(shù)據(jù)模型如果一味追求穩(wěn)定不變,一定程度就是故步自封,這樣的做法必然導致其他的新的類似的數(shù)據(jù)模型產(chǎn)生。
數(shù)據(jù)模型不需要“穩(wěn)定”,而需要不斷的滋養(yǎng),只有在滋養(yǎng)中才能從最初的字段單一到逐漸成長為企業(yè)最為寶貴的模型資產(chǎn)。
以報表為例,企業(yè)報表成千上萬的原因往往也是沒有沉淀造成的,針對一個業(yè)務報表,由于不同的業(yè)務人員提出的角度不同,會幻化出成百上千的報表,如果有報表中臺的概念,就可以提出一些基準報表的原則,比如一個業(yè)務一張報表,已經(jīng)有的業(yè)務報表只允許修改而不允許新增,自然老報表就會由于新的需求而不斷完善,從而能演化成企業(yè)的基礎報表目錄,否則就是一堆報表的堆砌,后續(xù)的數(shù)據(jù)一致性問題層出不窮,管理成本急劇增加,人力投入越來越多,這樣的事情在每個企業(yè)都在發(fā)生。
3、數(shù)據(jù)中臺是培育業(yè)務創(chuàng)新的土壤
企業(yè)的數(shù)據(jù)創(chuàng)新一定要站在巨人的肩膀上,即從數(shù)據(jù)中臺開始,不能總是從基礎做起,數(shù)據(jù)中臺是數(shù)據(jù)創(chuàng)新效率的保障。研究過機器學習的都知道,沒有好的規(guī)整數(shù)據(jù),數(shù)據(jù)準備的過程極其冗長,這也是數(shù)據(jù)倉庫模型的一個核心價值所在,比如運營商中要獲取3個月的ARPU數(shù)據(jù),如果沒有融合模型的支撐,得自己從賬單一層層匯總及關聯(lián),速度可想而知。
在如今的互聯(lián)網(wǎng)時代,企業(yè)都在全力謀求轉(zhuǎn)型,轉(zhuǎn)型的關鍵是要具備跟互聯(lián)網(wǎng)公司一樣的快速創(chuàng)新能力,大數(shù)據(jù)是其中一個核心驅(qū)動力,但擁有大數(shù)據(jù)還是不夠的,數(shù)據(jù)中臺的能力往往最終決定速度,擁有速度意味著試錯成本很低,意味著可以再來一次。
4、數(shù)據(jù)中臺是人才成長的搖籃
原來新員工入職要獲得成長,一是靠人帶,二是找人問,三是自己登陸各種系統(tǒng)去看源代碼,這樣的學習比較支離破碎,其實很難了解全貌,無法知道什么東西對于企業(yè)是最重要的,獲得的文檔資料也往往也是過了時的。
現(xiàn)在有了數(shù)據(jù)中臺,很多成長問題就能解決,有了基礎模型,新人可以系統(tǒng)的學習企業(yè)有哪些基本數(shù)據(jù)能力,O域數(shù)據(jù)的增加更是讓其有更廣闊的視野,有了融合模型,新人可以知道有哪些主題域,從主題域切入去全局的理解公司的業(yè)務概念,有了標簽庫,新人可以獲得前人的所有智慧結晶,有了數(shù)據(jù)管理平臺,新人能清晰的追溯數(shù)據(jù)、標簽和應用的來龍去脈,所有的知識都是在線的,最新的,意味著新人的高起點。
更為關鍵的是,數(shù)據(jù)中臺讓新人擺脫了在起步階段對于導師的過渡依賴,能快速的融入團隊,在前人的基礎上進行創(chuàng)新。數(shù)據(jù)中臺天然的統(tǒng)一,集成的特性,有可能讓新人打破點線的束縛,快速構筑起自己的知識體系,成為企業(yè)數(shù)據(jù)領域的專家。