大模型時(shí)代,數(shù)據(jù)中臺(tái)現(xiàn)在過氣了嗎?

2 評(píng)論 1764 瀏覽 4 收藏 9 分鐘

最近兩年,好像沒什么公司說“中臺(tái)”這種概念了。甚至有人說中臺(tái)已經(jīng)不行了。實(shí)際情況是這樣嗎?其實(shí)并不是。

一、數(shù)據(jù)中臺(tái)的概念有沒有過時(shí)

2019年中臺(tái)火爆之后,大廠紛紛建設(shè)中臺(tái),一些數(shù)據(jù)服務(wù)公司甚至專門推出數(shù)據(jù)中臺(tái)相關(guān)的產(chǎn)品;后來<XX拆中臺(tái)了>的文章開始甚囂塵上,中臺(tái)的熱度逐漸散去。但是數(shù)據(jù)中臺(tái)是真的不需要了嘛?

數(shù)據(jù)中臺(tái)的核心思想是數(shù)據(jù)輸出能力的組件化、服務(wù)化,從而提升數(shù)據(jù)從采集到賦能業(yè)務(wù)應(yīng)用的效率。在經(jīng)濟(jì)環(huán)境不景氣的情況下尤其重要。只是需要平衡業(yè)務(wù)應(yīng)用產(chǎn)出的價(jià)值和中臺(tái)能力建設(shè)的成本的ROI。AIGC、生成式AI應(yīng)用也需要依賴于完善的數(shù)據(jù)資產(chǎn)和中臺(tái)化數(shù)據(jù)能力,否則每個(gè)GENAI的業(yè)務(wù)場(chǎng)景的定制化,成本必然很高且難以快速復(fù)制。

數(shù)據(jù)中臺(tái)的核心思想是將所有的數(shù)據(jù)資源和服務(wù)整合到一個(gè)統(tǒng)一的平臺(tái)上,實(shí)現(xiàn)數(shù)據(jù)的集中管理和服務(wù)。這主要是為了解決企業(yè)數(shù)據(jù)管理中存在的“存”、“通”、“生”的難題,即連接數(shù)據(jù)孤島,讓一切業(yè)務(wù)數(shù)據(jù)化,讓一切數(shù)據(jù)業(yè)務(wù)化。

通過將企業(yè)的數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)資產(chǎn),數(shù)據(jù)中臺(tái)可以提高數(shù)據(jù)研發(fā)效率、數(shù)據(jù)發(fā)現(xiàn)效率和數(shù)據(jù)分析效率,并解決數(shù)據(jù)質(zhì)量問題,包括數(shù)倉設(shè)計(jì)的質(zhì)量、指標(biāo)的一致性和數(shù)據(jù)研發(fā)的質(zhì)量等。

數(shù)據(jù)中臺(tái)需要解決以下問題:

  • 數(shù)據(jù)孤島問題:企業(yè)中不同的部門或系統(tǒng)可能擁有各自的數(shù)據(jù)資源,形成數(shù)據(jù)孤島。數(shù)據(jù)中臺(tái)通過集中管理和整合這些數(shù)據(jù)資源,實(shí)現(xiàn)數(shù)據(jù)的共享和互通,打破了數(shù)據(jù)孤島,提高了數(shù)據(jù)的利用價(jià)值。
  • 數(shù)據(jù)效率問題:在數(shù)據(jù)研發(fā)、數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)分析過程中,由于缺乏統(tǒng)一的數(shù)據(jù)平臺(tái),往往導(dǎo)致效率低下。數(shù)據(jù)中臺(tái)通過提供統(tǒng)一的數(shù)據(jù)接口和服務(wù),簡(jiǎn)化了數(shù)據(jù)獲取和處理的流程,提高了工作效率。
  • 數(shù)據(jù)質(zhì)量問題:由于數(shù)據(jù)來源多樣、格式不統(tǒng)一,數(shù)據(jù)質(zhì)量往往難以保證。數(shù)據(jù)中臺(tái)通過數(shù)據(jù)清洗、整合和標(biāo)準(zhǔn)化處理,提高了數(shù)據(jù)的一致性、準(zhǔn)確性、及時(shí)性和完整性,從而保證了數(shù)據(jù)的質(zhì)量。

二、數(shù)據(jù)中臺(tái)一般架構(gòu)

數(shù)據(jù)中臺(tái)的目標(biāo)是:效率,成本,復(fù)用,業(yè)務(wù)數(shù)據(jù)化,數(shù)據(jù)資產(chǎn)化,資產(chǎn)業(yè)務(wù)化。

降低業(yè)務(wù)創(chuàng)新過程所需數(shù)據(jù)的獲取和使用成本,數(shù)據(jù)分析和大數(shù)據(jù)人工智能應(yīng)用更便捷。

很多文章里會(huì)講,數(shù)據(jù)中臺(tái)的輸出是API,API即服務(wù)嘛,但一個(gè)API要更加快速高效的輸出,要依賴于數(shù)據(jù)同步、數(shù)據(jù)清洗加工、資產(chǎn)沉淀等各個(gè)流轉(zhuǎn)環(huán)節(jié),木桶效應(yīng),任何一個(gè)部分出現(xiàn)短板,整體的效率都不會(huì)高。

因此,我把數(shù)據(jù)中臺(tái)的產(chǎn)品架構(gòu)分為五層:

  1. 數(shù)據(jù)服務(wù)層:基于數(shù)據(jù)資產(chǎn)、平臺(tái)工具輸出的分析服務(wù)、數(shù)據(jù)查詢服務(wù),可視化服務(wù)、標(biāo)簽、算法服務(wù)等
  2. 數(shù)據(jù)資產(chǎn)層:包括數(shù)倉模型資產(chǎn)建設(shè)、數(shù)據(jù)治理、資產(chǎn)盤點(diǎn)
  3. 數(shù)據(jù)加工層:基于業(yè)務(wù)邏輯進(jìn)行ETL的過程,包括批、流數(shù)據(jù)的開發(fā)、調(diào)度、搬運(yùn)、運(yùn)維
  4. 數(shù)據(jù)集成層:數(shù)據(jù)入湖第一步,把不同數(shù)據(jù)源數(shù)據(jù)同步到統(tǒng)一的數(shù)據(jù)倉庫或數(shù)據(jù)湖
  5. 基礎(chǔ)設(shè)施層:最底層是大數(shù)據(jù)集群服務(wù),包括存儲(chǔ)、計(jì)算、資源調(diào)度和Hadoop生態(tài)的各個(gè)組件管理

三、數(shù)據(jù)中臺(tái)包含數(shù)據(jù)產(chǎn)品簡(jiǎn)介

1.數(shù)據(jù)采集

定位:提供企業(yè)內(nèi)、外部數(shù)據(jù)采集解決方案,為大數(shù)據(jù)分析應(yīng)用提高原始數(shù)據(jù)支持,是企業(yè)的“數(shù)據(jù)原油”,沒有數(shù)據(jù),大數(shù)據(jù)就是無源之水。

產(chǎn)品模塊:埋點(diǎn)解決方案&埋點(diǎn)管理平臺(tái)、爬蟲系統(tǒng)、數(shù)據(jù)填報(bào)系統(tǒng)

2.組件管理

定位:大數(shù)據(jù)組件管理平臺(tái),以配置化的流程替代人肉命令行操作、運(yùn)維大數(shù)據(jù)集群及各個(gè)組件。

產(chǎn)品模塊:云平臺(tái)、HDFS管理、Kafka管理、Hbase管理、ES管理

3.開發(fā)套件

定位:產(chǎn)品化、自動(dòng)化數(shù)據(jù)采集、同步、加工到應(yīng)用流程,提升數(shù)據(jù)開發(fā)效率,降低開發(fā)成本,縮短業(yè)務(wù)創(chuàng)新數(shù)據(jù)需求周期。

產(chǎn)品模塊:數(shù)據(jù)集成、離線開發(fā)平臺(tái)、實(shí)時(shí)開發(fā)平臺(tái)、智能運(yùn)維平臺(tái)、機(jī)器學(xué)習(xí)平臺(tái)

4.數(shù)據(jù)資產(chǎn)

定位:沉淀數(shù)據(jù)資產(chǎn),公開資產(chǎn)目錄,助力數(shù)據(jù)共享,并依制定數(shù)據(jù)稽核規(guī)則監(jiān)控?cái)?shù)據(jù)質(zhì)量,從源頭保證數(shù)據(jù)準(zhǔn)確高可用,統(tǒng)一權(quán)限管控,保證數(shù)據(jù)安全。

產(chǎn)品模塊:數(shù)據(jù)地圖、數(shù)據(jù)血緣、指標(biāo)系統(tǒng)、數(shù)據(jù)質(zhì)量監(jiān)控、模型建設(shè)平臺(tái)、資產(chǎn)管理中心

5.數(shù)據(jù)治理

定位:治理低效或無價(jià)值的數(shù)據(jù)及任務(wù),釋放存儲(chǔ)&計(jì)算資源,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)成本的精細(xì)化管理。

產(chǎn)品模塊:成本優(yōu)化中心、數(shù)據(jù)安全中心

6.分析應(yīng)用

定位:聚合和治理跨域數(shù)據(jù)以產(chǎn)品化形式封裝數(shù)據(jù)能力,將數(shù)據(jù)應(yīng)用于業(yè)務(wù)決策、產(chǎn)品優(yōu)化、精細(xì)化運(yùn)營(yíng)等環(huán)節(jié),挖掘數(shù)據(jù)價(jià)值,賦能業(yè)務(wù)。

產(chǎn)品模塊:

數(shù)據(jù)分析:Adhoc查詢、用戶行為分析系統(tǒng)、自助分析、敏捷BI、數(shù)據(jù)可視化平臺(tái)、智能分析平臺(tái)

產(chǎn)品智能:個(gè)性化推薦、用戶畫像與精準(zhǔn)營(yíng)銷平臺(tái)

7.數(shù)據(jù)服務(wù)

定位:基于數(shù)據(jù)中臺(tái)思想,將數(shù)據(jù)快速輸出API服務(wù),同時(shí)具備服務(wù)監(jiān)控及管理能力

產(chǎn)品模塊:API服務(wù)平臺(tái)、推薦平臺(tái)、智能預(yù)警&數(shù)據(jù)訂閱(從人找數(shù)到數(shù)找人)

8.通用功能

定位:抽象各數(shù)據(jù)產(chǎn)品通用模塊,提供統(tǒng)一服務(wù)能力,減少各產(chǎn)品重復(fù)建設(shè),降低開發(fā)成本

產(chǎn)品模塊:工單系統(tǒng)、消息中心、幫助中心、統(tǒng)一權(quán)限、產(chǎn)品導(dǎo)航、需求中心

四、小結(jié)

對(duì)于數(shù)據(jù)中臺(tái)產(chǎn)品,各家公司都在做很多相似的事情,作為數(shù)據(jù)產(chǎn)品經(jīng)理的你,當(dāng)前在從事哪一產(chǎn)品領(lǐng)域的工作呢?未來職業(yè)發(fā)展規(guī)劃又想哪一模塊的產(chǎn)品工作呢?

在此明確回答一下一些同學(xué)的疑惑,<AI時(shí)代是不是數(shù)據(jù)產(chǎn)品是不是應(yīng)該轉(zhuǎn)型做AI產(chǎn)品經(jīng)理?>,答案是:AI應(yīng)用是數(shù)據(jù)核心價(jià)值體現(xiàn)的方式之一,但是想要AI應(yīng)用更高效,低成本,企業(yè)需要持續(xù)完善基礎(chǔ)的數(shù)據(jù)產(chǎn)品的中臺(tái)化基建能力。

本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)據(jù)干飯人】,微信公眾號(hào):【數(shù)據(jù)干飯人】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 拋開業(yè)務(wù)談架構(gòu),都是耍流氓

    來自江蘇 回復(fù)
  2. 文章有一些標(biāo)題黨,并沒有深入討論“數(shù)據(jù)中臺(tái)過氣”這一問題

    來自北京 回復(fù)