談?wù)剶?shù)據(jù)治理:怎么做元數(shù)據(jù)管理?

5 評論 26860 瀏覽 78 收藏 6 分鐘

上一篇文章《談?wù)剶?shù)據(jù)治理是什么?》中,筆者有大概的介紹了下數(shù)據(jù)治理是什么,整體包含了哪些方面。接來下將詳細(xì)介紹下數(shù)據(jù)治理每個(gè)模塊的內(nèi)容,以及怎么做。

本篇文章主要是談下元數(shù)據(jù)管理,對于元數(shù)據(jù)的一些概念我再簡單地介紹下:

  • 元數(shù)據(jù)是什么——簡單的來說:它是數(shù)據(jù)的數(shù)據(jù)。
  • 元數(shù)據(jù)的分類——技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)、管理元數(shù)據(jù)、
  • 元數(shù)據(jù)管理是什么——它是對元數(shù)據(jù)的創(chuàng)建、存儲、整合、控制的一整套流程,能夠支持基于元數(shù)據(jù)的相關(guān)需求和應(yīng)用。
  • 那元數(shù)據(jù)管理的好處是什么——它能夠讓開發(fā)和業(yè)務(wù)人員快速的了解數(shù)據(jù)的上下游關(guān)系及本身的含義,精準(zhǔn)定位需要查找的數(shù)據(jù),減少數(shù)據(jù)研究的時(shí)間成本,提高效率。

那在項(xiàng)目中元數(shù)據(jù)管理該怎么做呢?

01 元數(shù)據(jù)范圍

首先確定元數(shù)據(jù)來源范圍,在實(shí)際的工作中,不是所有數(shù)據(jù)都是要做元數(shù)據(jù)管理,通常我們會選擇業(yè)務(wù)數(shù)據(jù)做元數(shù)據(jù)管理,非業(yè)務(wù)數(shù)據(jù)(例如:備份數(shù)據(jù)、系統(tǒng)日志等)是不會納入管理范圍內(nèi),主要還是因?yàn)樵獢?shù)據(jù)管理是提供業(yè)務(wù)和開發(fā)人員快速掌握業(yè)務(wù)數(shù)據(jù)。

確定規(guī)則后,就要結(jié)合公司的實(shí)際情況去梳理出哪些業(yè)務(wù)系統(tǒng)、哪些數(shù)據(jù)庫、哪些數(shù)據(jù)庫用戶、哪些表需要做元數(shù)據(jù)管理。當(dāng)然也可以支持非結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)抽取,例如:word、pdf等。

02 元數(shù)據(jù)接入

元數(shù)據(jù)從哪接入,一般都是從源系統(tǒng)接入,假如公司已經(jīng)存在數(shù)倉或者實(shí)時(shí)性要求不高,為了節(jié)約開發(fā)工作量,對于已有的元數(shù)據(jù)會從數(shù)倉接入,還未接入的會從源系統(tǒng)進(jìn)行接入。

但這種方案也是存在風(fēng)險(xiǎn),假如數(shù)倉的數(shù)據(jù)和源系統(tǒng)出現(xiàn)不一致,就會導(dǎo)致元數(shù)據(jù)出錯(cuò)?,F(xiàn)在大部分的元數(shù)據(jù)抽取都是采用配置自動(dòng)化的方式進(jìn)行。

03 元數(shù)據(jù)標(biāo)準(zhǔn)

在梳理的過程中可能會出現(xiàn)有些數(shù)據(jù)庫或者有些數(shù)據(jù)定義不規(guī)范的情況,導(dǎo)致元數(shù)據(jù)管理無法進(jìn)行下去。那接下來需要建立元數(shù)據(jù)的管理規(guī)范,去反推前端的源數(shù)據(jù)進(jìn)行整改,主要是保證元數(shù)據(jù)的完整性和一致性。

針對不同的類型的公司要求,元數(shù)據(jù)會開放給不同的人群,所以要對元數(shù)據(jù)進(jìn)行權(quán)限管理,規(guī)范里面就需定義權(quán)限的管理流程:元數(shù)據(jù)的權(quán)限分層、元數(shù)據(jù)權(quán)限申請流程、元數(shù)據(jù)的發(fā)布流程、元數(shù)據(jù)的審核流程。

我的公司將元數(shù)據(jù)分為業(yè)務(wù)和技術(shù)兩個(gè)管理屬性,技術(shù)人員可以查看全域元數(shù)據(jù),業(yè)務(wù)人員只能查看自己所對應(yīng)業(yè)務(wù)流程的元數(shù)據(jù),如要查看其他業(yè)務(wù)流程的元數(shù)據(jù),需進(jìn)行申請,申請流程要過元數(shù)據(jù)對應(yīng)的業(yè)務(wù)和技術(shù)屬主。

04 元數(shù)據(jù)維護(hù)

元數(shù)據(jù)維護(hù)主要是對已經(jīng)發(fā)布的元數(shù)據(jù)進(jìn)行維護(hù)管理,已經(jīng)發(fā)布上線的元數(shù)據(jù),如需調(diào)整、優(yōu)化則必須重新走元數(shù)據(jù)發(fā)布流程,不準(zhǔn)許對元數(shù)據(jù)進(jìn)行直接修改。為了安全,元數(shù)據(jù)所有操作行為都要記錄到元數(shù)據(jù)操作日志里面。

可以對元數(shù)據(jù)創(chuàng)建目錄將不同的元數(shù)據(jù)掛在對應(yīng)的目錄下,按照業(yè)務(wù)流程、業(yè)務(wù)主題域、開發(fā)流程設(shè)計(jì)對應(yīng)的目錄,主要還是根據(jù)公司要求設(shè)計(jì)。

05 元數(shù)據(jù)查找、分析、報(bào)告

有單獨(dú)的頁面支持元數(shù)據(jù)的模糊或精準(zhǔn)快速查找,通過輸入關(guān)鍵信息查找對應(yīng)的元數(shù)據(jù)。我所在的公司將元數(shù)據(jù)作為數(shù)據(jù)資產(chǎn)的一類,因此我們需要產(chǎn)出元數(shù)據(jù)資產(chǎn)報(bào)告,從報(bào)告中能夠快速的了解元數(shù)據(jù)訪問熱度、數(shù)據(jù)價(jià)值、數(shù)據(jù)成本、數(shù)據(jù)分布等相關(guān)信息。

分析這塊上一篇文章就有提到,主要是血緣分析,做血緣分析的兩種方法。血緣分析對做關(guān)聯(lián)影響分析很重要,尤其是剛進(jìn)來的開發(fā)或者業(yè)務(wù)不了解數(shù)據(jù),通過血緣分析能夠快速的定位、分析數(shù)據(jù)。

 

本文由 @木子姐 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. mark

    來自北京 回復(fù)
  2. 有具體的例子,來說明一下元數(shù)據(jù)嗎?
    現(xiàn)在知道元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),也了解元數(shù)據(jù)是需要管理的,那元數(shù)據(jù)具體起什么樣的作用?
    元數(shù)據(jù)在具體的數(shù)據(jù)分析中起什么作用?

    來自廣東 回復(fù)
  3. 大家期待已久的《數(shù)據(jù)產(chǎn)品經(jīng)理實(shí)戰(zhàn)訓(xùn)練營》終于在起點(diǎn)學(xué)院(人人都是產(chǎn)品經(jīng)理旗下教育機(jī)構(gòu))上線啦!經(jīng)過迭代優(yōu)化,現(xiàn)在已經(jīng)第7期開啟報(bào)名啦
    本課程非常適合新手?jǐn)?shù)據(jù)產(chǎn)品經(jīng)理,或者想要轉(zhuǎn)崗的產(chǎn)品經(jīng)理、數(shù)據(jù)分析師、研發(fā)、產(chǎn)品運(yùn)營等人群。
    課程會從基礎(chǔ)概念,到核心技能,再通過典型數(shù)據(jù)分析平臺的實(shí)戰(zhàn),幫助大家構(gòu)建完整的知識體系,掌握數(shù)據(jù)產(chǎn)品經(jīng)理的基本功。
    學(xué)完后你會掌握怎么建指標(biāo)體系、指標(biāo)字典,如何設(shè)計(jì)數(shù)據(jù)埋點(diǎn)、保證數(shù)據(jù)質(zhì)量,規(guī)劃大數(shù)據(jù)分析平臺等實(shí)際工作技能~
    現(xiàn)在就添加空空老師(微信id:anne012520),咨詢課程詳情并領(lǐng)取福利優(yōu)惠吧!

    來自廣東 回復(fù)
  4. 有點(diǎn)概括啊,有沒有詳細(xì)一點(diǎn)的說明。 ?

    來自浙江 回復(fù)
    1. 應(yīng)你的要求,我整理一篇詳細(xì)點(diǎn)的 ??

      來自上海 回復(fù)