大數(shù)據(jù)治理專題詳細(xì)闡述了什么是大數(shù)據(jù)治理、為何要做大數(shù)據(jù)治理,并結(jié)合實際業(yè)務(wù)問題介紹了大數(shù)據(jù)治理統(tǒng)一流程參考模型的實施步驟,以及 IBM 相關(guān)的大數(shù)據(jù)治理的產(chǎn)品介紹。
數(shù)據(jù)治理需要全面的度量值或關(guān)鍵業(yè)務(wù)指標(biāo)(KPI)來衡量和跟蹤數(shù)據(jù)治理計劃的進(jìn)度,考核數(shù)據(jù)治理的效果。定義度量值的步驟如下:
主數(shù)據(jù)(Master Data)是指在整個信息供應(yīng)鏈中各個業(yè)務(wù)系統(tǒng)之間都需要共享的數(shù)據(jù)、業(yè)務(wù)規(guī)則和策略等。常見的主數(shù)據(jù)主要包括與客戶(customers),供應(yīng)商(suppliers),帳戶(accounts)以及組織單位(organizational units)相關(guān)的數(shù)據(jù)。主數(shù)據(jù)管理(Master Data Management,MDM)描述了一組約束(規(guī)程)、方法和技術(shù)解決方案用來保證整個信息供應(yīng)鏈內(nèi)主題域(subject domain)和跨主題域相關(guān)主數(shù)據(jù)的完整一致性。主數(shù)據(jù)管理是應(yīng)用流程的補(bǔ)充,為應(yīng)用提供精確、完整的關(guān)鍵業(yè)務(wù)實體數(shù)據(jù)。
主數(shù)據(jù)管理是構(gòu)建企業(yè)信息單一視圖的重要組成部分,可以保證在整個企業(yè)范圍內(nèi)跨業(yè)務(wù)豎井協(xié)調(diào)和重用主數(shù)據(jù)。主數(shù)據(jù)管理不會創(chuàng)建新的數(shù)據(jù)或新的數(shù)據(jù)縱向結(jié)構(gòu),而是提供一種方法使企業(yè)能夠有效地管理分布在整個信息供應(yīng)鏈中的各種主數(shù)據(jù)(由信息供應(yīng)鏈各業(yè)務(wù)系統(tǒng)產(chǎn)生)。MDM 可以幫助企業(yè)構(gòu)建并維護(hù)貫穿整個信息供應(yīng)鏈的主數(shù)據(jù)單一視圖(Master Data Single View),提供主數(shù)據(jù)的質(zhì)量管理(數(shù)據(jù)治理)和統(tǒng)一業(yè)務(wù)實體定義(元數(shù)據(jù)),簡化并改進(jìn)業(yè)務(wù)流程并提高業(yè)務(wù)響應(yīng)速度。統(tǒng)一完整的元數(shù)據(jù)管理,特別是清晰的主題域劃分、完善的元模型和元元模型有利于更好地管理主數(shù)據(jù)。
主數(shù)據(jù)管理問題的存在,是由企業(yè)業(yè)務(wù)發(fā)展的漸進(jìn)性、IT 技術(shù)發(fā)展的漸進(jìn)性、業(yè)務(wù)系統(tǒng)自下而上而不是自上而下、缺乏統(tǒng)一的數(shù)據(jù)治理和元數(shù)據(jù)管理共同造成的。正是由于這種漸進(jìn)性,各企業(yè)的業(yè)務(wù)系統(tǒng)都大體經(jīng)歷了從無到有,從簡單到復(fù)雜,直到形成了一個個業(yè)務(wù)豎井。從根本上來說,企業(yè)很難只用一個業(yè)務(wù)系統(tǒng)覆蓋所有的業(yè)務(wù),特別是大型跨國公司,同一個業(yè)務(wù)系統(tǒng)也可能會在不同的國家或地區(qū)部署多套,加上企業(yè)信息化建設(shè)缺少統(tǒng)一規(guī)劃,從而造成了需要在各業(yè)務(wù)系統(tǒng)中共享的主數(shù)據(jù)被分散到了各個業(yè)務(wù)系統(tǒng)分別進(jìn)行管理。分散管理的主數(shù)據(jù)由于不具備一致性、準(zhǔn)確性和完整性,使得各個企業(yè)普遍存在著產(chǎn)品、供應(yīng)商和訂單管理不力的現(xiàn)象,解決這一問題的根本方法就是引入主數(shù)據(jù)管理。
在大數(shù)據(jù)時代,通過建立大數(shù)據(jù)與主數(shù)據(jù)之間的映射關(guān)系可以有效地提高客戶關(guān)系管理水平,提高客戶滿意度和忠誠度,提升銷售業(yè)績,比如通過從微博、微信、交友網(wǎng)站以及 Call Center 語音記錄中獲取數(shù)據(jù),進(jìn)行更精確的客戶流失建模,可以有效的提升客戶流失預(yù)測的準(zhǔn)確率,再比如從社交媒體、多媒體、電話語音記錄等多種數(shù)據(jù)源獲取數(shù)據(jù)用于客戶細(xì)分、交叉銷售、提升銷售、客戶維護(hù)挽留、客戶偏好管理等,都可以有效地提升客戶關(guān)系管理水平。
主數(shù)據(jù)監(jiān)管是個持續(xù)的過程,企業(yè)領(lǐng)導(dǎo)者通過主數(shù)據(jù)監(jiān)管管理其主數(shù)據(jù)的質(zhì)量,定義準(zhǔn)則、策略、流程、業(yè)務(wù)規(guī)則以及度量值,從而實現(xiàn)業(yè)務(wù)目標(biāo)。主數(shù)據(jù)監(jiān)管主要包括委派數(shù)據(jù)管理員、管理數(shù)據(jù)質(zhì)量和實施主數(shù)據(jù)管理三部分。
企業(yè)在實施主數(shù)據(jù)管理的過程中,可以參考主數(shù)據(jù)成熟度模型。如圖 2 所示,主數(shù)據(jù)管理大體可以分成 6 個級別:
主數(shù)據(jù)分散于各個業(yè)務(wù)系統(tǒng)中,每個業(yè)務(wù)系統(tǒng)獨(dú)立管理和維護(hù)自己的關(guān)鍵數(shù)據(jù),各系統(tǒng)間不共享這些信息,數(shù)據(jù)是不連通的。
通過手工方式維護(hù)一個邏輯或物理的列表用來共享主數(shù)據(jù),當(dāng)各個系統(tǒng)或用戶需要某些數(shù)據(jù)時可以索取該列表。列表的維護(hù)(增刪改和沖突處理)由各部門工作人員通過一系列討論和會議進(jìn)行處理。相比 L0,雖然各部門依然獨(dú)立維護(hù)各自關(guān)鍵數(shù)據(jù),但已經(jīng)開始使用列表方式維護(hù)一個松散的主數(shù)據(jù)列表,滿足各部門的主數(shù)據(jù)需求。L1 模式下,由于缺乏集中的基于規(guī)則的主數(shù)據(jù)管理,在數(shù)據(jù)量比較小時列表管理的方式是可行的,但當(dāng)數(shù)據(jù)量較大時,數(shù)據(jù)維護(hù)的成本會很高,效率比較低。
通過引入中央存儲庫實現(xiàn)主數(shù)據(jù)的自動存儲管理(中央存儲庫中的數(shù)據(jù)還是按照各個業(yè)務(wù)系統(tǒng)分開存儲的,沒有統(tǒng)一整合在一起)。中央存儲庫此時也被稱為主數(shù)據(jù)主機(jī)(Master Data Host),并通過一個“打包應(yīng)用”(MDM 應(yīng)用程序)對外提供數(shù)據(jù)訪問功能,當(dāng)需要對主數(shù)據(jù)進(jìn)行增刪改時,外部應(yīng)用(請求發(fā)起端)將請求“打包應(yīng)用”更新中央存儲庫中的數(shù)據(jù),并調(diào)用數(shù)據(jù)所有者所在的應(yīng)用(通過接口)來更新對應(yīng)的數(shù)據(jù)。
在 L2 階段,規(guī)則管理、主數(shù)據(jù)質(zhì)量管理和變更管理都需要額外定制,打包應(yīng)用并不提供相應(yīng)功能,外部應(yīng)用需要了解所有數(shù)據(jù)所有者的業(yè)務(wù)邏輯和數(shù)據(jù)結(jié)構(gòu)等。比如當(dāng)某外部應(yīng)用(比如呼叫中心)需要增加一個客戶,該外部應(yīng)用將提交一個事務(wù),請求中央存儲庫添加數(shù)據(jù),并請求數(shù)據(jù)所有者增加一個客戶條目,中央存儲庫添加完數(shù)據(jù)后將通知外部應(yīng)用。在 L1 中,數(shù)據(jù)變更是基于手工模式,在 L2 中數(shù)據(jù)變更會自動完成(需要通過具體技術(shù)實現(xiàn)標(biāo)準(zhǔn)流程)。在 L2 階段,各個外部應(yīng)用需要能夠了解基本的業(yè)務(wù)規(guī)則(元模型)以便訪問主列表并與主列表進(jìn)行交互,并且各個外部應(yīng)用有責(zé)任堅持?jǐn)?shù)據(jù)管理的原則和規(guī)程。
在此階段,中央存儲庫將打破各業(yè)務(wù)部門組織疆界,使用各業(yè)務(wù)系統(tǒng)都能接受的統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)(統(tǒng)一的元模型)建立和維護(hù)主數(shù)據(jù)。主數(shù)據(jù)的統(tǒng)一管理意味著構(gòu)建了一個通用的面向所有業(yè)務(wù)的平臺,此時中央存儲庫作為一個集線器(Hub)從多個業(yè)務(wù)系統(tǒng)整合主題域數(shù)據(jù),使用集中和標(biāo)準(zhǔn)化的方法轉(zhuǎn)換異構(gòu)數(shù)據(jù)。對比 L2,L3 有以下改進(jìn):
在此級別引入了對業(yè)務(wù)規(guī)則、流程和策略的支持,以保證主數(shù)據(jù)的完整性和相關(guān)性。比如醫(yī)院通常會有多個應(yīng)用系統(tǒng)來支持一個病人的護(hù)理,包括入院、房間和床位分配、監(jiān)控設(shè)備、化驗、身體檢查以及其他程序。當(dāng)病人準(zhǔn)備出院時醫(yī)院需要保證與該病人相關(guān)的所有活動和資源都被結(jié)清。這就要求主數(shù)據(jù)集線器不僅要提供病人的詳細(xì)資料和所有基于房間(例如床位、監(jiān)控設(shè)備、護(hù)理活動等)的詳細(xì)信息,還要提供與該病人相關(guān)的診療、化驗、身體檢查和其他程序發(fā)生的費(fèi)用列表。在 L4 階段支持對規(guī)則和策略的擴(kuò)展性支持,集線器以一個靈活可持續(xù)地方式支持任何面向業(yè)務(wù)的規(guī)則集合,例如一個商店經(jīng)理更新一個產(chǎn)品的價格,主數(shù)據(jù)管理系統(tǒng)需要和一個可信系統(tǒng)(例如商品管理系統(tǒng))進(jìn)行協(xié)商以便讓規(guī)則生效。L4 支持規(guī)則集中管理,規(guī)則本身和相關(guān)處理是可以分開的,MDM 集線器需要保證規(guī)則是集中應(yīng)用的,即便這個規(guī)則是在集線器外居住的。
在 L5 階段,主數(shù)據(jù)的管理是高度自動化的,當(dāng)主數(shù)據(jù)記錄詳細(xì)資料被修改后,所有應(yīng)用的相關(guān)數(shù)據(jù)元素都被更新,所有的消費(fèi)應(yīng)用和源系統(tǒng)訪問的都是相同的數(shù)據(jù)實例(之前的級別中,主數(shù)據(jù)是由各系統(tǒng)產(chǎn)生而不是 MDM Hub 產(chǎn)生的),本質(zhì)上構(gòu)成了一個閉環(huán)的 MDM:所有的應(yīng)用系統(tǒng)通過統(tǒng)一管理的主數(shù)據(jù)集成在一起。所有系統(tǒng)看起來都是事實的同一個版本。相比 L4,L5 意味著 MDM 不是在一個應(yīng)用內(nèi)被特殊設(shè)計或編碼的,主數(shù)據(jù)傳播和供應(yīng)不需要源系統(tǒng)專門地開發(fā)或支持。所有應(yīng)用都清楚地知道其并不擁有或控制主數(shù)據(jù),僅僅使用數(shù)據(jù)來支持自己的功能和流程。L5 保證了一個一致的主數(shù)據(jù)主題域,定義“客戶”和其他應(yīng)用接受客戶主數(shù)據(jù)業(yè)務(wù)規(guī)則變化實際上是一回事,移走了主數(shù)據(jù)的最后一個障礙:統(tǒng)一采用數(shù)據(jù)定義、授權(quán)使用和變更傳播。
IBM InfoSphere MDM 是當(dāng)今市場上功能最強(qiáng)大的主數(shù)據(jù)管理(MDM)產(chǎn)品,處理完整范圍的主數(shù)據(jù)管理需求和用例。為了給客戶提供其 MDM 解決方案需求的最佳范圍,提供了以下 4 個 IBM InfoSphere MDM 版本:Collaborative Edition、Standard Edition、Advanced Edition 以及 Enterprise Edition,其中 Enterprise Edition 版本包含了其它三個版本所有的功能。主數(shù)據(jù)管理與各個業(yè)務(wù)系統(tǒng)的關(guān)系與定位如圖 3 所示:
InfoSphere MDM Collaboration Server(MDMCS)在 V10 之前叫做 InfoSphere Master Data Management Server for Product Information Management(MDM Server for PIM),目前最新版本是 V10.1,該產(chǎn)品在 V6.0 之前的版本曾叫 WebSphere Product Center,是從 Trigo Technologies 公司(IBM 2004 年收購)的 Trigo Product Center 衍生而來的。MDMCS 是一個中間件,提供了高度可伸縮的企業(yè)產(chǎn)品信息(PIM)管理解決方案,用于建立企業(yè)內(nèi)部和外部的產(chǎn)品和服務(wù)信息的單個、集成且一致的視圖,幫助企業(yè)縮短銷售時間,提高市場占有率和客戶滿意度,降低成本。通過使用 MDMCS 集中處理和優(yōu)化產(chǎn)品數(shù)據(jù),可以將有關(guān)的唯一內(nèi)容傳遞給需要的業(yè)務(wù)系統(tǒng)、合作伙伴、客戶以及個人,如圖 4 所示,產(chǎn)品具體提供了以下功能:
如圖 5 所示,MDMCS 采用基于組件的體系結(jié)構(gòu),其組件包括:核心組件、集成組件和協(xié)作組件。核心組件主要由 API 層、業(yè)務(wù)對象層、基礎(chǔ)結(jié)構(gòu)層和存儲器層組成,在 API 層可以通過調(diào)用 Java API 擴(kuò)展 Collaboration Server,可以使用搜索 API 在 Collaboration Server 中搜索信息,還可以使用腳本 API 來擴(kuò)展 Collaboration Server 解決方案(在 Collaboration Server V6 之前,腳本 API 是擴(kuò)展解決方案的唯一機(jī)制);在業(yè)務(wù)對象層,可以使用數(shù)據(jù)對象對實例級別對象(可以是一天中執(zhí)行操作最頻繁的對象,如產(chǎn)品、SKU 和工作項等)進(jìn)行建模、使用元數(shù)據(jù)對象為實現(xiàn)的結(jié)構(gòu)(如目錄和層次結(jié)構(gòu)等)建模以及定義數(shù)據(jù)對象的結(jié)構(gòu)(如定義項屬性的規(guī)范)、使用用戶建模對象來捕獲企業(yè)的用戶模型(比如用戶的報告層次結(jié)構(gòu)、角色、用戶、數(shù)據(jù)訪問特權(quán)和權(quán)限等);在基礎(chǔ)結(jié)構(gòu)層,可以使用隊列管理器往 Collaboration Server 外部發(fā)送文檔、使用事件處理器在所有模塊間分派事件、使用管理服務(wù)啟停服務(wù)、使用 RMI 注冊程序協(xié)調(diào) RMI 服務(wù)間通信、使用調(diào)度程序服務(wù)執(zhí)行調(diào)度作業(yè)(比如導(dǎo)入、導(dǎo)出和報告等);在存儲器層,可以使用 Collaborative Edition 存儲庫(PIM 存儲庫)基于一組物理數(shù)據(jù)庫表持久保存業(yè)務(wù)對象,使用文檔存儲器(一組物理數(shù)據(jù)庫表和文件系統(tǒng)位置)存儲擴(kuò)展內(nèi)容和未組織的內(nèi)容如訂閱源文件、報告和導(dǎo)出作業(yè)輸出等。
集成組件主要由門戶網(wǎng)站框架、定制工具、導(dǎo)入/導(dǎo)出和 Web Service 組成,通過門戶網(wǎng)站框架可以將 MDMCS 與 WebSphere Portal Server 集成在一起;通過定制工具可以在 Collaboration Edition 定制用戶界面;可以使用“Web Service”調(diào)用標(biāo)準(zhǔn) Web Service 請求;導(dǎo)入/導(dǎo)出負(fù)責(zé)獲取入局?jǐn)?shù)據(jù)(導(dǎo)入)和生成數(shù)據(jù)(導(dǎo)出)。
協(xié)作組件由工作流引擎、數(shù)據(jù)編寫 UI 和導(dǎo)入/導(dǎo)出組成,工作流引擎主要處理工作流程中捕獲的與業(yè)務(wù)對象相關(guān)的事件;數(shù)據(jù)編寫 UI 提供一組用戶界面屏幕用來與數(shù)據(jù)對象(實例級別業(yè)務(wù)對象)進(jìn)行交互,以指定和豐富為它們提供的數(shù)據(jù)以及設(shè)置它們之間的關(guān)聯(lián);導(dǎo)入/導(dǎo)出負(fù)責(zé)獲取入局?jǐn)?shù)據(jù)(導(dǎo)入)以及生成數(shù)據(jù)(導(dǎo)出)。
InfoSphere MDM Standard Edition(MDMSE)在 V10 之前被稱為 Initiate Master Data Service,是 Initiate 主數(shù)據(jù)管理的產(chǎn)品平臺,Initiate 是一家專注于醫(yī)療衛(wèi)生、政府等行業(yè)主數(shù)據(jù)管理產(chǎn)品和解決方案的軟件公司,2010 年被 IBM 收購,并補(bǔ)充進(jìn) IBM 信息管理產(chǎn)品家族。MDMSE 是業(yè)內(nèi)領(lǐng)先并被廣泛應(yīng)用的 MDM 軟件,幫助政府、醫(yī)療、零售和金融等行業(yè)用戶理解和信任其所擁有的數(shù)據(jù),企業(yè)可以使用該解決方案來獲得完整、實時、準(zhǔn)確的主數(shù)據(jù)視圖。MDMSE 產(chǎn)品以其靈活的數(shù)據(jù)模型,SOA 的標(biāo)準(zhǔn)架構(gòu),無侵略性、松耦合的集成方式,輕量級、易操作、快速實施部署等特點(diǎn)在政府和醫(yī)療領(lǐng)域的使用尤為突出。通過使用 MDMSE 可以快速識別和整合散落的人員、機(jī)構(gòu)信息。MDMSE 提供了針對關(guān)鍵數(shù)據(jù)資產(chǎn)以及這些數(shù)據(jù)相互關(guān)系的單一視圖,幫助企業(yè)快速集成現(xiàn)有同構(gòu)或異構(gòu)數(shù)據(jù)源和應(yīng)用系統(tǒng),對數(shù)據(jù)進(jìn)行統(tǒng)一的轉(zhuǎn)換、清洗、匹配和鏈接等操作清除數(shù)據(jù)的不一致和重復(fù),豐富完善現(xiàn)有數(shù)據(jù),保證數(shù)據(jù)的質(zhì)量和完整性,提供真實可靠的主數(shù)據(jù)。MDMSE 平臺體系結(jié)構(gòu)如圖 6 所示:
針對醫(yī)療衛(wèi)生行業(yè)的病人主索引、居民健康檔案、居民主信息記錄等需求,MDMSE 可以快速形成 360 度視圖,高效、準(zhǔn)確識別和管理來自不同數(shù)據(jù)來源的人員、機(jī)構(gòu)信息,消除重復(fù)和不一致的數(shù)據(jù),解決在異構(gòu)系統(tǒng)當(dāng)中“居民”、“客戶”、“病人”、“員工”、“組織機(jī)構(gòu)”等面臨的信息一致性、完整性和準(zhǔn)確性問題。MDMSE Healthcare 主要包括以下功能:
Initiate Patient Hub: 實現(xiàn)了醫(yī)療衛(wèi)生行業(yè)的病人主索引(Enterprise Master Patient Index,EMPI)解決方案,提供符合行業(yè)標(biāo)準(zhǔn)的病人信息模型并提供靈活的對外服務(wù)接口。
Initiate Provider Hub: 提供針對醫(yī)療衛(wèi)生行業(yè)提供者的主數(shù)據(jù)管理,比如醫(yī)生和醫(yī)療機(jī)構(gòu)等,可以快速的與現(xiàn)有系統(tǒng)和數(shù)據(jù)源集成,準(zhǔn)確匹配并關(guān)聯(lián)不同的提供者,形成單一信息視圖。
Initiate Exchange: 連接各種醫(yī)護(hù)環(huán)境,為服務(wù)點(diǎn)提供隨時獲取信息的便利。
InfoSphere MDM Advance Edition
InfoSphere MDM Advance Edition(MDMAE)在 V10 之前被稱為 InfoSphere MDM Server,主要用來實現(xiàn)和維護(hù)跨企業(yè)的單一版本的真實數(shù)據(jù),消除信息豎井,控制企業(yè)內(nèi)最重要最需要共享的信息資產(chǎn)。MDMAE 主要用于管理客戶主數(shù)據(jù),也可以管理合約和產(chǎn)品等,具體來說可以實現(xiàn)企業(yè)內(nèi)重要的主數(shù)據(jù)實體,如客戶、產(chǎn)品、供應(yīng)商、員工、潛在客戶、代理商、項目、產(chǎn)品捆綁、部件和協(xié)議等管理,實現(xiàn)主數(shù)據(jù)實體的單一視圖,幫助用戶減少信息錯誤,消除重復(fù)數(shù)據(jù),提高企業(yè)運(yùn)營效率。MDMAE 產(chǎn)品部署靈活迅速,其匹配和關(guān)聯(lián)能力業(yè)內(nèi)領(lǐng)先,并具有全面管控功能,可以滿足行業(yè)內(nèi)和行業(yè)間廣泛的業(yè)務(wù)需求。企業(yè)可以使用該產(chǎn)品內(nèi)嵌的智能和對數(shù)據(jù)的洞察力,提升銷售能力,改進(jìn)市場推廣效果并提高財務(wù)運(yùn)營能力。MDMAE 作為一個完整的主數(shù)據(jù)管理方案,可以幫助企業(yè)完成客戶整合、客戶管理、客戶流程優(yōu)化、以客戶為中心的轉(zhuǎn)型等短、中、遠(yuǎn)期業(yè)務(wù)目標(biāo)。
MDMAE 是一個企業(yè)級應(yīng)用,為參與人(Party)、產(chǎn)品(product)、賬戶(account)和位置(location)提供事實的單一版本,提供多渠道管理的環(huán)境,通過統(tǒng)一前后臺系統(tǒng)提供客戶信息的單一版本。Party 可以反映任何合法的實體,無論是個體還是組織;Product 既包括物理存在的貨物,也可以是任何服務(wù);Account 包括期限和條件,以及相關(guān)的各種關(guān)系;Location 既可以獨(dú)立存在,也常常與其他主數(shù)據(jù)域共存;主數(shù)據(jù)管理需要關(guān)注的不僅僅是這些域,還包括它們之間的各種關(guān)系。MDMAE 使用基于組件的可擴(kuò)展標(biāo)記語言(XML)、J2EE 平臺和 EJB 架構(gòu),以便快速和其他系統(tǒng)集成,并提供充分的靈活性和擴(kuò)展性。如圖 7 所示,面向服務(wù)體系架構(gòu) MDMAE 集成了強(qiáng)大功能,提供業(yè)務(wù)服務(wù)、通用服務(wù)、管理服務(wù)、業(yè)務(wù)邏輯與規(guī)則和擴(kuò)展服務(wù)等。通過強(qiáng)大的數(shù)據(jù)管理功能用戶可以建立可信信息,提供預(yù)先構(gòu)建的數(shù)據(jù)集成和數(shù)據(jù)質(zhì)量控制;通過業(yè)務(wù)服務(wù)組件,使用預(yù)先構(gòu)建以及定制的業(yè)務(wù)服務(wù)與所有消費(fèi)主數(shù)據(jù)的應(yīng)用和業(yè)務(wù)流程交互,從不同領(lǐng)域(domains)集成數(shù)據(jù);所有業(yè)務(wù)模型擁有一個相似的結(jié)構(gòu),包括控制器組件和相關(guān)的業(yè)務(wù)組件等;所有持久性事務(wù)(那些修改數(shù)據(jù)的事務(wù))都由事務(wù)控制器處理,而所有的讀取和搜索則由查找控制器(finder controller)處理。MDMAE 使用可擴(kuò)展的數(shù)據(jù)模型支持多領(lǐng)域比如:Party、Product、Account 和 Location 等;用戶可以自己創(chuàng)建定制領(lǐng)域,MDMAE 使用強(qiáng)約束建立和維護(hù)領(lǐng)域之間的關(guān)系。
本文詳細(xì)介紹了大數(shù)據(jù)治理統(tǒng)一流程參考模型的第十步“定義度量值”、第十一步“主數(shù)據(jù)監(jiān)管”,以及 IBM 在主數(shù)據(jù)管理方面的產(chǎn)品介紹,如 InfoSphere MDM Collaboration Server、InfoSphere MDM Standard Edition 和 InfoSphere MDM Advance Edition 等。在本系列文章的下一部分中將重點(diǎn)介紹大數(shù)據(jù)治理統(tǒng)一流程參考模型第十二步“(狹義)大數(shù)據(jù)監(jiān)管”、第十三步“信息單一視圖監(jiān)管”、IBM 大數(shù)據(jù)產(chǎn)品 BigInsights 和 Streams 以及 IBM 大數(shù)據(jù)治理方面的產(chǎn)品 InfoSphere DataStage、InfoSphere QualityStage 等。
聯(lián)系客服