12月1日下午,由上海大數(shù)據(jù)聯(lián)盟、數(shù)據(jù)猿主辦的第20期魔方大數(shù)據(jù)在上海寶華萬(wàn)豪酒店成功舉辦。本期魔方大數(shù)據(jù)以“政務(wù)大數(shù)據(jù)”為主題,邀請(qǐng)了技術(shù)方和產(chǎn)業(yè)方大咖共聚一堂,共同探討了政務(wù)大數(shù)據(jù)落地實(shí)施的有效路徑
作者 | 夏佳斌
官網(wǎng) | www.datayuan.cn
微信公眾號(hào)ID | datayuancn
12月1日下午,由上海大數(shù)據(jù)聯(lián)盟、數(shù)據(jù)猿主辦的第20期魔方大數(shù)據(jù)在上海寶華萬(wàn)豪酒店成功舉辦。本期魔方大數(shù)據(jù)以“政務(wù)大數(shù)據(jù)”為主題,邀請(qǐng)了技術(shù)方和產(chǎn)業(yè)方大咖共聚一堂,共同探討了政務(wù)大數(shù)據(jù)落地實(shí)施的有效路徑。
以下是數(shù)據(jù)猿整理“普元信息政務(wù)大數(shù)據(jù)咨詢顧問夏佳斌”的發(fā)言實(shí)錄:
今天我想從兩方面和大家分享一下政務(wù)框架體系,第一方面是從我多年的實(shí)踐出發(fā)介紹下政務(wù)框架體系。第二方面是結(jié)合實(shí)際情況,探索下如何實(shí)現(xiàn)政務(wù)大數(shù)據(jù)的落地。
去年9月份有一個(gè)客戶提出要建內(nèi)存數(shù)據(jù)庫(kù),深入的交談后我了解到,他是希望建設(shè)一個(gè)數(shù)據(jù)庫(kù),即使應(yīng)用進(jìn)行了改造升級(jí)也不會(huì)影響他繼續(xù)使用原來(lái)的數(shù)據(jù)。除此之外他還提出了另外幾點(diǎn)要求,希望對(duì)所有數(shù)據(jù)的訪問都有統(tǒng)一的管控,數(shù)據(jù)優(yōu)化有統(tǒng)一的入口,保證政府?dāng)?shù)據(jù)的安全性和可靠性,數(shù)據(jù)不用后物理數(shù)據(jù)依舊存在等。這個(gè)客戶是做區(qū)縣政府?dāng)?shù)據(jù)中心,他的需求其實(shí)就是建立一個(gè)虛擬數(shù)據(jù)庫(kù),這和政務(wù)云、虛擬機(jī)非常相似。
既然都要做數(shù)據(jù)資源,做云資源管理,政務(wù)云和它有什么不同?政務(wù)資源管理的范疇在哪里,邊界在哪里是這個(gè)問題的核心。數(shù)據(jù)資源管不管客戶?數(shù)據(jù)資源管不管服務(wù)器?我們把問題縮小了,就是服務(wù)器之間數(shù)據(jù)資源的范疇。
在數(shù)據(jù)資源體系里面有三個(gè)核心,資源定義、運(yùn)營(yíng)機(jī)制和支撐平臺(tái)。
先看資源的定義。我們做政務(wù)數(shù)據(jù)體系,首先要對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行定義,我們將數(shù)據(jù)資產(chǎn)兩部分,一部分是跟技術(shù)相關(guān)的,如數(shù)據(jù)庫(kù)的腳本、存儲(chǔ)過程、ETL和報(bào)表,這些都是技術(shù)數(shù)據(jù),存在我們的運(yùn)算資源上。另一部分是和業(yè)務(wù)相關(guān)的,包括業(yè)務(wù)的術(shù)語(yǔ),比如人員姓名,姓名定義,中英文姓名的區(qū)別等。還有信息的模型,除此之外,還通過技術(shù)規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)去描述我們的資源。
第二,數(shù)據(jù)運(yùn)營(yíng)機(jī)制。這里要提兩個(gè)流程,一是數(shù)據(jù)資源的生命周期,二是數(shù)據(jù)流轉(zhuǎn)的生命周期。我們不僅考慮數(shù)據(jù)怎么規(guī)劃、設(shè)計(jì),還考慮數(shù)據(jù)怎么流動(dòng),這都是我們數(shù)據(jù)運(yùn)營(yíng)機(jī)制的主要組成部分。運(yùn)營(yíng)機(jī)制還有規(guī)范,包括管理規(guī)范、協(xié)作邊界。
第三,支撐平臺(tái)。這張圖是我們大數(shù)據(jù)平臺(tái)的支撐體系,非常全面,基本包含了大數(shù)據(jù)需要用到的所有應(yīng)用平臺(tái),這些應(yīng)用平臺(tái)都能夠?qū)崿F(xiàn)數(shù)據(jù)運(yùn)營(yíng)當(dāng)中的一個(gè)或幾個(gè)環(huán)節(jié)。這一塊上面還缺少連接的工具和治理工具。做數(shù)據(jù)資源的框架體系需要的不是點(diǎn)狀的工具,而是打通工具與工具之間的工具。還有治理工具,比如說(shuō)如何選擇分布式存儲(chǔ)平臺(tái),如何選擇關(guān)系數(shù)據(jù)庫(kù),這就需要一些額外的工具進(jìn)行管理。
在我們的數(shù)據(jù)資源框架體系當(dāng)中涉及到的是資源的定義,包含數(shù)據(jù)資產(chǎn)、技術(shù)規(guī)范和標(biāo)準(zhǔn),運(yùn)營(yíng)機(jī)制有協(xié)作流程和管理規(guī)范,另外還有技術(shù)支撐平臺(tái)。這六塊都比較抽象,但在實(shí)際建設(shè)當(dāng)中是和我們數(shù)據(jù)資源、政府信息化建設(shè)的路程保持一致的。
回顧以往的發(fā)展階段,第一階段有很多單體應(yīng)用,我們做政務(wù)信息化的信息系統(tǒng),至少要有應(yīng)用系統(tǒng)。做數(shù)據(jù)的應(yīng)用,做數(shù)據(jù)資源開發(fā)、做數(shù)據(jù)庫(kù)管理系統(tǒng)和自己的存儲(chǔ),關(guān)系到的就是數(shù)據(jù)結(jié)構(gòu)和應(yīng)用。
進(jìn)入第三個(gè)階段以后,數(shù)據(jù)的建設(shè)都是互聯(lián)互通的,網(wǎng)絡(luò)不存在距離了,我們要考慮運(yùn)營(yíng)、數(shù)據(jù)開發(fā)過程、資產(chǎn)、安全等。這就是我們政務(wù)數(shù)據(jù)資源建設(shè)當(dāng)中需要關(guān)注的點(diǎn)。
接下來(lái)講一下我們的實(shí)踐,剛才講到了治理工具和連接工具。這是某區(qū)的政務(wù)數(shù)據(jù)資源云,按照剛才的框架體系一步一步落地,包括生命周期的管理、數(shù)據(jù)資源和數(shù)據(jù)服務(wù)的交換、挖掘分析引擎,運(yùn)維包含了運(yùn)維、監(jiān)控、日志等,這些都需要管控和運(yùn)營(yíng)。
在實(shí)踐操作中第一步還是做資源的定義。這一部分采用了元數(shù)據(jù)采集,通過業(yè)務(wù)元和技術(shù)元進(jìn)行比對(duì),這里面也用到了語(yǔ)義識(shí)別,目前還是以數(shù)據(jù)結(jié)構(gòu),包括技術(shù)元數(shù)據(jù)的定義做語(yǔ)義識(shí)別。把政務(wù)所管到的資產(chǎn)做了一個(gè)標(biāo)簽,然后進(jìn)行定義。這個(gè)過程形成了資產(chǎn)清單,里面包含了資產(chǎn)的歸屬權(quán)、資產(chǎn)的關(guān)聯(lián)屬性、資產(chǎn)的更新情況和授權(quán)的情況,這是數(shù)據(jù)的資產(chǎn)化,就是要做到資產(chǎn)的統(tǒng)一管理。
第二,在資源這一塊有統(tǒng)一的資源規(guī)劃,在數(shù)據(jù)資源建設(shè)當(dāng)中,政府?dāng)?shù)據(jù)和企業(yè)數(shù)據(jù)有所不同,無(wú)論是區(qū)縣還是到街政,涉及的政務(wù)面是一個(gè)企業(yè)難以達(dá)到的,在這種情況下,數(shù)據(jù)資源的分類、分級(jí)、分層就變得特別重要。在數(shù)據(jù)資源的規(guī)劃體系當(dāng)中會(huì)把政務(wù)資源規(guī)劃分成四個(gè)角度,即基礎(chǔ)面、行業(yè)面、服務(wù)面、物理面,通過資產(chǎn)化的建設(shè)會(huì)有物理的目錄、信息資源的目錄、服務(wù)的目錄,實(shí)現(xiàn)在不同的資產(chǎn)清單中可以看到不同的分類體系,每個(gè)體系都代表著一個(gè)視角。數(shù)據(jù)資源還在這里面,只是用不同的視角去看的,通過這些視角資產(chǎn)更容易被發(fā)現(xiàn)、被共享。
接下來(lái)是數(shù)據(jù)資源的服務(wù)化,數(shù)據(jù)資源的服務(wù)化涉及數(shù)據(jù)的服務(wù)訪問。我們所有的數(shù)據(jù)使用都提供自服務(wù)的方式以實(shí)現(xiàn)服務(wù)的發(fā)布和服務(wù)的運(yùn)行。在數(shù)據(jù)資源框架當(dāng)中,數(shù)據(jù)的訪問層包含實(shí)時(shí)的同步和非實(shí)時(shí)的同步,這是通過元數(shù)據(jù)進(jìn)行驅(qū)動(dòng)的。比如,數(shù)據(jù)訪問不同的數(shù)據(jù)資源,相互之間的關(guān)聯(lián)關(guān)系需要元數(shù)據(jù)定義,通過這個(gè)定義,這些服務(wù)可以通過自動(dòng)化模式,通過機(jī)器生成,當(dāng)中可以減少一些理解上的誤區(qū)。
第三,共享有序化。這是政府部門政務(wù)信息共享面臨的情況。一講到共享,人們的第一個(gè)反應(yīng)的就是數(shù)據(jù)標(biāo)準(zhǔn),接觸客戶的過程當(dāng)中,我個(gè)人也認(rèn)為在數(shù)據(jù)標(biāo)準(zhǔn)、作用及如何使用上面存在不同的說(shuō)法,但是在數(shù)據(jù)資源框架體系里面,我個(gè)人的理解是,數(shù)據(jù)的標(biāo)準(zhǔn)是以兩種方式進(jìn)行梳理的,一是數(shù)據(jù)標(biāo)準(zhǔn)的體系包含更新維護(hù)、數(shù)據(jù)現(xiàn)狀。第二,通過元數(shù)據(jù)自動(dòng)采集的梳理,這塊包含元數(shù)據(jù)的采集和語(yǔ)義的分析,有技術(shù)屬性、管理屬性、安全屬性等,通過元數(shù)據(jù)的分類和大數(shù)據(jù)的分值形成信息項(xiàng)的技術(shù)標(biāo)準(zhǔn)。這兩塊在做數(shù)據(jù)資源標(biāo)準(zhǔn)的時(shí)候都是無(wú)法替代的。
從數(shù)據(jù)標(biāo)準(zhǔn)來(lái)看,我發(fā)現(xiàn)很多客戶和合作伙伴會(huì)把兩件事情放在一起,一個(gè)是梳理了自己的資產(chǎn),盤點(diǎn)了資產(chǎn)后會(huì)把自己有多少數(shù)據(jù)資源分一個(gè)類,另一個(gè)是梳理完成以后,做一些收斂,通過合并同類項(xiàng),通過數(shù)據(jù)的規(guī)約和勾連發(fā)現(xiàn)相似信息項(xiàng)。有了數(shù)據(jù)標(biāo)準(zhǔn)以后,運(yùn)營(yíng)機(jī)制會(huì)涉及到整個(gè)數(shù)據(jù)資源開發(fā)的運(yùn)營(yíng)過程,涉及到開發(fā)人員、建模人員,測(cè)試、和業(yè)務(wù)運(yùn)營(yíng)。
數(shù)據(jù)共享最大的弊端就是信息不對(duì)稱,這是業(yè)務(wù)需求的出發(fā)點(diǎn),有了資源目錄共享以后,要雙方進(jìn)行審批,然后簽三方協(xié)議,接下來(lái)再協(xié)調(diào)第三方去進(jìn)行開發(fā),再讓另一方確認(rèn),這之中至少包含三個(gè)層面。因?yàn)橛行畔⒉粚?duì)稱,實(shí)際上解決的是數(shù)據(jù)資源理解的問題。通過匹配相應(yīng)的協(xié)作流程、技術(shù)規(guī)范、管理規(guī)范和安全管控規(guī)范,讓大家在同一個(gè)平臺(tái)上進(jìn)行協(xié)作。
我把我們的實(shí)踐成果給大家介紹一下。第一個(gè)是動(dòng)態(tài)的資源目錄,這是基于元數(shù)據(jù)的采集歸類,從目錄的關(guān)聯(lián),資源和資源的關(guān)聯(lián)上建立的。通過元數(shù)據(jù)的采集發(fā)生,任何變化,甚至一個(gè)接口的改變都會(huì)在資源管控的范圍內(nèi)發(fā)現(xiàn)變化。第二,共享服務(wù)運(yùn)行架構(gòu)。這次介紹的還是應(yīng)用系統(tǒng)建設(shè)當(dāng)中數(shù)據(jù)層的訪問,這之中涉及數(shù)據(jù)如何進(jìn)行服務(wù)訪問,服務(wù)如何進(jìn)行路由,如何放到運(yùn)行引擎里,如何把數(shù)據(jù)和應(yīng)用的管理進(jìn)行分離。第三,數(shù)據(jù)資源的建模、開發(fā)、管理授權(quán)。第四,相應(yīng)的管控體系。建平臺(tái)是比較容易的事情,但是建規(guī)范卻比較難。一方面需要協(xié)調(diào)眾多的部門,另一方面國(guó)家層面有非常多的大數(shù)據(jù)標(biāo)準(zhǔn)、規(guī)范,但實(shí)際操作的規(guī)范需要各級(jí)的政府部門去摸索,配合實(shí)際情況,這個(gè)過程的梳理符合本級(jí)政府或者有關(guān)部門的需求
通過政務(wù)數(shù)據(jù)資源云就把政務(wù)數(shù)據(jù)資源框架體系做成了實(shí)踐。在這個(gè)過程中也存在一些展望,因?yàn)橘Y源的定義、運(yùn)營(yíng)機(jī)制和標(biāo)準(zhǔn)規(guī)范都是持續(xù)演進(jìn)的過程。大膽猜測(cè)一下,在未來(lái)的政務(wù)數(shù)據(jù)資源框架體系當(dāng)中,邏輯集中將是一個(gè)趨勢(shì),數(shù)據(jù)資源云只是其中的一個(gè)階段,而不是終點(diǎn)。
謝謝大家!
聯(lián)系客服