建設目標
(1)建設全生命周期數(shù)據(jù)治理體系
通過實現(xiàn)對數(shù)據(jù)資源的全生命周期管理,包括數(shù)據(jù)標準、數(shù)據(jù)采集、數(shù)據(jù)倉庫管理、數(shù)據(jù)質(zhì)量監(jiān)測、數(shù)據(jù)接口開放、數(shù)據(jù)資源發(fā)布、服務狀態(tài)呈現(xiàn)、數(shù)據(jù)應用分析等各方面,建設全生命周期數(shù)據(jù)治理體系。
(2)提供全功能的數(shù)據(jù)接口
使用安全、先進、便捷的技術手段提供數(shù)據(jù)接口,包括編程接口、數(shù)據(jù)庫接口、消息接口、文件接口等多種在線、離線方式,為數(shù)據(jù)應用場景提供服務。
(3)為全方位業(yè)務場景提供數(shù)據(jù)支撐
全域數(shù)據(jù)中心建成后,需要為信息門戶、微服務、決策支持、軟件開發(fā)、數(shù)據(jù)共享、數(shù)據(jù)填報等各種場景提供數(shù)據(jù)服務,通過準確詳實的數(shù)據(jù)保障各項業(yè)務順利進行,減少數(shù)據(jù)協(xié)調(diào)所耗費的精力和成本,協(xié)助領導層通過數(shù)據(jù)分析及時準確的掌握學校的各項情況,為管理和決策過程提供數(shù)據(jù)支持。
(4)通過制度建設確保長效機制
通過建設數(shù)據(jù)管理規(guī)范和制度體系,從根本上解決當前存在的各種數(shù)據(jù)管理問題,實現(xiàn)“一次治理、長期受益”的長效機制。
(5)通過數(shù)據(jù)治理建設為“雙高”等應用提供支持
通過多維度的數(shù)據(jù)采集、集中和治理,使數(shù)據(jù)表達規(guī)范,內(nèi)容準確、維度完整,形成標準統(tǒng)一、分類清晰、質(zhì)量可信的數(shù)據(jù)倉庫和數(shù)據(jù)集市,為“雙高”應用提供支持,輔助提升辦學水平和服務能力。
建設方案
1,全維度數(shù)據(jù)采集與治理
要實現(xiàn)全生命周期數(shù)據(jù)治理體系需首先完成數(shù)據(jù)的全量采集,且要求覆蓋的數(shù)據(jù)維度和內(nèi)容盡量全面,因此需要將對散布在全校的各種有價值數(shù)據(jù)進行識別和采集。從數(shù)據(jù)來源上,主要存在兩種形式的采集方案:
1)線上業(yè)務系統(tǒng)數(shù)據(jù)采集:包含人事、教務、資產(chǎn)、財務等全量業(yè)務數(shù)據(jù)采集,其中約20張服務于“雙高”指標分析。
2)線下(離線數(shù)據(jù)采集):存在于學生工作處、繼續(xù)教育學院、科技產(chǎn)業(yè)處、計劃財務處、網(wǎng)絡與信息中心等9個業(yè)務部門的離線數(shù)據(jù),完成約50多張表的設計與填報工作;同時,針對教師個人相關數(shù)據(jù),通過教師個人數(shù)據(jù)中心完成數(shù)據(jù)的糾錯與補錄。
其次數(shù)據(jù)采集后,按照3個層次的順序進行集中、清洗、歸類和組合:
1)數(shù)據(jù)湖層:這一層實現(xiàn)數(shù)據(jù)的匯總集中。
2)數(shù)據(jù)倉庫層:這一層實現(xiàn)數(shù)據(jù)的標準化、質(zhì)量提升和結構整合,并進行歷史數(shù)據(jù)存檔。這一層是數(shù)據(jù)資產(chǎn)化管理的主要層級。
3)數(shù)據(jù)集市層:這一層是將數(shù)據(jù)按照各個應用所需的內(nèi)容和形態(tài)進行定制組合,便于應用廠商準確定位、快速調(diào)用、防止其訪問到無關數(shù)據(jù),保證數(shù)據(jù)的有效性、安全性。這一層是數(shù)據(jù)與應用對接的主要層級。
2,提供全功能數(shù)據(jù)連接
通過希嘉統(tǒng)一數(shù)據(jù)開放平臺,提供4種數(shù)據(jù)連接功能向應用系統(tǒng)和個人用戶供應數(shù)據(jù):
1)API調(diào)用:開放特定數(shù)據(jù)接口(即API)的訪問權限,供應用程序通過代碼調(diào)用數(shù)據(jù)。
2)數(shù)據(jù)庫連接:開放部分數(shù)據(jù)表的連接權限,供應用程序通過數(shù)據(jù)庫客戶端程序直接連接到數(shù)據(jù)庫上讀取數(shù)據(jù)。
3)數(shù)據(jù)推送:通過ETL軟件將各個應用所需的數(shù)據(jù)推動到中間庫中。
4)電子表格離線下載:將數(shù)據(jù)表轉(zhuǎn)換成電子表格文件供使用者下載后離線使用。
3,全生命周期管理
配置5類軟件實現(xiàn)對全域數(shù)據(jù)的采集、治理、管理、發(fā)布應用:
1)數(shù)據(jù)采集軟件:這是對數(shù)據(jù)集中過程進行數(shù)據(jù)搬運、轉(zhuǎn)換的軟件。包括數(shù)據(jù)集成管道、離線數(shù)據(jù)填報工具。這些工具將數(shù)據(jù)從來源系統(tǒng)抽取到數(shù)據(jù)湖中,并通過抽取、轉(zhuǎn)換、加載過程實現(xiàn)各個業(yè)務系統(tǒng)之間的定時數(shù)據(jù)同步和推送。
2)數(shù)據(jù)倉庫管理系統(tǒng):這是對數(shù)據(jù)治理過程進行知識圖譜管理的軟件。對數(shù)據(jù)標準、代碼標準、數(shù)據(jù)結構、數(shù)據(jù)屬性、數(shù)據(jù)血緣關系、數(shù)據(jù)質(zhì)量、數(shù)據(jù)接口等方面進行管理。
3)統(tǒng)一數(shù)據(jù)開放平臺:這是將治理完成后的數(shù)據(jù)與應用之間進行對接的軟件。包括對數(shù)據(jù)的注冊、封裝、發(fā)布、授權、安全策略、調(diào)用監(jiān)控等功能。
4)數(shù)據(jù)智能門戶:將數(shù)據(jù)資產(chǎn)面向全校各部門、各應用廠商進行呈現(xiàn),并通過這個入口進行瀏覽、連接的軟件,是信息中心與全校各部門關于數(shù)據(jù)資源進行管理互動的重要軟件。各個不同的數(shù)據(jù)使用方可以在該環(huán)境中查看學校發(fā)布的數(shù)據(jù)標準、可供訪問的數(shù)據(jù)資源,以便在線申請使用。各個部門可以查看該部門提供數(shù)據(jù)的情況、獲取數(shù)據(jù)的情況、數(shù)據(jù)存在的質(zhì)量問題和改善進度、數(shù)據(jù)在全校流動的全生命周期信息等。
5)數(shù)據(jù)糾錯補錄與數(shù)據(jù)可視化平臺:以數(shù)據(jù)中心數(shù)據(jù)為基礎,通過數(shù)據(jù)糾錯補錄系統(tǒng)配置個人數(shù)據(jù)中心,實現(xiàn)數(shù)據(jù)的糾錯補錄;同時通過希嘉數(shù)據(jù)可視化平臺datasight,實現(xiàn)“雙高”指標的計算及圖形展示,校內(nèi)各角色可通過改平臺實施掌握學校各指標進展情況。