面向数据共享的教育数据标准体系研究与建设实践
點擊上方藍字關注我們
面向數據共享的教育數據標準體系研究與建設實踐
楊琳1,?王煒1,?諸紀1,?王明政2
1?上海計算機軟件技術開發中心,上海 201112
2?上海市教育委員會信息中心,上海 200003
?
摘要:在教育信息化加速建設和政務數據逐步開放的背景下,教育數據共享開放成為亟待解決的問題,面向數據共享的教育數據標準體系建設需求應運而生。通過分析教育數據共享需求和標準化建設需求,研究數據共享標準在教育數據標準體系中的定位,明確教育數據共享標準應規范的內容。最后以上海教育數據標準體系建設為例,闡述了具體實踐方法和建設特點,以期為其他地區開展教育數據共享工作提供參考。
關鍵詞:教育數據?;?數據共享?;?標準體系
論文引用格式:
楊琳,王煒,諸紀, 等. 面向數據共享的教育數據標準體系研究與建設實踐[J]. 大數據, 2020, 6(6): 3-13.
YANG L, WANG W, ZHU J, et al. Research and practice on education data standard system for data sharing[J]. Big Data Research, 2020, 6(6): 3-13.
1 引言
信息技術更迭和數據規模劇增不斷催生出新的治理理念和方法。隨著教育信息化的不斷推進,建立教育數據標準體系的需求日益迫切。信息標準與技術規范在數據治理中能起到增強數據一致性、促進數據集成、加強數據資產管理以及實現數據資源共享等重要作用,在教育信息系統中可為數據交換與共享、實現本級教育業務管理系統與上級對接提供必要的保障。2014年,教育部發布 《教育管理信息化建設與應用指南》,對核心業務管理信息系統的建設進行頂層設計,明確了統籌制定信息化標準規范體系的要求和內涵,要求在信息標準與數據交換技術規范的基礎上實現數據交換與共享體系建設。2018年,教育部制定《教育部機關及直屬事業單位教育數據管理辦法》,推進數據規范管理、互聯互通和共享公開,確保數據安全,也為各地區教育數據的管理提供參考。如今,教育信息化已由1.0時代進入2.0時代,由注重基礎設施及配套系統建設向系統與系統、技術與業務之間深度融合邁進,在實踐中更需完善信息標準和技術規范,以指導、管理和監督相關項目的建設,為教育數據價值深度挖掘保駕護航。
近年來,各地區、各部門積極響應國務院加快推進政務信息系統整合共享的號召,促進跨地區、跨部門、跨層級政務數據互認共享。在此背景下,教育數據共享建設既能滿足教育數據管理和各類應用需求,也可為政務信息系統整合工作助力,數據共享的需求被提高到新的高度。2018年,教育部發布《教育信息化2.0行動計劃》,實施行動包括“發布系列技術和功能標準規范,探索資源共享新機制”“完善教育數據標準規范,促進政務數據分級分層有效共享”等,明確提出數據共享標準規范建設的迫切需求。由此,如何在當前教育信息化快速建設中進行數據共享標準建設,保證教育數據順利且高效地實現融合交換,已成為當下亟須解決的問題。本文提出教育數據標準體系的理論框架,并分析了數據共享標準在其中的定位以及具體的建設內容,最后介紹了上海教育數據標準體系的建設實踐。
2 教育數據共享標準需求分析
近幾年,教育系統信息化建設成績顯著,但各單位、各部門的信息系統建設基本呈獨立開發模式,不同建設時期的系統成本投入、技術選型、服務商選擇存在差異,系統運行環境、開發語言、后臺數據庫等建設標準不一致。教育數據繁雜且碎片化地散落在各部門,既浪費軟硬件資源,也不利于各維度信息的相互關聯。數據共享和融合作為實現數據治理體系和治理能力現代化的必經之路,在打通教育單位基礎數據融合通道、關聯多維度數據并集中分析處理、提高教育資源利用率等諸多方面產生需求。數據共享和融合的實現以數據共享標準的研制實施為基礎,能夠破除數據在部門間流動的技術藩籬和管理屏障,同時保障共享過程的數據安全。
2.1 教育數據共享需求
(1)數據共享促進校園高效管理
在教育信息化全面建設的背景下,學校教育教學部門、行政部門和校園管理部門常需要跨部門使用數據,此時實現數據共享可以減少資料收集、數據采集等重復的勞動時間和費用,將精力重點放在部門業務流程的優化上,可以更充分地使用已有數據資源。例如,為嚴格控制校園進出人員,學校保衛科需要學生和人事管理部門的數據;為管理學生信息,學生工作處需要教務處和團委提供的數據;為管理教師科研項目經費使用情況,科研處需要財務處提供的數據等。部門間實現業務數據的交換共享,有利于教職工、學生和家長在信息管理系統中實現各類事務的“一網通辦”。
(2)數據共享激發數據潛在價值
數據共享能夠促進教育數據的深度分析挖掘,充分發揮數據的價值。隨著教育信息化的不斷推進以及智慧校園和校園云平臺的初步建設,各級教育單位在教師課堂教學、學生學習活動、校園數字化運行等方面積累了海量數據。這些數據既包括面向特定教育主題的多類型、多維度、多形態的集合數據,也包括面向教育全過程的數據。教育數據匯聚和融合共享使得數據集更加全面且真實,其通過大數據技術分析挖掘數據的關聯性、統計性、趨勢性、個體差異性等,為教育決策提供科學指導,提高教學質量和教育水平。
(3)數據共享促進教育公平
教育數據共享還可以改善教育資源分配不均的情況,促進教育公平。不同地區的經濟發展程度存在差異,教育發展水平也存在區域不均衡的狀況。教育資源共享可以通過數據整合和優化配置增強優質教育資源溢出效應,分享的渠道越多,學習資源發揮的效用越大,受用地域和受用人群也會越來越廣,進而形成教育資源的良性流動。
2.2 共享標準建立需求
(1)跨部門融通數據需要
教育單位在信息化建設中積累了大量基礎數據,但由于缺少區域主管部門對信息數據的統籌規劃,大多數教育單位在建設信息管理系統時往往只考慮本單位的使用情況,或僅滿足縱向業務需求,進行煙囪式建設,導致信息管理系統中數據編碼、數據格式和數據質量存在差異,數據系統間交互操作困難。為了破除不同數據源間的數據融合障礙和技術藩籬,使數據編碼和數據格式在不同部門保持一致,并具備部門間交互融通的條件,需要統籌制定共享標準,以統一的數據規范和系統建設規范為數據共享提供基礎。
(2)跨層級使用數據需要
由于管理層級的限制以及不同教育部門信息化水平發展的差異,教育數據管理囿于縱向層級,不同級別的教育系統只掌握本級上報的部分數據,要實現同級部門間的數據交換需經過層層審批,這增加了共享成本,并滋生了安全隱患。因此,應在共享管理中建立標準以優化共享流程,確保“一數一源”和“一源多用”,建立數據共享的使用制度,并明確各部門權責,全方位管理教育數據的使用與交換,實現數據共享管理縱向到底和橫向到邊。
(3)保障數據安全需要
數據共享是一把雙刃劍,教育部門業務需要采集大量學生和教師的個人數據,不合理地使用這些數據可能引發隱私泄露,進而危及個人利益。因此數據共享應遵循 合法、正當、必要、最小化的使用原則,通過標準化管理和規范技術使用來強化對隱私數據、敏感數據的保護,實現數據保護與數據共享的雙贏。
3 共享標準定位與建設內容
3.1 數據標準體系及共享標準定位
數據標準體系的建設是教育信息化建設過程中的重要一環,能夠有效支撐和保障數據應用。其中,數據共享相關標準能夠通過支持數據資源共享交換的順利實現以及數據交換過程的操作合規化來避免主觀因素的影響。本文參考全國信息技術標準化技術委員會大數據標準工作組、上海市公共數據標準化技術委員會的標準體系建設思路,基于政務數據和教育數據標準化需求,構建了教育數據標準體系框架。教育數據標準體系框架及共享標準定位如圖1所示。
圖1???教育數據標準體系及共享標準定位
從數據應用標準化、規范化涉及的技術要求和管理流程出發,確定標準體系中應考慮的標準化維度包括基礎共性、數據采集、數據歸集、數據治理、數據服務、數據安全和管理保障七大類;再將各維度中應標準化的技術、流程、方法等內容逐項細分,進一步明確具體建設內容和邊界,研制形成各項標準規范文件。
作為數據標準體系中的重要組成,共享標準是教育數據價值深度探索的基礎,其通過數據融合交換擴充數據分析維度,進而充分傳遞信息,賦能教育大數據應用程序的開發和深層價值的發掘。數據標準體系中各標準化維度均包含共享標準的建設要素,展示共享標準在其中的定位能夠明確層次結構,為建設實踐提供引導。
3.2 共享標準分類及規范內容
根據對數據共享實現這一目標的支持程度,可以將標準劃分為數據共享實現標準、數據共享支撐標準、數據共享平臺標準和數據共享安全標準4個部分。
(1)數據共享實現標準
數據共享實現標準是規范數據提供部門和使用部門數據共享交換行為的相關標準,包括管理類標準和技術類標準。管理類標準即數據服務管理規范和授權管理規范:數據服務管理規范需要規定數據共享服務的申請和使用流程,建立數據應用導向的按需共享機制,同時確定各部門在數據共享全過程的權責,管理約束各部門行為,確保數據共享交換過程的制度化管理和機制穩定運行;授權管理規范對不同等級和類別的數據規定相應的數據共享權限和申請流程,通過授權管理方式優化審核流程、實現按需高效共享。技術類標準即數據集成技術規范,用于實現統一數據共享交換的技術選型、設備要求、接入方式和代碼要求等。由于教育數據來源于各級各類教育資源管理系統,信息化程度差異和系統建設差異導致數據格式不一、編碼不同、存儲結構相異等問題,直接融合將導致數據質量問題。數據集成旨在以統一模式匯聚多源數據,構建標準統一的數據集合,在技術上保證數據共享的可實現。
(2)數據共享支撐標準
數據共享支撐標準是確保數據共享服務實現的基礎規范,包括數據標準、數據質量管理和數據資源目錄管理。數據標準是實現共享的數據質量基礎,數據的標準化程度和質量影響著數據交換融合,因此需要建立數據編碼規范和元數據規范,從源頭規范數據標準,以便后續存儲、管理和共享。數據質量在共享過程中是至關重要的,數據質量規范可確保數據描述準確、標準一致、結構統一,實現各系統無縫對接以及數據實時更新。數據資源目錄作為各部門使用數據共享服務的依據,便于共享數據的供需管理,數據資源目錄管理通過對教育資源分類、元數據描述和編碼排序等進行規定,為數據共享授權管理提供數據索引定位基礎。
(3)數據共享平臺標準
數據共享平臺標準即教育數據資源管理平臺相關標準,主要包括平臺建設規范、平臺運維規范和平臺服務管理規范。數據資源共享交換平臺是數據交換過程的系統基礎,通過技術支撐滿足教育信息管理系統間的互操作要求。平臺需要基礎設施建設和數據存儲、治理、安全、處理、服務等系統功能模塊,實現對數據的統一收集和管理。平臺建設規范確保建設流程、功能架構、服務管理等標準合規,以保證平臺作為系統基礎能滿足數據共享交換要求;平臺運維規范保證各功能模塊能夠穩定安全運行;平臺服務管理規范對各部門通過平臺進行的數據歸集和數據交換等服務準備、數據共享服務應用等進行系統層面的約束規范,保證平臺服務功能的持續穩定運行。
(4)數據共享安全標準
教育數據包含大量師生個人隱私,面臨諸多潛在安全威脅,作為數據共享的安全保障,數據共享安全標準貫穿于整個管理活動中。數據服務安全規范規定了共享安全技術措施和共享安全管理方案,其中共享安全技術措施規定了數據導入導出和交換中的接口、文件、庫表,共享安全管理方案則側重以制度規則降低人為因素導致的潛在風險。分級分類規范對各教育系統數據集進行分類并劃分數據域,再以不同敏感度確定數據域的安全等級,最后得到所有數據集和子集的共享類別,保障共享安全技術措施和管理方案的精細化實施。
4 上海教育數據共享實踐案例
為加快推進上海教育數據治理,上海市教育委員會在2019年先后出臺《上海教育系統加快推進數據治理和“一網通辦”工作實施方案》《上海教育數據管理辦法(試行)》,規范了教育數據采集管理,推動了歸集整合,保障了數據安全,促進了數據共享開放,發揮了數據價值,并明確了相關單位的職責和權力。作為數據治理國際、國家標準的牽頭研制單位,上海計算機軟件技術開發中心面向教育領域開展大數據成果轉化服務,參與完成《上海教育數據管理辦法(試行)》的起草,并于2020年完成上海教育數據標準體系的規劃,研制完成覆蓋基礎、數據、技術、平臺/工具、應用服務、管控和安全等不同維度的標準規范;為上海市教育委員會打通教育系統內部各級各類教育部門數據交換共享通道,同時為實現教育數據向上海公共數據開放平臺的融合提供了支撐,有力推動了上海教育信息化建設在標準化、規范化道路上的發展。
4.1 標準體系流程架構
作為教育數據管理總則性文件,《上海教育數據管理辦法(試行)》明確了各項管理原則,將管理角色分為數據提供部門、數據使用部門、數據管理協調部門和數據技術管理部門,并對各部門職責分工進行了規定。上海教育數據標準體系遵從其各項管理原則和角色劃分,以數據服務為目標研究制定各項標準文件,對數據全生命周期過程提供技術指導和管理規范,旨在實現教育數據共享、開放和各類深度應用。上海教育數據標準體系架構如圖2所示,從數據全生命周期視角展示了各標準規范的執行流程及規范階段。
圖2???上海教育數據標準體系架構
教育基礎數據采集自各教育單位的業務系統,基礎信息分類與代碼作為共享支撐標準,規定了數據的元素構成和元數據結構,數據以標準統一的形態存儲在教育單位的數據庫中。教育基礎數據從各單位數據庫以集成標準歸入前置庫,通過前置節點向教育數據資源管理技術平臺歸集。其中,數據集成管理規范通過標準化接口、名稱、代碼的方式保證歸集過程的穩定高效進行。
作為上海教育數據共享交換的核心,教育數據資源管理技術平臺對接各級平臺或應用系統,提供業務系統應用、數據對接報送、公共數據開放、治理決策支持、大數據分析應用等功能,在平臺建設指南的指導下進行標準化建設,由平臺運維管理規范確定運維管理標準。針對平臺提供的共享服務,數據服務管理規范確定了共享服務的使用方式和流程,并界定了使用過程中各部門的權責利,保證數據服務使用符合正當、必要、最小化、合法合規的原則。
數據質量管理規范、安全管理規范和分級分類管理規范作為貫穿數據全生命周期的標準,通過對數據質量管理和安全管理行為進行規范,保證數據共享服務可用、好用和安全使用。
4.2 共享標準體系建設特點
(1)管理角色權責劃分
跨部門信息共享的障礙除了技術和業務層面的不兼容因素外,更多的是組織結構、部門間關系、部門利益相關等問題,如缺乏激勵、抗拒變革、支持信任缺乏、利益沖突等。上海教育數據標準體系中的各項規范、指南通過界定數據提供部門、數據使用部門、數據管理協調部門和數據技術管理部門的數據使用和管理責任,劃清部門管理邊界,以避免教育數據共享中的部門利益沖突,并規范各部門管理或技術人員行使職能,實現安全事件追責。
從數據共享交換需求、供給、技術及協調管理4個方面確定各角色,既有利于厘清部門利益和落實部門責任,也簡化了共享交換過程中的環節,便于數據共享流程化管理。數據共享管理流程如圖3所示。
圖3???數據共享管理流程
(2)兩級共享平臺建設
上海教育數據共享采用兩級平臺建設模式,各級教育數據資源管理技術平臺作為數據共享技術載體歸集了各級各類教育單位的基礎教育數據,兩級共享平臺層級結構如圖4所示。平臺具備教育數據的歸集、存儲、治理、安全、賦能和服務能力,作為各級教育數據共享交換樞紐,實現了數據平臺、數據接口、數據通道和數據管理4個維度的功能。一級教育數據資源管理技術平臺即上海的市級教育數據資源管理技術平臺,向上對接教育部、上海市大數據中心、市級教育單位。二級教育數據資源管理技術平臺指區級、高校、中職教育數據資源管理技術平臺,匯集了上海各行政區內教育單位、高校和中職的教育數據。通過標準化兩級平臺建設,實現數據跨部門、跨層級交換共享,避免了以數據網關交換方式實現共享造成的數據接口繁多、效率低、資源消耗大等問題,既保證了集約建設,又保證了共享交換的高效進行。
圖4???兩級共享平臺層級結構
時,教育數據資源管理技術平臺建設指南規定了各級各類平臺的建設標準,在統一各級技術平臺的數據標準、基礎功能、維護規范、安全要求等基礎特性之余,提供了不同的備選服務功能,在共享服務順利進行的基礎上支持技術平臺的特色建設。
(3)數據集成技術標準制定
教育系統各部門信息化建設均具有一定基礎,但一般情況下原有數據庫設計與平臺總體設計不符,在數據對接集成時存在技術障礙,上海教育數據標準化建設中利用數據集成技術標準解決了全局共享問題。數據集成技術標準規范了上海教育各類信息系統之間進行信息采集、歸集、共享和業務協同的方式和協議,保證交換的信息能夠被準確地理解和應用,支撐市級平臺和各單位業務系統間的數據采集和共享交換,實現上海教育數據的統一規范采集、統一加工處理和統一應用服務。
(4)分級分類共享管理
上海市教育委員會在國家安全相關法律法規和《上海市公共數據開放分級分類指南(試行)》的基礎上,結合上海教育數據管理體系建設工作制定了上海教育數據分級分類規范,設定了各類數據的安全等級確定規則,并且實現了與上海公共數據分級分類規則的對接兼容。數據服務管理規范在此基礎上針對不同等級的數據,規定了相應處理方式和共享流程,將數據共享類別劃分為為無條件共享、授權共享和非共享,從而精細化控制數據共享安全。
在教育數據向政務數據平臺共享的管理中,上海市教育委員會根據法定職責確定可以向其他單位共享的數據責任清單,根據履職需要形成需要其他單位共享的數據需求清單,以及形成法律、法規、規章,明確規定不能共享的數據負面清單,通過清單模式以最小、夠用原則實現按需共享。
4.3 標準實施路徑與成果
教育數據標準的宣貫和實施工作不是一蹴而就的,需要兼顧信息化建設基礎和數據標準基礎,以合理的工作推進路徑逐步提高整個教育系統的數據標準化。上海市教育委員會以數據平臺和工具建設先行,優先完善市級教育數據資源管理技術平臺架構和技術工具建設,保障數據傳輸和系統運行穩定性,隨后對接各二級平臺,建立全市教育數據資源管理目錄,并依此逐步推進數據歸集和標準落地。
標準試行近一年來,市級教育數據資源管理技術平臺共建立教育數據資源管理目錄10 5個,相較標準化工作開展前增加54%,并且歸集的教育數據量是原來的3倍,基礎庫數據歸集率達到93%,基本實現教育數據應編盡編。通過市級平臺對接實現數據共享的教育部門達到32個,累計提供8萬多次數據共享接口使用,接口的月調用頻率是原來的1.3倍,有效促進了教育數據互聯互通。根據政務數據整合要求,向上海市大數據中心累積歸集數據39 GB,共享服務能力達到優良水平,滿足了上海市“一網通辦”對教育數據的共享應用需求。
5 結束語
數據共享是教育數據治理的重要目標,實現數據共享既有利于教育數據管理現代化,也能激發教育數據深度應用的潛能。作為實現數據共享的重要支撐,數據標準體系建設是一項長期任務,不斷完善和修訂已有標準、基于環境變化制定新標準將成為不斷循環迭代的過程,隨著教育業務深化、信息化建設水平的發展,教育數據標準建設任重而道遠。與此同時,區塊鏈技術研究熱潮給數據共享尚待解決的問題帶來曙光,其分布式、透明性、數據可追溯、不可隨意篡改等特性確保數據從采集、交易、分配到計算分析均存儲在區塊鏈中,數據質量獲得了前所未有的強信任背書,數據共享過程中的可信性和安全性將獲得更強保證。
作者簡介
楊琳(1979-),女,上海計算機軟件技術開發中心高級工程師,大數據治理研究所副所長,主要研究方向為數據治理和數據資產等 。
王煒(1994-),男,上海計算機軟件技術開發中心助理工程師,大數據治理研究所咨詢工程師,主要研究方向為數據治理與數據標準 。
諸紀(1995-),男,上海計算機軟件技術開發中心助理工程師,大數據治理研究所咨詢工程師,主要研究方向為大數據與數據治理 。
王明政(1974-),男,博士,上海市教育委員會信息中心副教授、主任,主要研究方向為教育信息化。
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
轉載、合作:010-81055537
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中文科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,并被評為2018年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的面向数据共享的教育数据标准体系研究与建设实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 泛微e9隐藏明细表_泛微E-COLOGY
- 下一篇: rhino java api demo_