摘 要: 在数字时代,大数据与数字技术推动高校信息化建设,成为高等教育创新发展的关键驱动要素。然而,这些技术的应用迫切需要与之相适应的理论和制度变革。研究我国一流高校数据治理政策,旨在为我国高校数据治理决策提供参考,助力高校数据治理体系建构与数字化转型发展。筛选我国14所一流高校数据治理政策文件为样本,基于扎根理论,逐一对样本学校数据治理政策进行词频统计、框架分析和对比研究,从政策内容上探讨我国高校数据治理实践现状与特点。分析发现:我国高校数据治理政策总体上呈现发文时间跟随国家政策趋势、涵盖范围逐步扩大为全校治理的特点;同时,实践中在组织体系、治理流程、安全与隐私方面存在不足。组织体系上缺乏与多元治理主体相适应的统筹管理,流程上缺少数据目录机制、质量监测规则不清晰、人才培养与数据应用创新不够,以及存在个人隐私保护意识不足问题。对此,研究建议:构建统筹管理体系,营造“数据校园”氛围;规范数据治理全流程,让数据“汇起来、管起来、用起来”;重视个人隐私保护,遵守应用伦理规范。
关键词: 数据治理;高校数据治理;数据治理政策;政策文本;文本分析;扎根理论
中图分类号: G434;G647
文献标志码: A
文章编号: 1673-8454(2024)05-0045-10
作者简介: 王楠,北京邮电大学教育技术研究所教授,博士(北京 100876);杜月,北京邮电大学教育技术研究所硕士研究生(北京 100876)
一、引言
2021年3月,《教育部关于加强新时代教育管理信息化工作的通知》[1]中提出,从加强教育数据规范管理、促进教育数据开放共享、强化教育数据质量保障和提升教育数据管理效能四个方面提高教育数据管理水平。数据治理逐渐成为高校建设发展、取得竞争优势的重要工作之一。
近年来,随着大数据技术与数字化的发展,人类迈入数字时代。数字技术引发高等教育在理念、模式、结构、流程、内容等方面的系统性“数字颠覆”[2]。高校在数字化建设过程中,大量多源异构的大数据伴随业务发展而产生和共享。有研究提出,教育数据治理体系实践中存在诸多问题,如统筹性的顶层设计与规划决策缺失、治理标准与规范不统一、“数据孤岛”现象、治理数据有效性低、大数据安全事件频繁发生等。这些问题引发广泛关注,在高校数据治理实践中有待进一步解决。高校数据治理的研究成为国内外关注的重点。在政策体系方面,国外主要从政策制定、政策框架、政策实施等角度研究高校数据政策,呈现出理论与实践并重的特点。我国高校数据治理在实践上起步较晚,理论上偏向于政策比较研究以及具体业务政策体系的研究,如高校图书馆、科研数据等,对高校数据治理政策研究的重视程度不够。
二、高校数据治理政策与研究现状
数据治理政策作为高等教育数据治理的一部分,在反映高等教育数据治理实践的同时,也是高等教育数据治理理论的映射。有学者通过文献梳理与分析,指出可行的数据政策是高校数据治理成功的关键因素之一。[4]而英国有研究机构调查并提出在高等教育环境下一份科学可行的数据治理政策应该包含的具体内容,其中包含角色与职责、组织与沟通结构、数据目录、数据存储、数据质量、数据安全和隐私等要素。[5]同时,也有研究者从高校数据治理政策角度调查高校数据治理实践工作。其对美国一流大学的数据治理网站内容与相关政策加以分析,发现不同高校具有不同的数据治理实践框架。[6]随着数据越来越渗透到高等教育各个环节,数据成为高等教育数字化转型的核心推动要素。可以看出,国外在这方面的研究相对成熟。我国的高校数据政策研究学者重点关注国外政策研究现状并对其比较分析和借鉴;同时,也对高校数据治理的实践与优化路径展开思考。[7-11]
基于此,文章通过对我国一流高校数据治理政策文件的分析与教育数据治理相关文献的梳理,试图探析高校数据治理政策的内涵与要点,通过对不同高校的政策文本统计量化与对比分析,准确把握政策要求和发展趋势,为我国高校数据治理决策提供参考,助力高校数据治理体系建构与数字化转型发展。
三、研究设计
我国1998年启动的“985计划”,目的是提高高等教育的办学质量与水平,这些一流高校在当前我国高校中起着示范引领作用,也往往更早将数据与高校科学研究、人才培养、教学管理工作融合,并加大数据治理的资金、技术投入,高校信息化建设迎来新的发展机遇。因此,研究以教育部公布的“985工程”名单中的39所高校网站为政策来源,在兼顾政策文本完整性与相关材料可获得性的基础上,搜集到我国14所一流高校的数据治理相关政策文件。这些数据治理相关政策命名有所不同,包括《校务数据管理办法》(4所)、《数据管理办法》(3所)、《数据安全管理办法》(2所)、《数据共享中心管理办法》(1所)、《信息化数据资源管理办法》(1所)、《数据资产管理办法》(1所)、《数据资源管理办法》(1所)、《教育数据管理办法》(1所),具体政策文件情况如表1所示。
表1 高校数据政策文件收集情况
文章采用政策文本分析的方法,以搜集到的14份高校相关政策文件为研究对象,每份政策文本内容为分析单位,逐一阅读、梳理所有政策文本内容。在数据预处理阶段,对14份文件逐一阅读,逐句确定含义唯一并可编码,由两名编码员编码,保证编码结果的准确性和可靠性。第一轮编码:以句为单位,根据文本含义归纳、分类,确保所有文本被纳入分析,获得初步探索性编码。第二轮编码:结合政策文本目录框架,逐一将初步编码组合、对比、归类,保证编码准确性与完整性,获得9个主要范畴框架,并进行数量统计与占比分析。第三轮编码:通过系统分析9个主轴编码形成的概念范畴,发现范畴之间的关联与逻辑,结合前期对高校数据治理相关理论与研究的梳理,确定“高校数据治理的关键要素”作为核心范畴,最终获得5个分析维度,包括“数据战略”“组织结构与职责”“技术与工具”“数据治理流程”“数据质量与安全”,如表2所示。最后,邀请专家进行验证,确定分析框架。利用分析框架,从五个分析维度对文本内容分类、统计关键词句频数,并对比分析不同高校数据政策在框架下的异同点。
表2 分析框架
四、研究结果及分析
1.发文时间呈现跟随国家相关政策的趋势
为了清楚直观地展现政策文件发文时间,研究扩大样本搜索范围,依据高等教育评价机构软科“2023软科中国大学排名”,将排名前90的学校纳入搜索范围,增加11份样本,共统计到25份政策文件,将其导入到Excel中进行分析,生成时间曲线图与累积图,具体如图1所示。
高校数据政策发布数量与年份存在一定规律,经分析可根据规律将时间段分为2014—2018年“萌芽驱动期”、2018—2021年“建设发展期”、2021年至今“变革转型期”。最初,数据管理办法的出台是为了解决高校数据治理实践中存在的问题,如治理标准与规范不统一、“数据孤岛”现象、大数据安全事件频繁发生等。2016年,《教育信息化“十三五”规划》出台教育数据管理办法,并且在《2018年教育信息化和网络安全工作要点》中得到细化。少量高校在这一时期制定了数据管理办法。随着《教育信息化2.0行动计划》的提出,教育数据管理制度建设积极推进,数据共享、数据标准研制进一步明确。在2019—2021年期间,大量高校相继制定数据管理办法并开展数据治理。2022年全国教育工作会议提出实施国家教育数字化战略行动。信息社会背景下,我国教育信息化从1.0时代走到2.0时代、从“简单应用”走向“深度融合”,教育数字化转型开启新征程。《教育基础数据》《数字教育资源基础分类代码》等一系列行业标准相继出台,《中华人民共和国个人信息保护法》发布,高校数据治理制度体系正逐渐完善。
2.逐步扩展为全校治理
我国数据治理采取从上至下的方法,体现在从国家法律法规、政策制度的提出与完善,到地方政策落实、高校实施。学者周炜调查发现,我国高校数据治理的牵头机构主要有校办、发展规划部门、信息化部门、大数据部门,[12]通过研究政策的发文主体可以看出高校数据治理重视程度以及组织方式。在14所高校中,11所的发文主体是学校,另外3所学校发文主体是信息化办公室或者网络与信息中心。从组织结构看,我国高校数据治理是学校层面的治理,与学校治理能力密不可分。如图2所示,大多数高校数据治理活动都得到学校委员会或领导小组形式的指定成员小组的支持(n=11,n是number的缩写,表示统计的数量,下同),且其中有1所高校专门成立数据管理工作小组作为数据治理的决策机构。同时,支持数据治理工作的第二大和第三大工作人员群体分别是学校信息化建设办公室、信息化与大数据部门,作为数据治理具体业务的执行机构,负责数据治理统筹规划、建设落实与技术支撑工作。其余3所高校在未成立领导小组的情况下,依靠信息化办公室与信息技术部门,负责数据规划建设、数据治理具体业务执行和技术支撑。可以看出,在高校数据治理决策领导和统筹协调方面,校办、信息化建设与规划部门处于主要位置;在技术支撑和数据资源建设方面,信息技术部门和信息化办公室位列前两位。在大数据技术发展的趋势下,高校面对大量的多源异构大数据,将数据治理视为学校治理的重点、影响自身创新发展的关键是极为必要的。
(二)样本政策文本分析
1.数据战略:推动业务数据质量提升和安全保障、服务高校建设发展
高校政策文本反映数据来源、数据范围、数据形式,明确“加强数据治理,服务高校创新发展”的数据目标,规范数据工作管理原则。
数据战略是高校数据治理工作的指引。首先,需要明确高校包含的数据范围及数据来源。“数据”多指来源于学校各单位或部门业务系统、形式上表现为信息化的数据,涵盖教学、科研、行政(管理、服务)等领域。对数据进行盘点是开展数据治理工作的第一步,有的学校(n=5)细化了数据范围和具体职能域,如人员身份、资产设备、教学科研、学术支撑、行政运行、服务保障。其次,需要清楚高校数据治理的目标。“规范或加强数据全生命周期的管理,提高数据质量与保障数据安全。”这是高校数据治理的基础目标,而高校要实现创新发展,更需要借助数据治理变革高校管理与服务,以期“提高学校信息化治理能力与服务水平、服务学校建设发展”。此外,北京大学还提及保护公共信息资源、维护个人信息权益。总的来说,在规范数据资源的采集、存储、共享、使用基础上,一些学校(n=7)侧重于通过开展数据治理工作推动学校建设发展,如“双一流” 建设、智慧校园、学校信息化、教育改革;一些学校注重充分利用数据资源,服务于学校教学、科研、管理、服务和可持续发展(n=3),提升治理能力和公共服务水平(n=2),以及数据质量控制(n=5)和保障数据安全(n=8)。最后,明确工作原则是什么。大多数政策(n=11)明确数据管理原则,主要包括管理与职责、技术规范、数据采集、数据共享与使用、数据安全与隐私等。统一管理和统筹建设是高校开展数据治理的共识,学校各部门分工协作,各司其职,需要建设统一的标准和制度规范;同时,从数据治理流程和全生命周期出发,保障数据安全、积极推进共享。
2.组织结构与职责:多元治理主体与管理体系的整合、协同困境
在大数据技术应用以及教育数字化转型浪潮下,高等教育数据治理早已不是早期单一的管理模式,而是多元治理主体与数据流通、协调互动的机制。[13]政策反映出高校数据治理角色包含数据治理委员会、数据治理工作组、数据利益相关者(业务部门、师生等)三类人员,三者组成的数据治理组织结构与数据治理流程、规则相协调,各司其职,构成高校数据治理统筹管理体系。研究发现:大部分高校数据治理工作取得了领导层的支持,但依赖全校信息化建设领导机构,参与实务不多;同一主体充当数据管理与执行的角色,信息部门是主要责任部门;数据治理执行工作依赖“提供—使用—管理”的权责机制。
一是数据治理工作取得领导层的支持。数据治理相关委员会或领导小组形式的领导机构在高校数据治理中充当领导决策的角色。除1所高校专门成立校务数据信息领导小组外,其余学校的该层面组织主体是作为全校信息化建设或网络安全领导机构存在的。作为全校数据治理的最高领导机构,有的负责重大事项的决策(n=5),有的掌握高校数据治理的顶层设计(n=2),有的负责统筹制定目标与战略(n=4);一些高校的相关机构还包括数据安全与过程监督(n=2)、数据目录与数据资源的统一规划制定(n=2)、指导制度制定(n=1)、工作协调推进(n=1)的责任。可以看出,领导机构更多的是具有决策职能,参与实务的很少。
二是数据治理工作组同时充当高校数据治理的执行者与管理者的角色。在数据治理相关委员会或领导小组的领导下,其办公室或工作机构作为数据治理的执行与管理主体,一般设在学校信息化规划部门或信息技术部门,工作组协同信息技术部门等校内部门开展数据治理。在未成立领导小组的高校,以信息部门作为数据管理的主体责任部门。在这一层面,数据治理工作组同时充当高校数据治理的执行者与管理者的角色,一方面负责组织协调工作,包括数据资源统筹规划(n=9)、统一标准和规范(n=9)、组织制度制定与业务指导(n=8);另一方面负责技术与保障工作,如定期开展治理与监督检查(n=10)、技术保障与分析应用(n=10)。可见,这一层治理主体连接领导层与数据利益相关者,负责统筹协调、组织落实与监督保障工作。
三是数据利益相关者,包括全校师生、各业务部门,以及数据分析应用服务人员。高校主要将业务部门及相关人员分为数据提供者、使用者与管理者来确定其职责(n=10);这一层面,高校对业务部门和师生制定职责规范,如遵守标准和规范、责任到人。部分学校(n=8)强调部门中的岗位责任与权限管理,如“信息化负责人为部门信息化数据资源管理的责任人;信息化专干负责部门信息化数据资源与数据平台对接、日常管理与运维”。在这一层面,大多高校都明确了提供、使用、管理的角色和职责。
3.技术与工具:技术工具的深入应用与数据治理体系的融合
从数据治理流程来看,数据治理技术与工具涉及元数据管理、数据质量管理、数据共享平台等。从数据政策来看,主要有数据目录、数据标准、数据中心与数据平台、数据质量监测工具等。研究发现,高校实现了数据中心与共享平台的建设,但未明晰数据目录管理、数据质量监测工具。数据治理不仅要加强看得见的有形技术工具应用,更要保障看不见的无形工具利用,才能提升数据治理的效果和效率,推动数据治理的可持续。
在高校数据治理初期,未形成统一的数据治理机制,各个部门分头管理,在实践中常常因为数据标准缺失和缺乏统一共享管理平台,导致“数据孤岛”、数据质量低下、数据难以共享等问题出现,这些都阻碍了学校信息化、数字化建设发展。14份政策文件反映出:随着高校信息化建设的发展,高校制定了全校统一的规范标准,配备了统一数据中心与数据平台。但是,在数据目录机制的建设上,仅有少数学校(n=5)提到数据目录的编制,确定目录编制维护的机构与责任。全面规范编制数据目录,形成覆盖全校各个业务系统、各个职能域一体化的数据目录,确保数据源唯一、数据合规安全,建立“目录—数据”关联关系,保障数据目录的及时更新,形成学校数据目录。这样一个数据目录制度的建设,是高校数据治理政策中尚待完善的部分。在数据质量提升上,大多学校建立数据质量保障机制,但仅有1份政策对数据质量检核规则、监测机制作出说明。高校治理面对海量数据的同时,要利用适合的技术与工具,在数据治理工作各个环节确保高效运行与大数据校园的高质量建设。
4.数据治理流程:规范数据治理全过程与数据服务高校创新发展的目标尚有差距
依据数据全生命周期管理原则,数据治理流程主要包括数据采集、存储与维护、数据共享和使用环节。分析发现的问题有政策文件中没有规范的数据采集流程完整说明、极为重视数据安全但数据安全管理机制落实不明确、数据分析利用不足等。
在数据采集方面,有10份政策单独提及数据采集,主要从采集原则(n=6)、流程规范(n=5)、数据要求(n=4)、权责明确(n=3)等方面作出规范。例如,坚持“一数一源”原则(n=4),保证数据的真实性、完整性、正确性(n=4)等要求。仅有3份文件提出:数据是否需要采集、数据目录范围外的数据如何采集,是需要进行充分论证的。规范的数据采集流程以及标准不适用情况的处理办法没有文件加以完整说明。数据的采集是数据建设的重要方式、提升高校数据质量的重要步骤,数据政策中这一部分内容需要进行系统、全面的说明和规范。
在政策中,数据存储和数据采集通常放在同一章节(n=6)。在11份提及存储的文件中,主要从两个方面作出规范:一些学校(n=6)强调数据的统一存储,以及相关部门和人员的权责;另一些学校(n=5)更多的是强调数据存储与运维的安全管理。数据存储不仅仅是管理部门和数据中心的责任,各个业务部门及师生都有其职责与权限。
数据共享和使用是数据治理的最后环节,保障数据合理安全使用,充分发挥数据资源作用、释放数据价值,是开展数据治理工作的最终目标。在具体共享政策中,仅有部分学校提及共享办法,如“以充分共享为原则,不共享为例外”的授权共享机制(n=7)、共享责任原则(n=6)、分类共享(n=5)。数据使用方面,除了对质量反馈、使用范围、操作权限等方面规范外,充分利用数据开展数据分析应用、进行数据挖掘分析、支持管理决策是高校数据使用的主要目标,但仅5所高校在数据政策中提及。高校需要通过数据共建共享、引导数据探索、充分挖掘数据应用,让教育大数据持续产生价值,推动高校数字化发展。
5.数据质量与安全:正在建立组织数据质量与安全共同体,但个人隐私保护方面仍需加强重视
(1)全过程质量管理,科学的质量监测机制
有8份政策文件将质量管理在单独章节提出。数据质量管理既是数据治理目标,也是重要组成部分,高校在实践中也存在数据质量低的问题。从政策来看,提升数据质量,一是需要建立全过程的质量管控体系(n=10),保证数据的真实性、准确性、完整性、规范性和时效性(n=7);二是建立数据质量责任体系与反馈制度(n=9),即“管理部门监管、使用部门和师生反馈、提供部门提升和优化”,各负其责,共同管理,有效提升数据质量;三是建立质量监管制度(n=10),如定期开展数据治理、开展质量检查与指导并发布报告(n=8)。数据质量的有效提升离不开整个组织全过程的管控,制定统一的规范和标准,定期开展质量检测、监督、考核都是提升数据质量的重要手段。
(2)极为重视数据安全,建设组织安全共同体
数据安全问题一直是高校数据工作中最大的担忧,数据泄露、数据隐私风险等问题频发,数据安全也在数据政策制定中占据重要位置。11份政策将数据安全作为单独章节提出,其中《同济大学数据安全管理办法》围绕数据安全作出管理规范。落实数据安全责任制度、制定安全规范与遵循原则、明确职责与权限在所有学校政策中都明确被提出。具体而言,有实行数据分级管理(n=10)、定期开展安全检查(n=10)、组织人员安全培训(n=4)等。在监督保障方面,有建立保障机制(n=5)、责任追究(n=6)、奖惩制度(n=2)。数据相关人员的安全能力提升培训与监督保障还需加强。
(3)对个人隐私保护的重视不足
在数据安全方面,高校从技术和系统安全上采取大量措施规避数据安全风险,正在加强统筹建设组织安全共同体,但欠缺数据相关人员的安全能力提升培训,以及对个人信息保护与数据应用伦理风险的重视。大数据嵌入高校治理不仅需要对治理人员、内容、流程、规则进行制度规范与设计,更需要防范技术应用带来的隐私风险。除2份政策仅在数据管理原则中提到个人信息外,还有8份政策强调在采集、处理、存储、使用时保护个人隐私,例如,遵循知情同意(n=6)和必要性原则(n=5),在公开时采取加密(n=1)、脱敏处理(n=3)等;同时,有学校将违规使用个人信息的情形纳入违反办法,并提及遵守《信息安全技术个人信息安全规范》。结果表明,部分高校政策反映出对个人信息保护的一定重视程度,但没有全面的考虑与规范,且还有高校完全未提及个人信息的保护。个人信息的保护是法律法规的要求,也是高校数字化发展必须重视与落实的原则。
五、问题与建议
(一)构建统筹管理体系,营造“数据校园”氛围
通过统一整个组织机构的数据治理理念与行动,完善数据治理制度并层层落实。数据治理组织结构包含数据治理委员会、数据治理工作组、数据利益相关者(业务部门、师生等)三层治理主体。构建与这三者治理主体相适应的管理体系:一是高校数据治理需要得到领导层的支持,坚持顶层设计与统筹管理原则。针对全校信息化建设或网络安全领导机构负责决策中,参与实务不多这一情况,可以设置专门的数据治理领导小组,保障全校参与治理。二是数据治理各个环节需要明确主体、层层落实,不仅包括信息部门的信息化设施建设,更要各业务部门协同开展数据工作。三是提高师生个人数据意识与能力,开展数据能力提升活动,营造全校数据氛围。
(二)规范数据治理全流程,让数据“汇起来、管起来、用起来”
规范数据治理,一是要盘点清楚全校数据资产并形成数据目录,将各类数据全面汇集并纳入管理,建立数据目录常态化更新机制。二是规范数据采集、存储、传输、共享全流程,建立质量监测机制。加强数据共享和利用,“倒逼”数据质量管理和提升。同时,数据治理全过程的规范与安全,离不开相关人员数据能力的提升。高校还需要建立数据人才培养保护机制,通过数据共建共享、推进技术应用和组织管理体系协同,充分挖掘数据应用,让技术发挥能力、数据释放价值。
(三)重视个人隐私保护,遵守应用伦理规范
《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》两部基础法律的正式实施,确立我国数据安全治理的基本制度框架。研究发现,由于早期数据安全问题频发,高校极为重视数据安全,但仅有少数高校在政策中提及个人隐私保护。对此,一方面,高校在数据治理中,要加强个人信息保护。在采集个人信息时,要注意合法性、合理性,如明确知情同意和必要性原则;在信息存储、传输过程中,要防止泄露问题,采用加密、脱敏技术等保护个人隐私安全;在数据分析应用时,应考虑个人隐私,并提高师生的信息安全意识。另一方面,高校利用数据这一重要资源挖掘和开发应用时,需要遵守应用伦理规范,保障数据的规范与创新应用。
参考文献:
[1]教育部.关于加强新时代教育管理信息化工作的通知[EB/OL].(2021-03-15)[2023-06-20].http://www.moe.gov.cn/srcsite/A16/s3342/202103/t20210322_521669.html.
[2]范式再造:主动求变的实践——《无限的可能:世界高等教育数字化发展报告(2023)》节选二[J].中国教育信息化,2024,30(1):18-38.
[3]Dama International. The DAMA guide to the data management body of knowledge[M]. Denville: Technics Publications, 2009:37.
[4]MOHAMED A K. Data governance critical success factors on university policy document[J]. Indian Journal of Science and Technology, 2019,12(18):1-5.
[5]Plaid Consulting. Surveying data governance policy
models[EB/OL]. (2021-03-29)[2023-03-22]. https://www.bccat.ca/reports/DataGovernance2021.pdf.
[6]JIM CARY-K, CHANG HSIA-CHING. The current state of data governance in higher education[J]. Proceedings of the Association for Information Science and Technology, 2018,55(1):198-206.
[7]彭雪涛.美国高校数据治理及其借鉴[J].电化教育研究,2017,38(6):76-81.
[8]刘冰,王晋明,晁世育.英、美、澳高校科研数据管理政策实证研究[J].情报理论与实践,2021,44(8):59-67.
[9]周雷,杨萍,燕娜,等.德国高校科研数据管理服务现状和启示[J].情报杂志,2021,40(7):166-173,133.
[10]胡水星,荆洲,王会军.我国高校大数据治理体系的关键要素与优化路径研究——基于DEMATEL-ISM的研究视角[J].电化教育研究,2022,43(11):38-44,52.
[11]谢雷,陈丽,郑勤华.“互联网+”时代数据治理的内在逻辑与实践路径——“互联网+教育”创新发展的理论与政策研究(四)[J].电化教育研究,2022,43(4):12-18.
[12]周炜.大数据视域下高校数据治理优化路径研究[J].教育发展研究,2021,41(9):78-84.
[13]宋苏轩,杨现民,宋子强.高校数据治理统筹管理体系的构成与实践路径[J].中国远程教育,2021(11):58-67.
(Educational Technology Institute, Beijing University of Posts and Telecommunications, Beijing 100876)
Keywords: Data governance; Data governance in higher education; Data governance policy; Policy text; Text analysis; Grounded theory