从数据层面的角度,探讨采用数据共享方法解决应用系统互联互通的问题,然而文章仅从数据交换角度讨论数据交换的实现方案,忽略了建立完整且可执行的统一信息标准体系这一基本前提。事实上,在校园内存在两大类的数据共享交换需求,一类是跨部门应用的公共环境数据,如学生基本数据、教工人事数据等,另一类是学校领导层关心的汇总统计数据。从校园信息建设的整体出发,共享数据中心的建设是系统地解决数据共享的有效途径。
共享数据中心平台,一方面担任数据中继的角色,将源应用系统的数据分类存放到对应的主题数据库并基于主题库将数据路由到定制数据的目标系统;另一方面作为校同的数据集市,为数据挖掘工作提供了现实的数据基础,为智慧型校园的实施奠定了基础。
共享数据中心实施的重心在于共享主题库的分类组织与上下行数据的相互准确转换,因此在数据共享环境下统一信息标准的建设尤其重要。文中基于《CELTS一33一高等教育管理信息标准》并结合实际项目,从信息共享的角度研究与探讨高校统一信息标准的制定与实现方案,并就统一信息标准的拓展应用进行了论述。
1统一信息标准的意义
统一信息标准是参照教育部就高等教育信息标准、国家通用标准及行业通用标准,综合校园内各类应用系统的数据(含业务数据及统计数据),建设一套权威的可执行的信息标准集。实现校园统一信息标准,具有如下重要意义与作用:
(1)信息标准化虽不是一个具体的应用系统,但属于信息化校园的重要基础工作,是打通各个校园内各个信息点的桥梁与枢纽;
(2)在国家相关教育信息标准的基础之上建立的信息标准库及基础数据库,并将应用系统建立在对基础数据库的引用之上,是有效解决信息共享的方法;
(3)确立信息标准,是信息一致性与完整性的有力措施,可以实现对现有系统的归并,实现旧数据的归纳与重用,容易找出信息化建设的薄弱点,指导信息化的深入开展,提升信息化建设水平;
(4)高校信息化的广泛开展,必然会引起应用系统之间的交叉引用,统一信息标准将解决在实际业务之中由于各应用系统信息存储及表示格式不一致而带来的种种问题。
2 统一信息标准制定与实施
信息标准的制定并不是一蹴而就的事情,相反由于它涉及到的应用系统及人员众多,甚至与各部门自身的利益相关,因而标准化的工作任务艰巨。作者所在单位在进行数据整合项目过程中,为统一信息标准的制定工作,形成了由院领导牵头、各业务部门配合及信息中心组织与实施的三级层级结构,加大了标准化工作的便利性。
在信息标准的制定与实施过程中,遵照如下几条规则:
1)涉及到国家或教育部相关标准时,严格遵照已颁发的标准,如数据项名称及取值,严格按照相关标准执行;
2)满足学校的管理需求,包括日常办公及信息管理的需求;
3)当数据管理存在多种信息标准时,根据面向对象的频率选择对应的信息标准,如资产信息在当前高校管理当中,存在国标《固定资产分类与代码》、教育部《高等学校固定资产分类与编码》以及科技部的《科学仪器设备分类编码表》等三套编码体系哺。,由于高校每年需要向教育厅提交高基表,向上汇总的主要对象足教育部,因而采用教育部的标准;
4)在涉及到的数据没有官方执行标准时,依照“谁主用,谁产生,谁维护”的原则,将数据源所在应用系统的数据规范做为该数据体系的标准,形成学校自定标准。
2.1信息标准的层次
为了实现信息有效交换与存储,需要将数据进行分类。分类时,参照高等教育管理信息标准,将数据集分为数据子集、数据类、数据子类以及数据项。数据子集为各类数据的归并档案,是数据类的集合。数据类是描述同一对象(业务环节)的相关数据项的集合,数据子类则是根据业务环节的需要,将数据类按对象的独立性与相关性进行进一步划分。数据项则是具体的信息描述,是具有独立含义的最小标识单位,由编号、数据项名、中文简称、类型、长度、约束、值空间、解释/举例和引用编号等构成。信息的分类存放方法与主流的面向对象思想十分吻合,较好地反映出“信息一信息”以及“信息一信息集”之间的关系,图1是数据子集、数据类、数据子类以及数据项之间的关系图。
图1 信息标准的分类方法与面向对象的层级结构
按照以上信息结构可结合学校的主要业务活动,构建适合学校校情的数据集,信息标准工作小组可以从“人一财一物一管”等四个角度进行深度挖掘。涉及到“人”的角度,可以分别创建学生数据集、教工数据集;涉及到“财”的角度,可以创建财务管理数据集;涉及到“物”的角度,可以创建资产管理数据集;涉及到“管”的角度,可以创建教学管理、科研管理、办公管理等数据集。
2.2代码集的建立
代码足制定与执行信息标准的重要基础,是信息标准中数据项的取值空间,严格定义了数据的格式及取值范围。高教管理信息标准中定义了四个代码子集,分别是国家标准代码子集(GB)、教育部标准代码子集(JB)、高教行业标准代码子集(HB)以及学校标准代码子集(XB),这样分类清晰,给各学校留有自定义编码的空间。
在实施代码库时,可以参照标准中的代码库,根据学校自身情况进行取舍,构建出适合学校应用的代码库,如人的性别代码、民族代码、政治面貌代码、学位代码等均有相关的国家标准代码,可以直接取用。而对于标准代码库中就同类数据的取值有冲突的情况,在选择代码库时,可参照第2节中规则3),根据数据应用的频率来定,如资产类数据代码一般选择高教行业标准代码子集。对于没有相关标准代码做参考时,可以根据正在使用的应用系统的编码体系制定出符合实际情况的代码集,如高职院校的部门代码可以根据学校的架构,采用各部门约定的规范进行编制,如经济系代码为“01”,外语系为“02”,然后以此构建出学校内的专业代码,如“0101”表示物流专业,“0102”表示电子商务专业,由此可进一步构建班级及学生学号的编码规则(见表1)。
2.3信息标准的管理平台
信息标准的制定不是静态的工作过程.而是动态的管理过程。需要在实践中不断应用、不断修订、不断完善,即需要引入信息标准的动态管理机制。文中采用定制的管理平台实现信息标准的部署、实施与管理。管理平台包括二个主要功能模块,其一是数据子集的管理。包括数据子集的管理(新增、编辑、更新)、数据类的管理(新增、修改更新)以及数据项的管理(新增、修改、删除);另一部分为代码集的管理,实现新增代码子集,新增代码;第三部分是标准比照模块,能够将现有业务系统的数据字典与标准库进行对照,构建出业务系统的标准评判休系,进而指导业务系统建设的规范化。
3统一信息标准的应用
统一信息标准的建立,是信息交换的枢纽,对于全校的应用系统数据共享具有十分重要的作用。
3.1建立全局共享数据库
基于统一信息标准,构建全校的共享数据库。文中在实现共享数据库时,依照标准创建了六大主题库,包括学生库、教工库、教学管理库、科研库、财务库、资产库。各个库的定义严格参照信息标准体系,即数据表的定义参照信息标准中的数据子类,表中的字段属性参照信息标准中的数据项,这是通过标准可实现的部分。然而标准付诸于实践的过程中,还有一部分不确定因素需要结合实际的业务才能确定,即标准的应用不能生搬硬套,需要灵活应变:
1)共享库中数据表的主键约束需要根据实际情况来考量,如学生基本信息表中学号为主键,而在学生成绩表中,学号并不能做为惟一主键;
2)数据项之间的引用与关联需要通过合适的外键约束予以实现,如科研主题中与教工号有关的属性应与教工本信息表中的教工号做外关联,即通过设置外键保证数据的完整性;
3)数据项的值域与代码库的关联,只能通过第三方工具进行转换才能实现。
图2与图3是共享库与标准对应的设计界面,图2为共享数据库与后台实现对应的物理数据表,图3为学生库中学生基本信息的表结构,其中民族代码、性别代码等的取值均参照代码集中相关的标准,因而引用了对应的参照表。
3. 2基于倍息标准的数据交换
如前所述,统一信息标准建立后,可以在共享数据库的基础之上基干信息标准实现应用系统之间的数据交换,优化跨部门的办公流程。数据交换时,需确保同一类型的数据只有一个源头,如按照现行的高校管理体制,学生的基本情况信息由学工系统产生,因此在全校信息交换流中、凡与学生基本情况相关的数据均采用学工系统提供的数据,这样以来保证了数据的权威性,这是数据交换工作要解决的一个问题。除此之外,还必须保持各引用数据与数据源的一致性,即保持数据产生方与数据引用方的同步更新,这是数据交换工作要解决的另一个问题。
数据同步交换的基本思路是,先将数据产生方的数据抽取并按标准进行转换清洗之后存放至对应的主题库,引用方引用主题库中的数据并转换成对应的目标格式。如心理测评系统中需引用学工系统的学生基本信息(见表2),需将共享库中的学生基本信息(见表3)推向心理测评系统并进行格式转换,可以借助第三方的中间件工具予以实现,如可采用金蝶中间件公司的AESB(金蝶企业服务总线)中间件解决方案,实现将数据从源端推向目标端并实现字段匹配与值转换。
表2心理测试系统需要的学生基本信息
4结束语
高校信息化建设是一个不断发展的过程,在这个过程中,信息资源的有效整合是一个必然的过程,通过整合可以实现现有应用系统之间的数据交换与共享,而信息的标准化是数据交换的关键。然而由于各高校的具体情况各有不同,信息标准化在各校实践过程中存在许多不同的地方,需要结合实际情况进行标准的研制与应用,而这将必然优化高校信息化工作的成果,文中正是从这个立场研究了信息标准的制定与应用过程,旨在探讨将标准付诸于实践的过程要领。
CIO之家 www.ciozj.com 公众号:imciow