企业数据资产目录的建设步骤
CIO之家的朋友 CIO之家的朋友们

为什么要建数据资产目录




通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。数据资产目录的准确性,也决定了应用时的效果。

  • 数据在哪里:业务部门能够通过数据目录查询到现有数据资产情况以及索引对应的系统表字段,定位权威系统数据来源。

  • 数据谁负责:在数据质量检核规则发现问题时,根据字段所属的数据资产来确定数据质量问题的牵头整改责任归属。

  • 数据如何用:精准定位数据所在系统/表/字段,提升数据提取需求的准确性和效率;打通系统间形成的数据孤岛,实现编码规则等标准的统一规范、使数据互联互通。


一个实用友好的数据资产目录,能够打通查数/取数环节、打通基础类数据和指标类数据的联系,并通过人工智能和机器学习等先进技术,更好地支持数据的探查和关联推荐。

image.png

如何建设数据资产目录




我们在进行数据资产目录构建时,需要结合数据资产类型,定义数据资产的属性,不同资产类型对应不同业务属性,管理属性,应用模式、资产目录视角等,达到千数千面的效果,最终形成数据资产权威、可信、可用的企业级数据资产目录。

第一步:数据资产梳理

数据资产管理最重要的是,企业如何确定哪些数据能够作为资产进行管理,并进行应用。识别企业自身的数据资产,一般用5个方面衡量:

  • 业务权重:这个数据是否属于核心业务的运营范畴;

  • 角色群众:这种数据对高层的决策是不是会带来直接的影响;

  • 指标数据:一般情况下,95%的数据指标都可以放入到数据资产;

  • 使用频率:频率越高,说明数据重要性越高;

  • 技术存在与可控性:通过一些技术手段,能够对数据进行一个获取,维护,管控的状态,管控程度与可控性,都是辅助的一个数据指标。

image.png

以上划分维度和标准,企业可根据自身实际情况进行扩充或调整,最终目的是制定符合企业实际业务需要的数据资产划分标准,进一步筛选出企业自身的数据资产。然后是通过技术元数据、业务元数据、管理元数据将数据资产的业务权重、决策权重、使用频度、分布范围以及技术承载与可控性五类属性进行配置。

第二步:数据资产目录体系框架设计

以业务领域构建资产目录为例,可以通过资产盘点,梳理银行数据主题分类/核心业务板块,再根据业务要素逐步向下划分二级目录、三级目录,最后到叶子结点的信息项上。信息项的定义也是从业务出发,梳理业务板块都有哪些数据内容,例如客户信息包括:客户名称、联系方式、地址、证件类型、证件号码等。


image.png

第三步:建立数据标签体系,完善分级分类

image.png

在数据资产分类中,以目录结合标签的形式进行数据资产分类,通常以系统主题、业务主题、组织架构主题3个维度作为目录视角,其它的维度作为标签。上图中可能罗列得不是很全,但是分类的方法和维度应该对大家有所帮助,我们可以分为系统主题、业务主题、行业、组织架构主题、资产类型、服务分类、安全主题、资产形态主题等。

image.png

每一个数据资产具备多个属性,同样也归属于多个分类。按照不同的业务域、应用系统、重要程度、数据分布、更新频率、资产类型、安全等级、保密等级等维度,构建资源标签体系,完善资源画像,使各类数据消费者都能快速发现和获取需要的数据。

第四步:数据资产分布与映射关系建立

在技术元数据采集的基础上,探索信息项所属系统来源,确认其系统分布情况,将数据资产信息项与物理表/字段间构建映射关系,并确定权威数据来源。对于单个业务系统而言,只需要将主表中经过分析最准的内容映射过来,而不是所有表,避免数据使用者因为多表冗余存储造成混淆。

我们以“客户中文姓名”这一信息项为例,梳理数据来源与系统表映射关系如下:

image.png

第五步:构建企业数据资产目录

数据资产目录应满足不同角色用户的数据消费需求。基于“业务域-业务子域-业务活动”的架构思想,建立业务视角数据目录模板;基于资源类型、存储位置、安全等级、使用频率,生成技术视角数据目录;同时数据资产目录应能支持数据目录管理、资产查询、资产分析以及资产交换等场景。

image.png

第六步:数据资产目录应用与管理

构建好数据资源目录后,需要进一步体现数据资产的价值,对于库表、文件等常见数据资产,可以开放数据查询、下载、交换、分析以及API服务。资产的价值在于向数据消费者的提供各类数据,资源管理者可以通过构建数据资产服务门户, 满足不同消费者的服务需要,也便于对资产的持续管理。

image.png

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢