数字文档管理平台助力知识型企业发展
廖爱明 许建军 网络
     1、前言

  在经济全球化的知识经济时代,知识的积累和传播呈倍数递增。信息数据的冗余、杂乱、流失、利用率低下等问题已成为企业成长的烦恼。知识管理是知识经济发展的必然要求 ,是知识社会管理方式的重大变革。文档管理是企业知识管理最为基础的一项内容。适时的、不受地域和组织形式限制的获得基于文档内容的知识,正是知识管理的一个主要目标。美国Delphi咨询集团的一项调查表明,在组织所获取的知识中,大约46%是以文本和电子文档的形式存在的。IBM Lotus公司在其企业知识管理软件产品白皮书中有言:“文档是知识的容器,是已经物化的显性知识,其中蕴涵了大量本企业的知识财产”。在知识成为创造一切价值根源的今天,深入研究企业级数字文档管理平台的建设具有重要的意义。

  2000年左右,数字文档的管理在中国落地。在软件公司、咨询公司等实践企业的推动下,越来越多的企业开始关注数字文档管理。各类数字文档管理系统如雨后春笋般出现在市场上,如国外的IBM FileNet,Share Point等,国内有SOP-PRP、紫光、德雅、易度等。但是,不同企业产生的文档具有不同的特点,特别是文档结构非常复杂的石油上游行业,很难在市场找到一个现成的完全贴合自身需求的文档管理平台。2005年左右,国内三大石油公司也开始了建设数字文档管理平台的探索,很多油田建立了自己的数字文档管理系统。通过调研发现,这些系统各具特色,实现了档案资料的网上提交,网上借阅等功能,但如何确保知识文档的有效沉淀,如何对庞杂的文档进行分类,如何使文档得到有效利用等问题尚未得到有效解决。笔者结合中海石油(中国)有限公司天津分公司数字文档中心的建设经验,讨论如何构建适合于石油上游行业的企业级数字文档管理平台。

  2、石油上游行业文档的特点

  石油行业由勘探、开发及生产等多个环节构成。每个环节又包含了许多的专业。如勘探环节包括测井、测试、地质、物探、矿区管理等,开发阶段包括ODP设计、岩石物理、随钻等,生产则包括油藏管理、平台设备管理、生产工艺等。除此之外,还有各类研究、综合管理、财务、商务、工程及安全环保等综合管理方面。以上各个环节均产生大量的文档。因此,石油上游行业产生的文档具有总量大,种类多,所涉及专业面广,不同专业的用户使用文档的习惯差异性大等特点。除此之外,很多领域的资料保密要求高,如重力、磁力资料属于国家机密资料,各类勘探成果及储量信息也属于企业内部资料,这给文档管理的保密性提出了更高的要求。

  3、总体目标

  数字文档管理平台建设的总体方针是以信息技术为手段,以资料的有效沉淀、有序管理和高效使用为目标,以知识管理理念为导向,建立石油上游行业统一的数字文档管理平台,实现各部门、单位文档资源存储虚拟化、信息传递网络化、信息检索智能化、用户使用方便化,确保文档资料得到持续积累、有效利用和快捷共享,真正的服务于油气勘探、开发、生产、工程、综合管理等。

  4、系统设计

  石油上游行业文档资料的特点为数字文档管理平台的设计和建设提出了新的挑战。采用科学的系统架构,合理的文档分类和属性管理方法,周密的安全措施、高效的文档检索利用手段是构建企业级数字文档管理平台的关键。

  4.1系统架构

  对于所有企业来讲,产生的文档主要包括三类:其一是公司所有员工的工作过程文档,该类文档通常保存在员工个人办公电脑中,未进行统一管理,得不到充分共享,容易随着员工的变动而丢失,这里我们称之为个人文档;其二是企业归档范围外的由部门或内部组织进行管理和共享的文档,该类文档一般为阶段性成果,这里我们称之为公司文档;其三为公司进行统一管理的档案,一般为企业的最终成果,具备很强的规范性,这里我们称之为公司档案。公司档案无疑是公司的知识财富,绝大多数的企业对其进行了实体档案的管理。但有统计显示,60%以上的认识、体会、经验和教训存在个人文档和公司文档中。三类文档反映企业文档形成过程,也是企业文档生命周期中的三个重要阶段,相互之间是一个有机的整体,必须整体考虑,统一规划与建设,才能走上良性循环的轨道。同时三者在管理和使用上又各具特点,在管理上应采取不同的策略。中海石油(中国)有限公司天津分公司数字文档管理平台围绕“一条主线、两类应用、三个中心、四种角色”进行建设,使错综复杂的石油上游行业文档管理变得简单有序。(见图1)
 

 

一条主线即以文档生命周期为主线,记录文档从产生,修改、应用、归档、销毁整个过程;两类应用即面向文档使用者的文档应用功能和面对文档管理者的文档管理功能,使文档的管理与应用并重;三个中心即个人文档中心、公司文档中心及档案中心,分别用于管理个人文档、公司文档及公司档案,确保各类文档得到有效沉淀;四种角色为个人用户、公司文档管理员、档案管理员及系统管理员,四种角色明确分工,各司其职,保证文档管理与使用的规范性。

  4.2文档类型与属性管理

  企业在进行文档管理时,通常会被两个问题困扰:其一,企业的文档资源内容庞杂、体系繁多,如何通过一个统一的体系对这些知识进行分类;其二,当面对海量的文档,用户如何才能快速地定位、检索到所需的文档内容。目前大多数企业按照专业或组织机构进行分类,并为文档定义相关属性以便于用户查找文档。这种方法对于金融、保险、销售等业务相对较单一的企业来讲,无疑是一种不错的解决办法。但对于专业庞杂的石油上游行业而言,这种简单的分类和属性定义方法不能完全解决问题。首先,根据组织机构分类文档无法应对企业组织机构多变的特性;其次,由于所涉及的专业和领域太多,专业间存在相互交叉,给文档的管理带来诸多不便;最后,不同的文档具有不同的属性,各类文档属性的集合将会超过几百个甚至更多,如何组织这些属性也将成为文档管理的负担。中海石油(中国)有限公司天津分公司数字文档管理平台使用了“聚合层级分类”与“属性继承”的全新文档管理思路,成功的解决了上述问题。
 

 

 
图2 文档类型与属性管理示意图

  基于“聚合层级分类”和“属性继承”的方法遵循以下三个原则:第一,属性唯一性原则,即一种属性只在一个文件类型中出现,反之,不同的文档类型具有不同的属性;第二,每个用户面对的文档类型数量不宜过多,降低用户判断某篇文档所属文档类型的难度;第三,尽量减少每个文档类型的属性数量,避免用户在填写文档属性时出现与所上传文档无关的属性。

  何为“聚合层级分类”。所谓“聚合”是指将属性相关性高(具有相同或相近的属性集合)的文档归为一种文档类型,这种分类标准具有唯一性和持久性,有效避开专业复杂和组织机构多变带来的困扰,使错综复杂的文档分类变得简单;所谓“层级”是将多类文档的属性交集提出作为其共同的父类文档的属性(如图3所示),依次类推,形成如图2所示的文档类型层级树形结构。
 

图3 聚类层级分类方法示意图
 
Ⅲ = { x | x ∈ⅠΛ x ∈Ⅱ}

Ⅳ = { x | x ∈ⅠΛ x Ⅱ}

Ⅵ = { x | x ∈ⅡΛ x Ⅰ}

“聚合层级分类”是“属性继承”的基础和前提。我们将每种类型的属性分为“私有属性”和“公有属性”,子类型自动继承父类型的公有属性(如图4)。不同的文档类型具有各自的权限并向上继承,即父文档类包含所有子文档类的用户权限。


 

 
通过上述的文档类型和属性的管理方法有效的解决了石油上游行业文档种类多,专业繁杂等问题。其一,父文档类包含了子文档类公共属性的集合,这有利于统一不同层级的文档的公有属性,实现文档管理的标准化和规范化。其二,修改某文档类的公共属性信息时,其子类文档将自动继承该修改,而其平级或父级文档类型不会受到影响。这提高了系统维护的方便性和灵活性,减少了维护的工作量并降低了出错率。 其三,文档类型的权限管理使每个用户只能看到与自己工作有关的文档类型。企业总的文档类型可能很多,但每个用户可使用的却是有限的,避免了文档管理和利用时相互干扰,大大提高了系统的易用性。
 
4.3目录结构与条目模板

  目前,国内大多数数字文档管理系统及相关文章介绍中把文档类型和目录结构视为同一概念,认为文档的分类在系统中表现出来的就是文档的目录结构。对于小型企业及简易的文档管理平台,上述两个概念的统一无疑降低了用户对系统理解的难度。但对于大型企业的综合性文档管理平台,必须将文档类型和文档目录结构两个概念分离,使其在系统中发挥不同的作用。按照聚类层级分类方法进行文档的分类意味着文档类型与企业的组织机构和专业结构没有直接的联系。然而,企业的文档管理及文档的安全策略往往直接与企业的组织机构和专业息息相关,比如部门的文档往往由本部门进行上传和维护,专业人员往往查询和使用本专业相关的文档。因此文档在系统中按照机构和专业进行组织是不错的选择。

  所谓目录结构,类似于Windows本地磁盘上的文件夹结构,在系统中组织文档的存放位置。目录结构与文档类型没有直接的联系:同一目录下可以存放不同类型的文档,同一类型的文档也可存放在不同的目录中;目录结构的改变不会影响文档的类型及属性。目录结构具备易于改变的特性(可以像操作本地硬盘文件夹一样进行目录的增、删、改、合并、移动),能够适应企业组织结构的不断变化及专业领域的不断扩充。目录结构具有自己的权限体系,不同的用户具有相对应目录的操作权限。

  目录机构与文档类型的分离解决了文档类型相对固定与企业组织机构不断变化间的矛盾,但增加了文档维护的难度,比如在上传一篇文档时既要选择文档类型又要选择存放目录。普通用户很难理解目录结构和文档类型的区别和各自的作用。条目模板的引入将有效解决上述问题。所谓条目模板,就是根据文档的管理要求由管理者预先设定目录与文档类型的对应关系,同时设定该条目模板对应文档的缺省属性值与缺省安全策略,使得用户上传文档到某个目录时系统根据条目模板自动设定该文档所属类型、默认属性和默认安全。目录、条目模板、文档类型的对应关系如图5所示。
 

 

 
4.4文档生命周期管理

  石油上游行业文档资料具有总量大、增长快的特点。以中海石油(中国)有限公司天津分公司为例,历史档案资料的容量超过20T,公司文档与个人文档超过15T,预计这些文档每年以倍数递增。不断增多的文档资料如不能合理管理,将成为数字文档管理平台发展的瓶颈问题,同时也将使文档检索与利用的效率越来越低。

  文档生命周期管理能有效的解决上述问题。所谓文档生命周期是指文档从产生、应用、归档到最后销毁的整个历程。文档应处于生命周期的哪个阶段应根据文档存在的价值所决定。文档生命周期的管理是指系统按照一定的策略自动判断每篇文档的存在价值,从而对文档进行相应操作。例如:数字文档管理平台的后台存储分为高端存储、低端存储和回收站,如果文档A年平均访问次数<10,系统自动将其从高端存储移到低端存储;经过若干年后,该文档的年平均访问量<2,系统自动将文档放入回收站,并在必要时删除。(见图6)
 

 

 
         图6 文档生命周期管理示意图

  通过文档生命周期的管理,避免了文档存储空间的无限增长,保证了高价值文档的访问速度。

  4.5文档安全管理

  电子文档具有易于扩散,传递速度快的特点。对于保密要求高的石油上游行业来说,采取强有力的文档安全管理尤为重要。在中海石油(中国)有限公司天津分公司数字文档管理平台中,采取了全程文档安全控制(如图7所示)。
 

 

 
 
 
全程安全控制由在线安全和离线安全两部分组成。所谓在线安全是指文档在数字文档管理平台上的权限管理,即用户或者用户组对应某文档的权限(包括所有者控制、升级版本、修改内容、修改属性、查看内容、查看属性及发布7种权限)。这种细粒度的权限控制有效的保障了文档在系统中的保密性。

  当具有权限的用户把文档下载到本地以后,在线的文档安全将无法继续对文档安全进行控制,这时,需要离线安全控制接力文档安全控制,并记录文档的操作日志和流向,实现真正的文档全程安全控制。离线安全由加密网关和客户端防扩散工具组成。用户须通过加密网关下载文档,网关根据安全策略对文档进行加密处理,客户端防扩散工具对加密文档进行解密并根据当前用户具备的离线权限进行控制(包括阅读时间、阅读次数、外发、拷屏、打印等控制)。(见图8)
 

 

图8 离线安全控制设计示意图

  4.6文档搜索与利用

  4.6.1自定义目录树

  石油上游行业涉及的领域广,专业多,不同领域、专业的用户对文档的组织方式大相径庭,例如钻井人员希望按照井名对文档进行归类,地质人员希望对地质层位进行归类,商务人员希望按照合同编号对文档进行归类,等等。面对如此多的用户种类,系统无法定义出满足所有用户的文档目录树,也不可能为每个用户定义不同的文档目录树。

  所谓自定义目录树,是指系统为用户提供方便快捷的编目工具,让用户自己定义所需的目录树。用户依次选择用于文档编目的文档属性,系统自动按照选定的属性对文档进行组织。例如,张三依次选择了文档属性井别、井名作为文档编目的依据,系统将自动为其生成如图9所示的目录树。
 

 

图9 自定义目录树示意图

  4.6.2文档搜索

  当文章的数量积累到几十万篇,甚至更多的时候,用户在检索这些文档的时候就会遇到困难,无法找到想要的文档,或者输入主题词后的文档远远超出需求,犹如大海捞针。强有力的文档搜索功能是数字文档平台赖以生存的关键。中海石油(中国)有限公司天津分公司数字文档中心提供三种文档查询方式,其一是简单搜索,用户根据文档标题、作者对文档进行查询;其二是全文检索,用户输入关键词进行文档查找,通过对关键字进行约束(包括多个关键字的或、与、临近关系),使全文检索具有较高的命中率;其三是多维条件查询,用户可以任意组合文档类型,目录结构,文档属性、全文关键字四个维度进行文档精确定位。

  5、结束语

  企业文档作为企业活动的记录,凝结了企业员工在从事各项活动过程中获得的认识、体会、经验和教训,是企业知识的“沉淀容器”。数字文档管理平台的建立是企业跨向知识管理的第一步,它是文档与知识的网上银行,也是文档与知识的共享与交流平台。其将不断积累知识经验,使知识成为企业增长的内生力,使企业不断向智慧型蜕变。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢