首页  ·  知识 ·  大数据
应该尽力避免的4个大数据管理错误
网友  ibm中国  实践应用  编辑:Barbara   图片来源:网络
尽管您的业务部门需要数据才能制定明智的决策,但业务部门常常会犯一些错误,导致数据收集、数据存储和数据管理成为业务运营的障碍。

每个人都有自己的系统

国防合约商 Raytheon 在一次重要的成本削减审核中发现,公司不同的站点和部门使用着十几个不同的产品数据管理系统,这使他们花费了数千万美元的不必要成本。 

 

该问题的解决方案是将所有数据整合到一个系统中并扩展您的数据中心,使数据的管理变得更容易且更经济,同时确保每个人都使用相同的数据来制定决策

 

新项目和传统基础架构

由于惰性,企业常常使用传统系统。您已拥有它,而且您的员工知道如何使用它。转移到新的软件和业务流程将会暂时中断运营,而且需要前期成本。一些企业试图通过更高级的数据迁移工具迁移到新数据存储系统来获得大数据的收益,但他们试图在其传统硬件上运行这些系统。这是一种错误做法。支持分布式计算和大型数据存储库的最佳方式是,采用专为新数据架构设计的硬件。尽管您或许能够在旧服务器上运行虚拟服务器,但如果尝试为的“云”集成新的、改进的服务器时,就会遇到问题。请在迁移数据时升级硬件

 

我们需要所有数据

一种错误的假设是,您需要收集尽可能多的数据,才能定 Peter Drucker 在科学管理诞生之初提倡的数据驱动的决策。最终结果是,尽管一些数据有所帮助,而且越多越好,但您不知道如何处理它。这导致组织收集了一些他们无法预见其用途的数据,既浪费了时间,又浪费了精力;同时,在数据存储和数据管理软件上花费了更多的钱。管理人员想利用这些工具查找正确的数据集来用于分析,从而得到答案,但更复杂的数据挖掘工具会使情况变得更复杂

 

结构带来了太大限制

许多企业错误地没有对其数据应用结构。他们没有对文档名称使用严格的格式,并试图确定有哪些对象。他们没有使用描述性元数据来描述各项,所以搜索器就无法使用明显的关键搜索词汇来查找数据对象。另一个问题是未能在导入时对数据进行清理,使标题中的撇号在文档标题中变成了“*&&#@”。这使得搜索器很难按正确名称进行搜索。 

 

在文档创建者或项目以外忽视对数据的分类,这意味着人们必须费时又费力地处理不必要的文件

 

结束语

不要再继续收集数据库和数据管理系统了;从长远来讲,将它们结合起来可以更好的提高效率和降低成本。绝不要在传统硬件上安装现代数据库、云服务器,甚至“数据湖”。不要收集您希望能在以后使用的不必要的信息。在上传数据并在系统间迁移数据时,对数据应用结构


本文作者:网友 来源:ibm中国
CIO之家 www.ciozj.com 微信公众号:imciow
   
免责声明:本站转载此文章旨在分享信息,不代表对其内容的完全认同。文章来源已尽可能注明,若涉及版权问题,请及时与我们联系,我们将积极配合处理。同时,我们无法对文章内容的真实性、准确性及完整性进行完全保证,对于因文章内容而产生的任何后果,本账号不承担法律责任。转载仅出于传播目的,读者应自行对内容进行核实与判断。请谨慎参考文章信息,一切责任由读者自行承担。
延伸阅读