近几年,各种驱动在天上飘,有产品驱动、技术驱动、政策驱动还有老板驱动,大数据也不甘寂寞,于是乎“数据驱动”一词渐渐热了起来。很多企业都说自己在搞数据驱动,也有不少从事数据技术的公司在对外提供数据驱动的技术咨询和实施服务。各个行业都在激动地讨论着“数据驱动”,有些公司甚至宣称已经实现了“数据驱动”。
像大数据和区块链一样,很多人似是而非地讨论着数据驱动,而且数据驱动逐渐也有很大希望继在大数据、区块链之后成为另外一个忽悠人民恐吓百姓的民俗化名词。那么到底什么是数据驱动呢?你真的在做数据驱动吗?
01 何为“数据驱动”
在讨论数据驱动前,首先让我们看一个例子,打开手机移动应用Uber,APP页面会有优惠码提示:转发优惠码,如有下线使用该优惠码,你将获得优惠;在用车时,APP会根据坐车时间段和车辆紧张程度,提醒溢价的倍数,你如果不接受,则订单取消;打车结束后,APP自动选择优惠券进行结算,无需手动选择;最后你的邮箱将收到此次打车的中英文版本的邮件。整个过程全部由系统自动完成,无需人工决策。包括转发优惠码的部分,也是由系统自动提醒,刺激用户点击完成的。
由此可见,数据驱动是通过移动互联网或者其他的相关软件为手段采集海量的数据,将数据进行组织形成信息,之后对相关的信息进行整合和提炼,在数据的基础上经过训练和拟合形成自动化的决策模型。当新的情况发生,新数据输入的时候,系统可以用前面建立的模型以人工智能的方式直接进行决策。如下图所示,信号、数据、信息、情报、知识、智慧,一环扣一环,不断地上升迭代,完成一个又一个决策。
信号是机器可读的模拟或者数字脉冲,数据是人类可读的信号,信息是经过索引后可以查询的组织化的数据,而情报是对特定人在特定场景下有针对性的信息,知识是大量情报积累后可以改变人的知识结构的部分,智慧是基于知识和经验可用于决策的部分。这个决策在人工智能时代就是基于数据和算法,特别是机器学习建立模型和使用模型的决策。因为在移动互联网时代,业务需要海量毫秒级的瞬间决策,这是人类决策无法完成的。另外,人是感情动物,所有的决策会夹杂着情绪、亲情、关系等社会关系,所做的决策未必是完全客观的,很有可能添加了主观因素。基于数据和模型的数据驱动决策是更加靠谱的方式。
但是这个过程需要数据的不断输入,需要模型根据比对决策结果和现实数据把偏差信息反馈给机器学习,在其后不断的机器学习迭代过程中自我完善。从这个过程的描述中我们可以看到,数据驱动对企业的要求非常高,要有流式的数据不断地注入,要有以机器学习为基础的决策模型,要有能依赖模型输出结果可以推动的业务系统,要有可以反馈预测偏差的反馈机制。
现在大家常听到“数据驱动”,也有很多公司对外宣称其实现了“数据驱动”,诸如“这是一家数据驱动公司”等话语比比皆是。但它果真是一家“数据驱动”公司么?
02 “数据驱动”的特征
在一个真正的数据驱动的企业,数据是提供报告、深度模拟预测的来源,企业决策者应该将数据分析纳入公司决策流程,并对公司的决策提供价值和影响。数据驱动企业最大的特点是拥有一套完整的数据价值体系。数据价值体系指的是一套完整的从数据收集、整理、报告到转化成行业洞见和决策建议的流程。而落实到操作层面则是通过对数据的收集、整理、提炼,总结出规律形成一套智能模型,之后通过人工智能的方式作出最终的决策。因此,真正的数据驱动公司应该具备以下特征:
1、海量的数据;
2、自动化的业务;
3、强大的模型支持自动化决策。
这三个条件缺一不可,并形成一个循环,不断地进行数据收集,完成建模,自动决策。
03 何为“以数据为中心”
到目前为止,好多宣称自己是“数据驱动”业务的公司,其实并没有真正的做到“数据驱动”,也许他只是一个“以数据为中心”进行决策的公司,只是在利用数据,并没有真正实现数据的价值。
“以数据为中心进行决策”的方式与“数据驱动”相比,他没有“数据驱动”那样的智能,也没有“数据驱动”那样的高效。“以数据为中心进行决策”顾名思义就是用数据来支持决策,这些数据包括历史记录中的和现在产生的。通过对数据的整理、抽取,将数据转化为可读的知识,形成分析结果,决策者根据分析报告的结果考虑并决定决策结果,最终决策由人为参与。
举一个简单的例子,假设有A 和 B两家订票网站,A 公司将从网站收集到的数据进行分析,通过数据分析结果认为五一是出行高峰,于是决定抬高价格,并手动从后台调整了五一前后的机票价格和酒店价格。
B 公司则通过自动化手段实时收集、分析相关信息,总结规律,形成智能模型,当用户进行搜索时,后台自动根据模型规则,对价格进行调整。
这2个公司,哪家是数据驱动型的公司呢?
显而易见,公司 B 是数据驱动型的公司,而公司 A 则是一家“以数据为中心进行决策”的公司。
“以数据为中心进行决策”的公司,表面上公司所有人员,如产品、运营、技术、销售都可以贡献数据,也可以从数据里得出东西,但中间做决策的是人。如 A 公司,最终由人来决定机票是否提价。
04 数据即未来
那么该如何真正的打造一个“数据驱动”的项目或公司呢?现在市面上关于大数据的书籍汗牛充栋,扔出去一块砖也可以砸到N个大数据专家。但是数据科学作为一门严肃的新学科方兴未艾,真正关于利用数据科学的方法论解决实际工作中的数据科学问题的实践书籍少之又少。Brian Godsy(布瑞恩·戈德西)在他的《数据即未来》一书详细介绍了数据科学项目的三个阶段:
1、准备阶段进行信息收集;
2、构建阶段将计划付诸行动,利用准备阶段获得的信息以及相关统计和软件提供的可用工具来构建产品;
3、交付阶段进行产品的交付、反馈及修改等。
书中还会教你如何预见问题以及如何处理不确定性,一步步引导你完成软件和科学思维的最佳实践,堪称“数据驱动”方面的扛鼎之作。
CIO之家 www.ciozj.com 公众号:imciow