万能的大数据技术不是最精准的决策标尺
覃怡敏 牛华网

“互联网的人都希望做出下一个《纸牌屋》,但是内容的创造并不是有大数据储备就能成功的。”前不久,视频行业的一个大佬在接受《数字商业时代》记者采访时坦陈。

《纸牌屋》的成功,已经成为充分应用大数据分析的成功案例,一众视频网站也希望自己能成为下一个Netflix,他们同时也深知,内容创造并不是一个程序或计算题,大数据能“算”出很多,“算”不出来的也许更多。

尽管基于数据分析的营销、决策更为精准,然而不可忽视的是,大数据再强大、再神奇,它都不能成为人们生活、工作中的价值杠杆。正像科技产品永远不能成为人们最坚固的记忆硬盘或记事本一样,大数据也不能替代人脑成为人们生命中的决策标尺。

正如硬币的两面,数据爆炸意味着更多的噪音——冗余、虚假、有害信息, 当全球网络压倒一切大数据无所不在时,我们必须防止自己迷失在记忆的碎片里,重新恢复忘记。

大数据“算”不出创意与想象

非人类记忆的尴尬与残忍

大数据来源于现实。

人类的许多想法却并非如此,创造性的思维与想象往往是非理性的,“创意和想象,用大数据是‘算’不出来的”,因《大数据时代》走红的牛津大学互联网研究院教授维克托·迈尔·舍恩伯格直言。

今天,人们用数据来记录这个世界,再通过研究数据去发现这个世界。但这个世界的生活、生意都需要创意和想象,大数据只能是一种参考。

全球新增的数据有95%是数字化信息,很容易被搜索查询、引用或转载,但是这其中有不少是无效信息,甚至是当事人不愿意记忆的信息。维克托指出:“随着廉价数字存储设备的普及,记忆成为数字时代的常态。但是互联网如果记住了我们想要忘记的东西,就很容易毁了我们的生活。”

比如,大数据让互联网广告进入精准时代,广告主们通过RTB实时竞价在网络上放置广告,也闹出了误点“骨灰盒”之后、眼前的橱窗广告被各式骨灰盒覆盖的尴尬。

大数据时代,人们的每一举一动都会“被搜集”,再加以资料整合与加总。网络通过大数据的搜集,会拥有比你更好的记忆力和分析能力,可能比你更懂你。当一些互联网公司拥有了“读心术”般的营销能力之后,人们就感到害怕了。的确,数字技术赋予人们前所未有的权利,可它也会产生意想不到的可怕后果。英国社会学者保罗·杜吉德也认为,“无止境的积累,会让人们迷失在记忆细节之中”。

维克托在《删除:数字时代遗忘的美德》一书中指出:“数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。”

“人工智能”的终极遗憾

大数据不能替代人类思维

从犹疑到怀念,依赖于男友阿什生前在网络上留下的信息、数据,玛莎拥有了一个新的“真实的”、具有“人工智能”的阿什。

可慢慢的,她却发现,即使原来的阿什是社交网络达人,在Facebook、Twitter等网站上的信息数据量非常详尽,但新的阿什却并不能真正懂她。玛莎陷入了另一种悲痛。

发生在英剧《黑镜》里的故事令人心酸。在可以想见的未来里,智能合成肌肉研究成功,通过大数据,人类可以再造和逝去的人几乎一模一样的机器人。可是,人类的思维不可替代,直到后来小玛莎出生,玛莎才获得真正的陪伴,此时“人工智能”的阿什只能被玛莎“流放”到阁楼上生活。

人类的真实内心、思想并不能通过大数据完全测算出来。或许,网络科学家可以测量出我们在76%的时间里与6名同事的社交互动情况,但是,他们不可能捕捉到我们隐藏在心底对那些一年或许也见不了一次的儿时玩伴的感情。

人类的思维、决策镶嵌在时间序列和背景之中。人们往往擅长讲述交织了多重原因和多重背景的故事。但数据是不懂得这些背景的,数据分析不懂得如何叙事,也不懂得思维的浮现过程。

即便是一部普普通通的小说,数据分析也无法解释其中的思路。显而易见大数据不能代替人的思考。

“黑天鹅”事件的不可预知性

“价值密度较低”中去粗取精

大数据的核心功能之一就是预测。但大数据没法预测不可预知的事情,或者是毫无先兆的事情,这类事件通常被称为“黑天鹅”。

大数据是基于过去的数据来预测未来,当过去不可掌握时,它便无计可施。即便是过去看似可以掌握,以大数据为标尺的预测决策也不一定准确。大数据从来都不可能是“原始”的,数据总是依照人的倾向和价值观念而被构建出来的。这让数据的生产往往也掩盖了价值观念。

人们所眼见的大数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。从这个意义上讲,大数据也不能成为人们决策的精准标尺。真正的“黑天鹅”隐藏于无形之中,是很难被发现的。

著名商业思想家、《黑天鹅:如何应对不可知的未来》一书的作者纳西姆·塔勒布指出,随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。

“这种欺骗性会随着数据的增多而呈指数级地增长。在这个庞大的‘干草垛’里,我们要找的那根针被越埋越深。”纳西姆说。

因此,人们不但不能把大数据一股脑地当作宝库,反而要冷静审视数据的两面性。预知未来的高科技“水晶球”也有不为人知的一面,抛弃有害和无用的信息至关重要。

和任何一种伟大的工具一样,大数据有其拿手强项,也有不擅长的领域。要想用大数据,先知其短板。机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人员也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。

正如维克托的建议,人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢