大数据可视化之美
谢然 CIOZJ
马云曾经说过,“互联网还没搞清楚的时候,移动互联来了;移动互联还没搞清楚的时候,大数据来了。”   大数据的应用其实早已渗透到人们生活中的方方面面:亚马逊运用大数据为客户推荐商品信息,阿里用大数据成立了小微金融服务集团,而谷歌更是计划用大数据接管世界当下,很多行业都开始增加对大数据的需求。大数据时代不仅处理着海量的数据,同时也加工、传播、分享它们。不知不觉中,数据可视化已经遍布我们生活的每一个角落,毕竟普通用户往往更关心结果的展示。伴随去年底百度地图采用LBS定位春运的可视化大数据,就引起了学界对新闻创新和大数据可视化的热议。   就拿我们手中的智能手机来说吧,它既是一款数据采集工具,同时也是一个多媒体的数据可视化展示平台;现在的新闻播报也越来越多的用到数据图表,动态演示且立体化的呈现报道内容;影视剧和电子游戏频繁出现的数据可视化元素,无疑让作品的科技与未来感更加丰满;教育与科普方面则是数据可视化更大的应用领域,人们开始对单调保守的讲述方式失去兴趣,期待更加直观、高效的信息呈现形式,数据可视化正好弥补了这项需求。在智能手机、平板电脑和车载电脑等平台日渐普及的当下,新的交互手段将会成为数据可视化的趋势。   接下来,我们就来探讨一下大数据处理的最后一环:大数据可视化技术。   可视化设计 发现数据之美   数据可视化起源于1960年计算机图形学,那时候人们使用计算机创建图形图表,可视化提取出来的数据,可以将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,于是乎发展了数据采集设备和数据保存设备,而此时也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。   对于一个对大数据一窍不通的人来说,让数据实现可视化无非是对使用者了解大数据最方便快捷的方法了,这样一来,大数据可以更贴近用户的使用习惯和使用需求,就像我们开车行驶在公路上,对于交通指示牌的各种标识代表的含义了如指掌,从而可以准确到达目的地一样,在某种意义上大数据可视化也是这个道理。由此可见:恰当合适的标识可以在数据选择路径以及数据分析、信息传递的时候减小误差,数据可视化还应有适当的交互性。他们必须设计良好、易于使用、易于理解、有意义、更容易被人接受。   我们熟悉的那些饼图、直方图、散点图、柱状图等,可以说是最原始的统计图表,它们是数据可视化的最基础最常见的应用。作为一种统计学工具,可用于创建一条快速认识数据集的捷径,并成为一种令人信服的沟通手段,并传达存在于数据中的基本信息。所以我们可以在大量PPT、报表、方案中见到统计图形。   但以上最原始统计图表只能呈现基本的信息,面对复杂或大规模异型数据集,比如商业分析、财务报表、人口状况分布、媒体效果反馈、用户行为数据等,数据可视化面临处理的状况会复杂很多,可能要经历包括数据采集、 数据分析、数据治理、数据管理、数据挖掘在内的一系列复杂数据处理,然后由设计师设计一种表现形式,是立体的、二维的、动态的、实时的还是允许交互的。最终由工程师创建对应的可视化算法及技术实现手段,包括建模方法、处理大规模数据的体系架构、交互技术、放大缩小方法等。动画工程师考虑表面材质、动画渲染方法等,交互设计师也会介入进行用户交互行为模式的设计。所以一个数据可视化作品或项目的创建,需要多领域专业人士的协同工作才能取得成功。因此,数据的可视化在进行大数据的分析工作时应当被研究工作者加以重视并进一步提升。   可视化工具 为数据披上华丽的纱衣   大数据才刚刚开始出现,我们管理后端的方式也在不断变化。我们需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息,那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,下面就来看看全球备受欢迎的的可视化工具都有哪些吧!   可视化案例 妙不可言的视觉冲击   专注于网站流量的任何一家互联网公司可能都听过甚至用过“互联网星系”,这是俄罗斯数据可视化设计师 Ruslan Enikeev 根据 2011 年底的数据,将 196 个国家的 35 万个网站数据整合起来,并根据 200 多万个网站链接将这些“星球”通过关系链联系起来-- The Internet Map.每一个“星球”的大小根据其网站流量来决定,而“星球之间”的距离远近则根据链接出现的频率、强度和用户跳转时创建的链接。这是大数据挖掘可视化的一个经典案例。在这个互联网的宇宙中,每一个大网站都是一个星球。你可以输入国家查看这个“星系”里最大的“星球”,也可以直接输入网站查看某一“星球的位置”.这些星球有恒星、行星,甚至卫星,每一个星球都有其特定的星系。当你放大到一定程度时,你能发现这些大大小小的“星球”之间神奇的关系,相当神奇!   在国外,许多大型企业、科研机构都会有相关部门进行数据可视化研究,如数字图书馆。媒体和政府机构也会对自己掌握的数据进行可视化分析,如犯罪地图。在互联网上,那些掌握了大量用户活动信息、用户关系网或语料库的网站,比如digg,friendfeed,flickr或大型电子商务网站等,都有实验性的可视化项目。可惜国内在这方面的商用或实验项目几乎还是空白。   数据可视化的开发和大部分项目开发一样,也是根据需求来根据数据维度或属性进行筛选,根据目的和用户群选用表现方式。同一份数据可以可视化成多种看起来截然不同的形式。   有的可视化目标是为了观测、跟踪数据,所以就要强调实时性、变化、运算能力,可能就会生成一份不停变化、可读性强的图表;有的为了分析数据,所以要强调数据的呈现度、可能会生成一份可以检索、交互式的图表;有的为了发现数据之间的潜在关联,可能会生成分布式的多维的图表;有的为了帮助普通用户或商业用户快速理解数据的含义或变化,会利用漂亮的颜色、动画创建生动、明了并具有吸引力的图表;还有的图表可以被用于教育、宣传或政治,被制作成海报、课件,出现在街头、广告手持、杂志和集会上,这类图表拥有强大的说服力,使用强烈的对比、置换等手段,可以创造出极具冲击力的图像。当然在国外许多媒体还会根据新闻主题或数据,雇用设计师来创建可视化图表对新闻主题进行辅助。   曾经有一位专家指出,数据可视化目前还只是停留在理论层面,当然随着技术的进步会不断地变化,同时人类也在努力研发新的工具来更好地实现跨行业应用。其中,Google Maps的出现就完全颠覆了过去人们对在线地图功能的认识。而Google发布的Maps API则让所有的开发者都能在自己的网站中植入地图功能。当然,还有今年春运央视与百度合作的交通可视化同样也是很好的典型案例,可以让人们更加深入的理解当今大数据可视化的现状。 海量数据无法直接分析,通过可视化,可以更容易更快速的获得想要的知识。   新的软件和技术使我们能够更深入的理解如此庞大的数据集。然而,我们要去真正采集和挖掘有价值的大数据,势必要提高数据可视化的水平。那么我们究竟该如何进行可行性分析、深入了解并能全面直观地表达信息呢?那就是我们必须将数据变得更通俗易懂。例如通常所说的数据可视化标识导向系统,包括文字的,如街头的路标指引你到高速公路,还有象征的,如颜色、大小或位置的抽象元素传达的信息。在某种意义上,恰当的视觉标识可以提供较短的路线,帮助选择路线,成为通过数据分析传递信息的一种重要的工具。然而,要真正可行,数据可视化还要适时适当融入交互性元素。他们必须设计良好、易于使用、易于理解、有意义、更容易被人接受。
CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢