有大牛可以通俗的解释一下吗


数据可视化,不是简简单单把数据变成图形这么简单!

通俗来说,图形只是数据可视化的一种方法,数据可视化真正的含义更类似于「翻译」,是将我们看不懂的数据通过图形化的手段进行有效地表达,准确高效、简洁全面地传递某种信息,甚至我们帮助发现某种规律和特征。

就好比我们看原著《哈姆雷特》,普通人很难接收到作者在书中向我们表达的内容,所以就需要翻译对原著进行解释,首先翻译成我们看的懂的语言、准确表达作者的观点(准确表达),最后能帮助我们理解、读懂这本著作(数据挖掘)。

什么是数据可视化?

数据是最原始的孤立符号,如何将数据转化成有意义、有价值、有联系的信息,就需要进行数据表达。

比如说,有的人可以在短时间内记住成百上千个毫无规律的手机号码,其实没有什么奥秘,只是因为他们通过数据表达将原本毫无意义的符号,变成了有联系的图形信息。

比如他们在记忆183492761这样的数字时,会将数字放入到类似于手机解锁的九宫格中,这样他们就能将记忆数字改变为记忆图形,会大大提高记忆效果。

这是为什么呢?其实是因为人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加深和强化受众对于数据的理解和记忆。

举个更为实际点的例子,通常很多人做报表时都会给老板这样的表格:

这种excel表格的方式仅仅是将数据进行了罗列,没有办法表达出真正的主体信息,老板也没办法从这样的数据中找出什么规律和特征;相反的,如果你利用数据可视化将数据转化成这样的形式,老板获取信息的效率会更快,也能从数据中找出事物变化的趋势与规律,帮助老板进行决策。

二、可视化的原则

一是平衡性。

在可视化规范与领导喜好之间寻求平衡点。大名鼎鼎的IBCS建立了关于报表、幻灯片、仪表板、图和表的制作标准,就像下图这样。

有了这些视化规范是不是直接参照就可以呢?还不行,还需要加入一些「中国特色」,也就是领导的喜好,否则可能水土不服。如何把握领导的喜好?作为一个数据分析师,这应该是一个基本功吧。

二是逻辑性。

一个好的分析师会用数据讲故事,数据可视化之后故事会更吸引人,好的可视化就是与数据的逻辑完全契合,想展示什么(数据背后的含义)——依据是什么(数据的趋势变化)——结论是什么(数据反映的问题)。

三是准确性。

可视化要忠于数据,刻意夸大或者美化数据及变化都不可取。举个例子,前一段帮一个朋友做可视化,数据在1-50之间,做成的蝴蝶图中「数据1」对应的条形几乎不可见,这时候朋友就不满意了,明明有数图中却看不见这必须得改,接著又拒绝我增加「折断」的想法,万般无奈之下被逼著将「1」改成了「2」,终于露出一个「尖尖角」。一声长叹,数据可视化时既要满足甲方需求,也要尽可能地坚持原则。

四是稳定性。

刚才在谈可视化的误区时,建议大家不要过于求新求变,不要执著于某一类可视化类型,而是应该保持稳定性,通过增加细节适度微创新,还是领导熟悉的味道只是加了点料,保持了可视化风格延续的同时又有一点小惊喜。比如增加标准线,增加差异箭头、增加区域分隔等等。

三、可视化都哪些好用的工具?

常用的可视化工具主要有这4类:

一是在线可视化工具。

主要有镝数、花火等,优点是图表种类丰富、类型新颖、配色年轻化,还提供了一些十分酷炫动态图表,操作也比较简单,很多新媒体都在用,缺点是数据保密性不够。

二是编程可视化工具。

主要有E-charts、D3、ggplot、Matplotlib、pandas、plt等,优点是可以制作大型数据集和交互动画的图表,高端大气上档次,可视化效果跟脑洞大小呈正比,缺点是需要有编程基础,门槛较高。

三是商业智能工具。

比如国内比较有有名的FineBI等,是专业的大数据 BI 和分析平台,主要为企业提供一站式商业智能解决方案,用他们做数据分析和可视化驾驶舱真是妥妥的,不需要写代码,而且操作比较方便,缺点是目前市场上的大部分BI都收费,不过FineBI个人版免费,这一点算是很人性化的

四是基础可视化工具。

主要就是Excel,优点是通用、易用、实用,傻瓜式操作,基本上人人都会,使用成本较低,同时还有基于excel开发的图表插件Thinkcell Chart、Zebra Bi,国内可视化大神Peter开发的Easyshu,可以高效地制作出商业图表。缺点是Excel本身主要制作常规性的图表,很多特殊图表无法实现,功能强大的图表插件价格不菲。

山不在高有仙则名,水不在深有龙则灵。工具没有好坏,也不是越多越好,好用趁手就行,对于我个人来说这4类可视化工具各有特色,但要说最容易上手,最适合入门,适合大部分人日常需求的工具,非Excel莫属。

发布于 2020-06-01继续浏览内容知乎发现更大的世界打开Chrome继续桑文锋桑文锋神策数据创始人兼CEO,前百度大数据部技术经理。

就是把数据做一些展现,在展现的时候,要突出要表达的重点。你在网上看到的各种图表,都是数据可视化。数据可视化一般也需要考虑的是数据的处理,就是把数据准备好,存放到合适的位置,如资料库等,方便展现是读取。


就是把数据做一些展现,在展现的时候,要突出要表达的重点。你在网上看到的各种图表,都是数据可视化。数据可视化一般也需要考虑的是数据的处理,就是把数据准备好,存放到合适的位置,如资料库等,方便展现是读取。


推荐阅读:
相关文章