闲鱼技术01 发表于 2021-11-11 19:11

"A picture is worth a thousand words", 数据可视化这几年可谓是风生水起,尤其在一些发达国家,各类可视化工具和商务智能软件百花齐放,不少大公司和政府机构运营已经极度依赖于它们。原因很简单,人都是图像敏感而思维趋于懒惰的动物,图像展现数据的方式使得观众可以快速从大数据集里得出有效信息,从而做出决策。

这里列出个人比较熟悉同时也是市面上最流行的集中可视化工具,可能跟楼上的答案有所重复:

非技术分析人员和非专业数据分析人士:

1. Tableau



Tableau连续几年一直保持BI市场领头羊的地位(Gartner2016年BI软件市场报告 --> gartner.com 的页面),Tableau的一大优势在于简单易上手, “导入数据 -> 关联数据 -> 制造图标 -> 上传分享”,鼠标点击拖拽一步到位。相比于其竞争者,Tableau的图形也更美观大方,给人视觉上的愉悦感。贴几个连接功大伙儿慢慢欣赏:
50 Years of Crime in the US
Blame The Weather: US Flights Delayed by Precipitation
Domestic Violence in Spain

当然Tableau 也不是全无缺点,比如它的速度就不够快,当数据很大时,数据引擎每次重新计算和检索数据需要较长的时间,给用户造成卡壳的不良体验,而且Tableau还巨贵,一般小老百姓和初创公司是用不起的,下面是官方定价,大家感受下:
Buy Tableau | Tableau Webstore

大家平时所听说的Tableau其实是指的Tableau Desktop,这是他们家用于制作图形的个人桌面客户端软件,但其实Tableau的实力远不止如此,Tableau家族的其他产品还包括:

1) Tableau Public
免费的Tableau图形发布平台,用户可以上传制作好的作品到云端,所有人都可以在线访问,但免费的东西从来都不好用,Tableau Public免费的代价是以牺牲大量功能得来的,比如使用Tableau Public时,用户无法给自己的作品设置访问权限,而且支持的数据源也很有限;

2)Tableau Server
企业采用的Tableau中央服务器,对用户和数据进行统一管理,比如同一家公司里,不同部门的不同工作人员都可以将自己的数据和制作好的可视化图形上传到Tableau Server,然后给同事设置不同的访问权限(例如,同一个文件,同事A无访问权限,同事B可以访问但不能修改,同事C既可以看到还能修改,不高兴了还能一键删除。。)

3)Tableau Online
Tableau Online说白了就是Tableau Server的官方托管版本,由Tableau提供服务器和维护服务,客户只要说明自己的要求和乖乖交钱就好了,当然这在某种程度上也失去了自定义和修改系统的灵活性。

另外Tableau 还提供了丰富的REST API和Javascript API允许程序员自主开发基于Tableau数据引擎和数据仓库的第三方平台。更多信息移步:
https://onlinehelp.tableau.com/current/server/en-us/rest_api.htm
Tableau JavaSCript API

2. QLIK



QLIK是Garter排行榜前三的另外一家,目前市场占有率略逊于Tableau(主要归功于Tableau的容易上手的GUI和美丽大方的动态图形),但是大有迎头赶上的趋势,估计超越Tableau只是时间早晚的事。QLIK旗下有两个主打产品:QLIK VIEW 和 QLIK SENSE。

刚接触QLIK的人常常为这两个产品的功能困惑,好像它们都是干一样的活,完全可以相互替代,为什么已经有了QLIK VIEW还要QLIK SENSE?其实,这两个产品还是有重要区别滴! QLIK SENSE的出现是为了弥补QLIK VIEW存在的不足,官方的解释是,QLIK VIEW主要用于‘Guided Analytics’,通俗地讲,如果你想深挖数据,探索变量与变量之间的联系,那就选择QLIK VIEW吧。而如果你已经对数据有一定了解,只是想基于数据创建酷炫的图形,那么你应该选择QLIK SENSE。

QLIK相对于Tableau的优势主要有:
1) 价格相对便宜;
2) QLIK使用In memory的存储计算方式,将数据存放于主机的内存中,使得计算速度大大提高(不过好像现在Tableau也在用这个技术);
3) QLIK提供非常全面的SDK和API支持,简直让人眼花缭乱,这使得开发人员能够进行深度定制开发,比如借助D3这类的Javascrit可视化库扩展开发QLIK本身不自带的图形,这样一来,QLIK支持任意可视化图形成为可能,这也是我更看好QLIK的一个重要原因。

总的来讲,QLIK有一个好的长远规划,前途还是很美好滴。

3. Powerful BI


三巨头的另外一个产品,老东家是占据PC半边天的大名鼎鼎的微软,Powerful BI作为一个新产品,能在短短几年内迅速挤进BI市场前三,可见微软在它身上下了不少心血。不过因为本人没有多少使用Powerful BI的经验,因此其优缺点不在这里详述。

专业数据分析员和开发人员

以上BI工具因其方便的图形界面使得非专业人员也能快速开发出美观的动态图形,但对于具有编程能力的分析人员而言,一款强大灵活地开发工具仍旧不可替代,这类工具具有很多BI软件所不具有的优点,比如足够灵活,速度非常快,而且免费!!免费啊!!

1. D3.js


楼上已经有许多答案都提到了D3, D3全称Data Driven Document,即数据驱动创建图形,创始人是Mike Bostock。 D3是一个很底层的数据可视化Javascript库,这也注定了它具有很强的可扩展性(现在已经有很多基于D3开发的第三方数据可视化插件,比如上面有人提到的DC.js),不过随之而来的是其较为陡峭的学习曲线。

D3相对于Tableau和QLIK的优势和劣势都一目了然:
优点:
1) 快速: Javascript直接运行于浏览器,速度非常快,也可以很方便地调用各类API获取数据;
2) 灵活: D3是一款非常底层的数据可视化库,可以直接操作SVG,理论上,你想要的任何图形D3都可以实现(前面就提到可以用D3扩展QLIK的图形支持);
3) 免费:相信价格是用户非常关注的一个问题,而D3的一个杀手锏是 它!是!免!费!的!

缺点:
1) 难: 所有学习D3的人都说它难,它的那一套 'Data Driving' 逻辑常常让人懵圈,因此不少人感叹D3真是聪明人才用的来的;
2) 开发周期长: 手动敲代码自然比不上简单的鼠标拖拽 ,BI软件的图形开发周期常常在几个小时不等,而用d3手敲代码,根据图形的复杂程度,开发周期常在五天到两个星期不等。
A Day in the Life
nytimes.com 的页面
http://biovisualize.github.io/d3visualization/
sensortower.com 的页面

2. R



R在数据分析领域的地位不言而喻,其丰富而强大的扩展包支持使得几乎一切数据层面的分析和操作成为可能,这些支持中就包括数据可视化。在众多可视化包里面,最受欢迎莫过于ggplot2和Rshiny,ggplot2的图形与前面那些动态图形都不一样,是静态的,但想一想只要两三行代码就可以生成复杂的可视化图形和地图,想想是不是还有点小激动呢。如果花点时间学习Rshiny,动态图形也是完全没问题地哦!

xiaozongpeng 发表于 2021-11-11 19:14

自诩是这个领域“有一脚”的人,上帝派我来严谨的回答领域问题(顺便插科打诨的)。
利益相关,首先介绍一下,我们算是可视化领域和数据分析领域的一个分支,把企业数据揉一揉(收集整合)、泡一泡(加工分析)、舔一舔(展示检验),以供展示有价值的信息,所以这样的可视化更讲究应用和实用性(下文会讲)。将数据转化成可视化图表/形,其实一个工具就能完成,碍于工具太多,按照使用场景,暂且将已成熟应用的分为三个层次(欢迎各路知友补充):
第一层:数据报告、信息图

这里统称信息图。信息图是把数据、信息或知识可视化,必须要有一个清楚准确的解释或表达甚为复杂且大量的信息。
代表人物是新闻界的David McCandless(大卫. 麦克坎德雷斯),曾为《英国卫报》、《连线》、《独立报》等刊物撰稿。常以简洁精美的图像展现复杂抽象资讯,并将不同的数据组合,展现其中的联系。他在TED上曾讲过:
“可视化并不局限于数字,概念也同样适用,比如政治倾向图谱。我试图将各种政治倾向融入到图表中,并展示其如何从政府渗透到社会、文化中,对家庭和个人产生影响,继而又反过来影响政治。    比如用图形来表示数值



视线流动,构建时空




而更多普遍实用的是类似 @何明科 在自己的文章分析中,使用一些信息图表,展示结论。
信息图的制作:
利用PPT自带的图表,可以制作简洁直观的数据图表,但附上人文花鸟就需要美工设计;
PS+AI+icon,前期规划好表达思路、展示内容、所需素材,之后便大刀阔斧动工组件了。图表的细节,如柱状图的长短依据数据大概等比例量一下。
这一类对数据的维度数量要求都不高,运用的大多是结果数据,侧重点也在于展示。

第二层:实际数据应用

应用类的可视化正如上面所说的,将一堆几百到即使几百万不等的数据展示、分析。对于企业,因为这些数据本身是自己生产经营过程中产生的,能反映历史的状况,总结发展之道,对目前的问题或者未来下一步的决策起到辅助作用。
这样的工具excel能解决,报表工具能解决,BI也能解决,具体细化到什么样的场景不是这里的重点,大家可以在下面评论交流。
通常的制作流程是:导入数据(excel)/连接数据库(本地/服务器)——选择图表(组合)——设定分析维度——美化展示。比如像这种浓浓的带有商业味道的可视化报表(有FineReport制作)   






当然,这样功力的可视化报表需要一定的审美和熟练操作。图中每一块都是一个图表控件,在表单(dashboard)中拖入一个图表控件,选定数据字段,然后搭配组合,排布版型。
具体的操作要讲上3天3夜,附上demo链接吧: 数据决策系统(用户名:demo;密码:demo)
第三层:据挖掘、数据连接、关系传递

这个可以理解为从海量数据中挖掘关系。
大致思路:原始数据经过一连串收集、提取、清洗、整理等预处理过程,形成高质量的数据。然后按照需要对数据贴标签分类或者预测,如果要从大量复杂的数据中提取有价值且不易发现的信息还要数据建模。(细节可能各有不同)
比较适用的是一写高级的数据分析挖掘工具以及开源图表控件,如R,如D3。
用R做可视化,比较容易做出漂亮的可视化图表,推荐书籍R Graphics Cookbook,书中有150多个recipes,足够应付大多类型的数据。
D3做图可以定制,美观图图表的丰富性秒杀大多图表控件,但要求的水平有一丢丢高。


最后,再次引用David McCandless的话“炫酷的可视化对于把思想传递给大众又是至关重要的”,切勿一味追求美感,本末倒置。

补充相关资料来源:
1、大卫.麦克德里斯:数据可视化之美
http://www.tedtochina.com/2010/09/14/david_mccandless/
2、数据可视化:一图胜千言
3、数据可视化是让信息易读,还是更复杂? - 知乎

JoshWindsor 发表于 2021-11-11 19:16

工具看大家介绍的很多 ,推荐几个小众但好用的吧 ~
1、Kepler.gl
一种用于映射大规模空间数据的开源工具,是Uber和Mapbox之间的合作项目。



2、VIZ PALETTE
可视化颜色选择器,基于感知研究



3、Vega-Lite
主要用于分析的交互式图形语法,API简单、友好,并且基于强大的Vega-Lite可视化语法构建。



4、Semiotic
基于React的数据可视化框架。它满足了对可重用数据可视化的需求,而无需提交静态的图表类型集。



5、dataviz.tools (一个网站)
有很多与可视化相关的工具,重点是免费和开源。推荐收藏~



再推荐两个我觉得不错的网站吧~
6、Datasketch
一个非常有意思的网站,每个月他们都会选择一个主题,每个人都会创建一个非传统的互动图形。



7、The Pudding
一个关于可视化的网站,或者称它为“视觉论文杂志”?里面有非常多有趣的项目,值得一看!



上面就是一些我认为比较有用或有趣的内容,希望能够帮到大家 (`ω)

更多IT干货,请关注 实验楼 ~

RedZero9 发表于 2021-11-11 19:18

推荐tableau
中文网站:Tableau Software
基础学习视频:Tableau 培训与教程

如果
你的数据不那么完美你不知道怎么进行可视化你的数据是sql、excle、txt、csv等等格式你想进行一些强大的计算你想做一些动图
tableau都可以解决掉

重点是:
如果你是学生的话,还可以免费使用:Tableau 学生版
当然你不是学生的话,你仍然可以免费使用:Tableau Public

唯一的缺点就是国内的教程以及碰到一些问题可能解答比较少,国外比较多。

我也是使用了之后深深的中了毒的~

在之前的文章中也是多次用到了这个软件,以下是之前做的几张图片:









johnsoncodehk 发表于 2021-11-11 19:25

数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。

早期的数据可视化作为咨询机构、金融企业的专业工具,其应用领域较为单一,应用形态较为保守。步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合、挖掘、分析、可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图、气泡图、树图、仪表盘等各式图形。表现之二是可用的开发工具越来越丰富,从专业的数据库/财务软件,扩展到基于各类编程语言的可视化库,相应的应用门槛也越来越低。

数据可视化,不仅仅是统计图表。本质上,任何能够借助于图形的方式展示事物原理、规律、逻辑的方法都叫数据可视化。

数据可视化不仅是一门包含各种算法的技术, 还是一个具有方法论的学科。一般而言,完整的可视化流程包括以下内容:

可视化输入:包括可视化任务的描述,数据的来源与用途,数据的基本属性、概念模型等;可视化处理:对输入的数据进行各种算法加工,包括数据清洗、筛选、降维、聚类等操作,并将数据与视觉编码进行映射;可视化输出:基于视觉原理和任务特性,选择合理的生成工具和方法,生成可视化作品。




实际上,从“数据可视化”的命名,便很容易看出数据可视化从业者如何开始可视化设计,那便是:处理数据,设计视觉,完成从数据空间到可视空间的映射, 必要时重复数据处理和图形绘制的循环组合。

1. 分析数据

首先,我们需要对数据做一个全面而细致的解读,数据的特点决定着可视化的设计原则。每项数据都有特定的属性(或称特征、维度)和对应的值,一组属性构成特征列表。按照属性的类型,数据可以分为数值型、有序型、类别型,数值型又可以进一步分为固定零点和非固定零点。其中,固定零点数据囊括了我们大多数的数据对象,它们都可以对应到数轴上的某个点;非固定零点主要包括以数值表示的特定含义,如表示地理信息的经纬度、表示日期的年月日等,在分析非固定零点数据时,我们更在意的是它们的区间。

在对数据做过预处理和分析之后,我们就能够观察出待处理数据的分布和维度,再结合业务逻辑和可视化目标,有可能还要对数据做某些变换,这些变换包括:

标准化,常用的手段包括(0,1)标准化或(-1,1)标准化,分别对应的是sigmoid函数和tanh函数,这么做的目的在于使数据合法和美观,但在这一过程中可能丢失影响数据分布、维度、趋势的信息,应该予以特别注意;拟合/平滑,为表现数据变化趋势,使受众对数据发展有所预测,我们会引入回归来对数据进行拟合,以达到减少噪音,凸显数据趋势的目的;采样,有些情况下,数据点过多,以至于不易可视化或者影响视觉体验,我们会使用随机采样的方法抽取部分数据点,抽样结果与全集近似分布,同时不影响可视化元素的对比或趋势;降维,一般而言,同一可视化图表中能够承载的维度有限(很难超过3个维度),必须对整个数据集进行降维处理。

2. 可视化设计

在开始设计之前,我们需要对人类视觉以及注意力作简要分析,这决定着我们如何在第一时间抓住受众的注意力。

人类视觉感知到心理认知的过程要经过信息的获取、分析、归纳、解码、储存、概念、提取、使用等一系列加工阶段,每个阶段需要不同的人体组织和器官参与。简单来讲,人类视觉的特点是:

对亮度、运动、差异更敏感,对红色相对于其他颜色更为敏感;对于具备某些特点的视觉元素具备很强的“脑补”能力,比如空间距离较近的点往往被认为具有某些共同的特点;对眼球中心正面物体的分辨率更高,这是由于人类晶状体中心区域锥体细胞分布最为密集;人们在观察事物时习惯于将具有某种方向上的趋势的物体视为连续物体;人们习惯于使用“经验”去感知事物整体,而忽略局部信息。

这里引入一个概念——可视编码,它数据信息映射为可视化元素的技术,其通常具有表达直观、易于理解和记忆的特性。数据包含属性和值,相应可视编码也由两部分组成:标记和视觉通道,标记代表数据属性的分类,视觉通道表示人眼所能看到的各种元素的属性,包括大小、形状、颜色等,往往用来展示属性的定量信息。例如,对于柱状图而言,标记就是矩形,视觉通道就是矩形的颜色、高度或宽度等。

数据可视化的设计目标和制作原则在于信、达、雅,即一要精准展现数据的差异、趋势、规律,二要准确传递核心思想,三要简洁美观,不携带冗余信息。结合人的视觉特点,很容易总结出好的数据可视化作品的基本特征:

让用户的视线聚焦在可视化结果中最重要的部分;对于有对比需求的数据,使用亮度、大小、形状来进行编码更佳;使用尽量少的视觉通道编码数据,避免干扰信息。

3. 可视编码的选择

如同只学过视听语言并不能设计出可用的电影分镜一样,数据可视化这一艺术设计色彩浓厚的工作绝非做过几个饼图、柱状图就能胜任。在开始涉足实践讲解之前,我们需要解决以下疑问:

可视化设计中优先选择哪些视觉通道?有多少种视觉通道可供使用?某个视觉通道能编码什么信息,能包含多少信息量?视觉通道表达信息能力的区别?哪些视觉通道互不相关而哪些又相互影响?

看看下图,或许能从一定程度上给出答案:




上图列举了数据可视化作品中常用的视觉编码通道,针对同种数据类型,采用不同的视觉通道带来的主观认知差异很大。数值型适合用能够量化的视觉通道表示,如坐标、长度等,使用颜色表示的效果就大打折扣,且容易引起歧义;类似地,序列型适合用区分度明显的视觉通道表示,类别型适合用易于分组的视觉通道。

需要指出的是,上图蕴含的理念可以应对绝大多数应用场景下可视化图形的设计“套路”,但数据可视化作为视觉设计的本质决定了“山无常势,水无常形”,任何可视化效果都拒绝生搬硬套,更不要说数据可视化的应用还要受到业务、场景和受众的影响。

4. 配色

相信每一个码农出身的数据分析师在做可视化设计时,都会对色彩如何搭配产生过困惑。色彩理论看起来简单却又乏味,用起来却不是那么得心应手。那么,如何让数据可视化作品简约、灵动、美观?下面介绍一些通用技巧。

1)色调与明度的跨度都要大

要确保配色非常容易辨识与区分,它们的明度差异一定要够大。明度差异需要全局考虑。但是,有一组明度跨度大的配色还不够。配色越多样,用户越容易将数据与图像联系起来。如果能善加利用色调的变化,就能使用户接受起来更加轻松。对于明度与色调,跨度越大,就能承载越多的数据。下图展示了相同色系下不同明度的色阶对比:




2)仿照自然的配色

各行各业的设计师都知道这个小秘密,对于数据可视化工程师而言,这招更是屡试不爽。一个简单有效的方法是:找出心仪的图片,比如唯美的风景照片,使用photoshop中“滤镜—马赛克—调整多边形形状和大小”即可看到该图片中包含的各种颜色,然后利用吸管工具选出几种颜色即可:






3)使用渐变

无论你需要2种颜色还是10种,渐变中都能提取出这些颜色,让可视化图表感觉自然,同时保有足够的色调与明度差异。一个使用渐变的好方法就是:在Photoshop中拉辅助线到断点位置,与数据的数量对应上,然后持续对渐变进行测试与调整。




可以看到,配色表紧挨着顶部的灰度渐变,调整渐变叠加(之后就能得到精确的渐变色值),然后从那些断点处选取颜色,测试配色在实际运用中的效果。

4)使用配色工具

网上各种免费资源比比皆是,对于想设计出靓丽效果又无计可施的人而言,多参考以下这些工具是一个好办法:

ColorHunt——高质量配色方案,能够快速预览,如果你只需要4种颜色,这是绝佳的资源;Kuler——photoshop配色工具,Adobe家出的,应该错不了;Chroma.js——Chroma.js是一个微型的JavaScript库,适用于各种颜色处理的,可实现各种颜色的转换和色阶处理;Color brewer——地图配色利器,如果你对基于地图的可视化配色方案感到困惑,这个在线工具应该能够帮到你。

此外,关于配色还有一些小技巧可供参考:遵循公司既定的品牌风格;根据数据描述的对象来定,如数据描述的是咖啡,则可以考虑使用咖色系;使用季节或者节日相关主题的色彩;如果你实在对颜色搭配感到头疼,那就多使用万能的“灰色”和阴影。

统计图表

统计图表是使用最早的可视化图形,在数百年的进化过程中,逐渐形成了基本“套路”,符合人类感知和认知,进而被广泛接受。
常见于各种分析报告的有柱状图、折线图、饼图、散点图、气泡图、雷达图,对于这些最常用的图表类型,下表可以为你指明大致方向:




我们在制作可视化图表时,首先要从业务出发,优先挑选合理的、符合惯例的图表,尤其是如果你的用户层次比较多样的情况下,请兼顾各个年龄段或者不同认知能力的用户的需求;其次是根据数据的各种属性和统计图表的特点来选择,例如饼图并不适合用作展示绝对数值,只适用于反映各部分的比例。对于常用图表,带着目的出发,遵循各种约束,相信你能找到合适的图表:




除了常用的图表之外,可供我们选择的还有:

漏斗图:漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在。(矩形)树图:一种有效的实现层次结构可视化的图表结构,适用于表示类似文件目录结构的数据集;热力图:以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示,它基于GIS坐标,用于显示人或物品的相对密度;关系图:基于3D空间中的点—线组合,再加以颜色、粗细等维度的修饰,适用于表征各节点之间的关系;词云:各种关键词的集合,往往以字体的大小或颜色代表对应词的频次;桑基图:一种有一定宽度的曲线集合表示的图表,适用于展现分类维度间的相关性,以流的形式呈现共享同一类别的元素数量,比如展示特定群体的人数分布等;日历图:顾名思义,以日历为基本维度的对单元格加以修饰的图表。


数据可视化的工具

新型的数据可视化产品层出不穷,基本上各种语言都有自己的可视化库,传统数据分析及BI软件也都扩展出一定的可视化功能,再加上专门的用于可视化的成品软件,我们的可选范围实在是太多了。那么,我们要选择的可视化工具,必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。

实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;多种数据集成支持方式:数据的来源不仅仅局限于数据库;很多数据可视化工具都支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

数据可视化主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是 Processing,它是为艺术家提供的编程语言;从统计和数据处理的角度,既可以做数据分析,又可以做图形处理,如R,SAS;介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js、Echarts都是很不错的选择,二者这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

1. 入门级

入门级的意思是该工具是可视化工作者必须掌握的技能,难度不一定小、门槛也不一定低。相反,对于可视化大拿来说,这些工具依旧起到四两拨千斤的妙用。

Excel

别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用。它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果。尽管如此,我仍然推荐你使用Excel。




Tableau


相信每一个接触到数据可视化的人都听说过Tableau,它需要一些结构化的数据, 也需要你懂一些BI。 它不需要编程,而仅仅通过简单的拖拽操作即可完成惊艳的效果。对比Excel,它是专业应对数据可视化方案的利器,主要表现在数据可视化、聚焦/深挖、灵活分析、交互设计等功能。Tableau最大的缺点在于它是商业软件,个人使用的话只有14天的免费期,而官方售价不菲。






2. 在线数据可视化

Google Charts

Google Charts是一个免费的开源js库,使用起来非常简单,只需要在script标签中将src指向https://www.gstatic.com/charts/loader.js然后即可开始绘制。它支持HTML5/SVG,可以跨平台部署,并特意为兼容旧版本的IE采用了vml。




在新版google charts 发布之前,google有个类似的产品叫做Google Charts API,不同之处在于后者使用http请求的方式将参数提交到api,而后接口返回一张png图片。如打开http://chart.googleapis.com/chart?cht=bvg&chs=250x150&chd=s:Monkeys&chxt=x,y&chxs=0,ff0000,12,0,lt|1,0000ff,10,1,lt,即可显示下图:




Flot

Flot是一个很棒的线图和条形图创建工具,可以运用于支持canvas的所有浏览器——意味着大多数主流浏览器。这是一个jQuery库,如果你已经熟悉jQuery,你就可以容易的对图像进行回调、风格和行为操作。 浮悬的优点是你可以访问大量的调用函数,这样就可以运行你自己的代码。设定一种风格,可以让在用户悬停鼠标、点击、移开鼠标时展示不同的效果。比起其他制图工具,浮悬给予你更多的灵活空间。浮悬提供的选项不多,但它可以很好地执行常见的功能。




D3

D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。D3.js是数据驱动文件(Data-Driven Documents)的缩写,他通过使用HTML\CSS和SVG来渲染精彩的图表和分析图。D3对网页标准的强调足以满足在所有主流浏览器上使用的可能性,使你免于被其他类型架构所捆绑的苦恼,它可以将视觉效果很棒的组件和数据驱动方法结合在一起。




Echarts

百度出品的优秀产品之一,也是国内目前开源项目中少有的精品。一个纯 Javascript 的图表库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器,底层依赖轻量级的 Canvas 类库 ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。3.0版本中更是加入了更多丰富的交互功能以及更多的可视化效果,并且对移动端做了深度的优化。Echarts最令人心动的是它丰富的图表类型,以及极低的上手难度。




Highcharts

在Echarts出现之初,功能还不是那么完善,可视化工作者往往会选择HighCharts。Highcharts 系列软件包含 Highcharts JS,Highstock JS,Highmaps JS 共三款软件,均为纯 JavaScript 编写的 HTML5 图表库。Highcharts 是一个用纯 JavaScript 编写的一个图表库, 能够很简单便捷的在 Web 网站或是 Web 应用程序添加有交互性的图表。Highstock 是用纯 JavaScript 编写的股票图表控件,可以开发股票走势或大数据量的时间轴图表,Highmaps 是一款基于 HTML5 的优秀地图组件。




R

严格来说,R是一种数据分析语言,与matlab、GNU Octave并列。然而ggplot2的出现让R成功跻身于可视化工具的行列,作为R中强大的作图软件包,ggplot2牛在其自成一派的数据可视化理念。它将数据、数据相关绘图、数据无关绘图分离,并采用图层式的开发逻辑,且不拘泥于规则,各种图形要素可以自由组合。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。




DataV

阿里出品的数据可视化解决方案,之所以推荐DataV这个后起之秀,完全是因为淘宝双“11”活动中实时互动大屏幕太抢眼了。DataV支持多种数据源,尤其是和阿里系各种数据库完美衔接,如果你的数据本身就存在阿里云上,那选用DataV肯定是个省时省力的好办法。图表方面,DataV内置了丰富的图表模板,支持实时数据采集和解析。




3. 类GUI数据可视化

Crossfilter

Crossfilter 是一个用来展示大数据集的 JavaScript 库,它可以把数据可视化和GUI控件结合起来,按钮、下拉和滑块演变成更复杂的界面元素,使你扩展内容,同时改变输入参数和数据。交互速度超快,甚至在上百万或者更多数据下都很快。Crossfilter也是一种JavaScript库,它可以在几乎不影响速度的前提下对数据创建过滤器,将过滤后的数据用于展示,且涉及有限维度,因此可以完成对海量数据集的筛选与加载。




4. 进阶工具

Processing

Processing 是用 Java 编程语言写的,并且 Java 语言也是在语言树中最接近 Processing 的。所以,如果您熟悉 C 或 Java 语言,Processing 将很容易学。Processing 并不包括 Java 语言的一些较为高级的特性,但这些特性中的很多特性均已集成到了 Processing。如今,围绕它已经形成了一个专门的社区(https://www.openprocessing.org),致力于构建各种库以供用这种语言和环境进行动画、可视化、网络编程以及很多其他的应用。

Processing 是一个很棒的进行数据可视化的环境,具有一个简单的接口、一个功能强大的语言以及一套丰富的用于数据以及应用程序导出的机制。




Weka

Weka是一个能根据属性分类和集群大量数据的优秀工具,Weka不但是数据分析的强大工具,还能生成一些简单的图表。weka首先是一个数据挖掘的利器,它能够快速导入我们的结构化数据,然后对数据属性做分类、聚类分析,帮助我们理解数据。但他的可视化功能同样不逊色,选择界面中的visualization,你会立刻明白:是它让你理解数据,然后你才让用户可视化数据。




结语

我们所处的这个时代,是一个知识大爆发的时代。仅就编程这项技能来说,现在几乎人人都能写上一两行,程序员这个群体也比十年前有了更多维度上的扩展。各种工具的使用门槛越来越低,带来的是行业壁垒日渐消弭。会用某种可视化手段,并不是区分小白与专家的唯一标准,笔者曾听说有人拿unity、易语言这样的神器来实现可视化。所以,眼花缭乱的工具永远只是辅助,真正决定你在可视化道路上走多远的,是你对可视化理念的准确把握和执着坚守。

参考资料:
1. 清华大学数据可视化课程讲义——张松海
2.《基本图表的特点和适用场合》
3.《20 款数据可视化工具》
4.《50个大数据可视化分析工具》
<hr/>转载自 THU数据派 官方微信公众号 作者 冯高洁

RecursiveFrog 发表于 2021-11-11 19:32

题主提到的是可视化“大数据”,但实际上我们可视化的东西并不是大数据本身,而是已经是去噪、分析、处理之后的“小数据”了。这里我就不介绍分析过程,只是聊聊可视化。

------------------------------------------------------------------D3.js-------------------------------------------------------------------

楼上多位答主提到了D3.js,我个人也非常推荐他,但这里就不重复介绍了。推荐几个案例:

1. The Wealth & Health of Nations(显示1800到2009年期间收入和预期寿命的动态图,非常赞)



2. The Facebook Offering: How It Compares(Facebook IPO市值和其他科技公司的比较)



--------------------------------------------------------------------dc.js-----------------------------------------------------------------

嫌D3太复杂,还有一个更简单的开源版本dc.js。基本上dc.js是将D3和Crossfilter封装起来。如果说D3是需要真正编程去“画”图,那dc.js只需要你用一些配置去指定图表的样式。在集成了Crossfilter,更可以将多个图表分为一组,使得对一个图标的操作可以同时联动其余的图表。

例如在下图中,点击最上面图表的任何一个圆圈(选中年份)会导致整个页面的其他图表跟着刷新,只显示该年份的数据。点此预览



--------------------------------------------------IBM Many Eyes (Cognos)----------------------------------------------------

终于到给公司打广告的时间了, @Yamei 居然没提到IBM自己的产品,你这么无情Ginni知道么。。
IBM Many Eyes是基于RAVE(Rapidly Adaptive Visualization Engine)。我不知道介绍内部产品的尺度是多少,但大概RAVE是一套从后台Java到前台Javascript都包含的可视化引擎。不过这货我没用过,只能截截图忽悠忽悠大家了。点击这里体验更多。





----------------------------------------------------The R Project(R语言)-----------------------------------------------------

抛开以上基于Web的,R语言也是分析可视化很好的选择。R语言强大之处是他适合真正去操作分析大数据(是的!某种角度可以替代SPSS!),再生成图表,唯一缺点就是对编程能力要求很高,而且图表谈不上漂亮。



以上。有想到新的再补充。

XGundam05 发表于 2021-11-11 19:42



数据可视化能以容易理解的格式将复杂的数据信息表示出来,让我们能直观的看到数据背后隐藏的规律和模式,从而帮我们更好的做出决策和预测。

熟练掌握数据可视化技能对很多职业都非常重要,特别是金融投资和管理咨询行业。而随着大数据逐渐应用到各个行业,越来越多的企业利用多种数字网络挖掘和分析数据,数据可视化也会越来越重要。

下面我们分类别列出一些超好用的数据可视化工具。(推荐收藏)

在线数据可视化工具


http://Infogr.am
Infogr.am 的 Free Model 中有不少选项,比如“画报”“词汇云”“树状图”等多种形式,可以让你很容易的可视化数据。另外还有内置模板用于处理信息图表,只需点击几下就能将 Excel 类型的电子表格转换为美观的可视化图形。
地址:https://infogram.com/




http://Visual.ly
Visual.ly 是一个数据可视化社区平台,可以在上面创建和分享数据可视化作品。
地址:https://visual.ly/

http://Ease.ly
Ease.ly 和 Inforgram 很像,很容易上手,上面有很多自定义信息图表模板,可以使用各种形状的选项,也能上传你自己的照片,为可视化图形添加文字。
地址:https://www.easel.ly/




Piktochart
Piktochart 的拖拽型用户界面可以让新手也能制作漂亮的图表,内置 400 多个模板,不管是工作汇报、客户展示还是社交数据总结,都可以生成让人眼前一亮的可视化报告。
地址:https://piktochart.com/




Venngage
利用 Venngage 能够将多种格式的数据绘制成漂亮的图表,还能在线分享。它和 Infogram 相仿,但和上面提到的几个工具比较而言界面更整洁。如果是制作一些简单和基本的图表, Venngage 是最佳选择。
地址:https://venngage.com/

MyHistro
MyHistro 是一款很有创意的时间线制作工具,也可以作为地图制作平台。不仅可以在制作时间时插入图片、视频和文本,也可以将信息在谷歌地图上展示出来。MyHistro 也有 iOS应用,可以随时随地使用。
地址:http://www.myhistro.com/




TimeGraphics
另一款创建时间线图形的工具,能够插入视频、文本、照片等。它的强大之处在于可以调用和兼容多个平台,如谷歌地图,YouTube,谷歌分析,谷歌搜索,谷歌日历,世界银行数据等等。
地址:https://time.graphics/

Visualize Free
Visualize Free 是一款将数据准备和数据可视化融为一体的平台,可以利用平台已经存在的数据集,也可以上传自己的数据集。将数据集上传后,Visualize Free 会帮你分析数据,然后将数据分析结果以可视化形式呈现出来,非常适合商业汇报。
地址:https://visualizefree.com/




在线数据可视化库

D3.js
D3.js 是一款在线 JavaScript 库,利用 HTML 和 CSS 可以制作出高水平的可视化图形,支持所有主流浏览器。
地址:https://d3js.org/




HighCharts
另一款 JavaScript 库,里面有很多图表选项,可以在浏览器中生成 SVG 图形,有很棒的动画效果。商务及非商务用途皆可。
地址:https://www.highcharts.com/

iCharts
如果需要在网站上做出数据可视化效果,可以用 iCharts,上面有很多交互式的元素,也能从 Google Docs 调取数据。其高度自定义选项能很好的匹配网站的设计。
地址:https://icharts.net/




Raphael
一款很方便使用的 JavaScript 库,具有多种图表选项,可用于个人网站。
地址:https://github.com/DmitryBaranovskiy/raphael

Flare
Flare 有很多用于运行于 Flash Player 的网页上的交互式数据可视化图形,支持视觉编码、数据管理和动画效果。
地址:http://flare.prefuse.org/

DyGraphs
DyGraphs 是一款快速灵活的开源 JavaScript 制图库,可以处理大型数据集,可高度自定义。
地址:http://dygraphs.com/

Exhibit
Exhibit 可以让你很容易创建具有高级搜索筛选功能、交互式地图、时间线和其它可视化图形的网页。因为它是开源工具,任何人都可以用它轻易创建多种多样的图形。
地址:http://www.simile-widgets.org/exhibit/

Modest Maps
Modest Maps是一款面向设计师的可扩展库,内置具有多种功能的自定义地图。
地址:http://modestmaps.com/

DataWrapper
利用DataWrapper可以很容易的为网站或博客制作出嵌入网页的可视化图表。
地址:https://www.datawrapper.de/

LeafLet
一款很先进的JavaScript库,可以制作基于地图的交互式可视化图形。
地址:http://leafletjs.com/




桌面可视化工具


Gephi
如果你想展现出社交关系或两个公司、个体等之间的紧密关系时,可以用 Gephi 做出直观的可视化图形。它是一款桌面应用,很方便用于画出关系图,也能处理数量较多的数据。
地址:https://gephi.org/




另外,QlikView 和 Spotfire 也是两款非常好用的可视化工具,而且还具有数据分析、数据清理等功能。
QlikView:
https://www.qlik.com/us/try-or-buy/download-qlikview

Spotfire:
https://spotfire.tibco.com/

InstantAtlas
这款桌面应用可以从你本地的Excel表里提取数据,然后在交互式地图上将数据可视化,能很直观的传达信息。不过这个工具需要付费,但是注册后可以免费体验一个月(所有功能),临时使用的话很划算。
地址:
https://www.instantatlas.com/desktop/

利用编程语言可视化数据


R语言
R 语言是一种可用于处理大量数据以及实现数据可视化的统计工具。R语言有很多库可以制作出特别精美的可视化图形。比如 Ggiraph,rChart,ggplot2 等。

Python
Python 中的 matplotlib,Seaborn,Pygal,Borkeh 等都可以用于数据可视化,我们曾有篇回答,详细列举了 Python 中的数据可视化库:
数据可视化的软件,个人使用的,求推荐,最好多说几个,多多益善?
对于如何使用它们,可以看看我们分享的这篇教程:
景略集智:超实用!用Python进行数据可视化的9种常见方法!<hr/>参考资料:
https://www.business2community.com/digital-marketing/make-data-pretty-utilize-data-visualization-tools-01156669

LiteralliJeff 发表于 2021-11-11 19:47

多的工具就一一介绍啦,重点介绍2款用得还不错的软件。
先上一波数据可视化效果,看看这样的你是否喜欢?

http://pic3.zhimg.com/v2-6608e60cc990b14a0c4484e4cb830ddf_r.jpg?source=1940ef5c
通过多种维度展示,利用丰富的图表,我们就可以直观地感受到世界的疫情分布情况以及确诊疑似治愈等重要信息,也能感受到,应对疫情防控,各地已取得了显著成果。

http://pica.zhimg.com/v2-98f661fb6f942b4abc4b58d48809f627_r.jpg?source=1940ef5c
通过园区感染大数据大屏,感染数据、排查数据实现动态互动,使园区疫情防控态势清晰可见、一目了然,提高了园区对疫情防控的统筹和研判能力。

http://pic2.zhimg.com/50/v2-488a9c2fe101fdb5817c28cfddd519ea_720w.jpg?source=1940ef5c
交通大屏集成地理信息系统、视频监控系统、交管部门各业务系统数据,对交通路况、警力分布、警情事件、接处警情况等要素进行综合监测,能够帮助管理者实时掌握交通整体运行态势。

http://pic2.zhimg.com/v2-37a89d7e413c694d248041e85ea45bbb_r.jpg?source=1940ef5c

车驾管可视分析:支持对接车驾管数据,对机动车、驾驶人、交通违法、交通事故等车驾业务数据进行多维度可视分析,展示城市交通画像,并可对异常数据进行告警,实现交通信息的综合分析研判,辅助用户全面掌握车驾管业务情况,为业务决策提供有力支撑。

http://pica.zhimg.com/v2-2b2bbba3fcad0dde653a503725185520_r.jpg?source=1940ef5c
消防大屏可基于地理信息系统,可将城市街道、地标点、建筑物、基础设施、视频数据等要素信息进行详细的展现,实现管辖区域内“人、车、地、事、物”的全面监控,辅助消防部门综合掌控大范围城市消防态势。同时也可对场所重点部位、警力资源、告警事件等消防要素的实时状态进行可视化监测,辅助用户掌控微观消防态势。

http://pica.zhimg.com/v2-cc110bc1afefc90fe34fd2ca1b7b546b_r.jpg?source=1940ef5c

消防警情告警可视化:支持各类火灾警情、抢险救援警情等报警事件的态势显示、快速定位并标示报警内容。同时可自动筛选报警地周边监控视频和警力资源,方便指挥人员对周边情况进行判定和分析,对报警事件进行前期的处理及分配。

http://pic3.zhimg.com/v2-03e2e0f4043b8ea65e25219ea514022f_r.jpg?source=1940ef5c
智慧电力可视化大屏有效整合电力部门现有信息系统的数据资源,覆盖基建、运检、调度、生产、营销、安监等多个业务领域,凭借先进的人机交互方式,实现数据融合、数据显示、数据分析、数据监测指挥等多种功能,可广泛应用于监测指挥、分析研判、展示汇报等场景。

http://pic3.zhimg.com/v2-d51a7e262e41afae75af1f5747d38df1_r.jpg?source=1940ef5c

电厂数据监控:支持通过三维建模,对电网各类设备设施的外观、复杂机械结构等进行三维仿真显示,并可集成视频监控、设备运行监测、环境监测以及其他传感器实时上传的监测数据,对设备位置分布、类型、运行环境、运行状态进行监控,支持设备运行异常(故障、短路冲击、过载、过温等)实时告警、设备详细信息查询,辅助管理者直观掌握设备运行状态,及时发现设备安全隐患。
这是什么工具做的?

ABI是用于可视化分析数据的商业智能工具,融合了ETL数据处理、数据建模、数据可视化、数据分析、数据填报、移动应用等核心功能的全能型数据分析平台,纯Web的报表设计器,类Excel的操作方式,所有操作无需定义复杂公式,仅需拖拉图表、参数,指标拾取即可快速完成各类可视化报表。

http://pic2.zhimg.com/v2-042df80bba51b807d3e98d5e06596815_r.jpg?source=1940ef5c

工具直通车:
亿信ABI一站式大数据分析平台-全能型数据可视化分析工具领导驾驶舱:ABI系统内置数百种图表组件,可直观展示和监测企业运营情况,为企业高层提供一站式决策支持。
大屏可视化:制作酷炫的数据可视化大屏,动态刷新数据,实时监控各项指标动态。3D可视化:结合全景3D建模和数据分析引擎,可建设智慧城市,3D设备管理等,实现端到端的数据可视化。GIS地图应用:无缝对接多个GIS地图平台,可实现地理相关信息的综合数据分析和展现。敏捷分析:完全面向业务人员,无需任何技术能力,只需简单的拖拽便可完成一张数据可视化看板。中国式复杂报表:类EXCEL在线设计器,支持多级表头、表元合并,多级浮动、分组、斜线表元、多表体等复杂的报表样式,可随心定义任意”格式复杂,信息量大”的中国式复杂报表。
为什么能实现这么酷炫的可视化效果呢?

1、丰富的统计图库

ABI采用JS、FLASH、HTML5三种技术自主开发统计图,丰富的统计图保证了其具有美观的图形展现能力,除了常用的柱状图、线状图、条形图、面积图、饼图、点图、仪表盘、走势图外,还支持和弦图、圈饼图、金字塔、漏斗图、K线图、关系图、网络图、玫瑰图、帕累托图、数学公式图、预测曲线图、正态分布图、迷你图等,样式包括2D、3D、EXCEL、AUTUMN、FLASH等;通过组合设计可以搭配出上千种视觉效果。

http://pica.zhimg.com/v2-79261c666afe6b021ab98f95689f3fce_r.jpg?source=1940ef5c
2、多类地图应用

内置五大洲及世界地图、中国地图,囊括中国34个省239个市区县的地图,地图类型包括FLASH、图片和HTML5格式,同时支持个性化定制地图。

http://pic1.zhimg.com/v2-4227d063b3484dea4d2df3d501c22d20_r.jpg?source=1940ef5c
同时也支持GIS地图的应用,使用天地图、ArcGIS、百度地图平台,并可拓展。支持通过点选、框选方式实现地图上数据查询、统计、钻取、预警、渲染、统计图联动、信息提示等。

http://pica.zhimg.com/v2-e78b25da45344904d1c33eaae403353e_r.jpg?source=1940ef5c
(有兴趣可以直接注册账号云上体验,与本地版功能一样)
ABI这个工具更适合技术人员使用,如果你是一个业务人员,也想自己上手做可视化的图表,那就推荐豌豆BI这款工具。

http://pic1.zhimg.com/v2-839fd33c81a1686bb7038230d925c50f_r.jpg?source=1940ef5c
支持灵活的自由式布局、组件化的统计图、丰富的数据统计函数、灵活的筛选功能、智能的图表联动,用户只需通过简单的拖拉拽,就可以快速地制作出一张敏捷看板。
支持数据预处理:对于接入系统的数据,通过点选式的方式进行去除重复行、空值替换、数据裁剪、数据脱敏、类型转换等复杂的数据处理操作,并且能进行图形化界面多表关联。

http://pic3.zhimg.com/v2-d40a92305070d9a9b1055318640fa1f1_r.jpg?source=1940ef5c

智能图表推荐:根据拖拽的指标和维度,识别最优的展现形式,来进行智能推荐。比如当用户使用“地区”这样指标时会自动使用地图进行数据展现。

http://pica.zhimg.com/v2-03f785e4e12edb869e2bacb83a8957db_r.jpg?source=1940ef5c

智能联动钻取:所有图表无需任何设置即可联动,也可自定义选择部分图表参与联动和下钻。

http://pica.zhimg.com/v2-d9fcd7281025d39b82e42d051984f079_r.jpg?source=1940ef5c
工具传送门:亿信豌豆BI下载试用-真正的免费敏捷BI-自助式分析工具_个人用户终身免费工具传送门:
亿信豌豆BI-敏捷BI自助式分析工具|商业智能BI工具与大数据分析平台如果上面的工具不能满足你的话,可以联系我。当然,如果你还有数据采集、数据治理、数据挖掘等需求,也可以联系我。

关于亿信华辰

亿信华辰是中国专业的智能数据产品与服务提供商,一直致力于为政企用户提供从数据采集、存储、治理、分析到智能应用的智能数据全生命周期管理方案,帮助企业实现数据驱动、数据智能,已积累了8000多家用户的服务和客户成功经验,为客户提供数据分析平台、数据治理系统搭建等专业的产品咨询、实施和技术支持服务。

http://pica.zhimg.com/v2-179133d743401d5ed0ac7f1980286ae7_r.jpg?source=1940ef5c

△亿信华辰全产品架构图(点击查看大图)


欢迎关注公众号:亿信华辰Pro
-让数据驱动进步-
页: 1 [2]
查看完整版本: 如何将枯燥的大数据呈现为可视化的图和动画?