动词 (verb的缩写)常用图表对比(20191209-15)
以“可视化目标→数据集准备→图表选择对比→经验总结”为例进行对比。
相似之处:
直方图和条形图的数据结构由“一个分类字段+一个连续数值字段”组成。
当数据记录的数量不超过12,且分类字段的字符长度小于5时,直方图和条形图可以互换。
差异:
直方图:如果分类字段为“时间序列”,此时建议使用直方图,因为直方图更能反映数据随时间的变化。
条形图:如果分类字段字符较长,记录数大于12,建议使用条形图。斜体字一方面有违用户的阅读习惯,同时也占用了页面空间,影响了视觉图表的美感。
相似之处:
直方图和直方图的数据结构都是圆柱条,有“一个分类/分组字段+一个连续的数值字段”。
差异:
分析的目的不同于适用的场景。“直方图”主要是比较数据的大小,“直方图”是用来显示数据的分布情况。
映射在x轴上的数据属性是不同的。在直方图中,X轴上的变量是分类数据;直方图中,X轴上有连续的分组区间,通常用数字表示,一般组间距相同。
宽度代表不同的含义:在直方图中,列的宽度没有实际意义,将需要相同的宽度;在直方图中,列的宽度表示间隔的长度(即区间)。根据区间,列的宽度可以不同,但原则上应该是区间的整数倍。
数据大小有不同的表示方式:直方图,通过柱条的高度来映射数据大小,柱间有间隔;直方图以高度(频率直方图)或面积(频率直方图)表示数据的大小,各列紧密相连,没有间隔。
相似之处:
堆积直方图和百分比堆积直方图都适用于显示分类数据的成分对比或成分随时间的变化趋势。
当映射到X轴上的数据是时间序列时,可以使用堆积面积图或百分比堆积面积图。
差异:
堆积直方图:既可以比较各个分量的数值差异,也可以观察每组数据的整体差距。
百分比堆积直方图:只能比较各成分在整体中的比例差异,不能比较不同整体的差异。
折线图和面积图不可互换:显示成分或比例时,应使用面积图?堆积面积图或百分比堆积面积图。
相似之处:
折线图和面积图显示的是数据随时间的变化趋势,所以映射到X轴的数据类型一般是“时间/日期”。两者都可以显示一个或多个变量与时间的关系,包括周期性变化、季节性变化、异常波动等。在大多数情况下,折线图和面积图是可以互换的。
差异:
折线图:通过数据点的纵坐标来映射数值的大小,一般只用来表示数据的趋势。
面积图:数值的大小按面积映射。面积图除了可以代替折线图,还可以用来表示整体及其组成部分随时间的变化趋势。
注意:当使用面积图表示多个系列的趋势时,需要为表示不同系列的面积块的颜色设置透明度。透明度可以减少不同系列之间的覆盖,帮助我们看到不同系列之间的重叠关系和更多信息。当一个图表中的系列值过多时,折线图会比面积图更直观,因为它减少了系列的覆盖和重叠,可以清楚地看到各个系列的趋势变化。
相似之处:
堆积面积图和百分比堆积面积图都是映射到X轴的时间序列。
可以显示各成分随时间的变化趋势,但“堆积面积图”显示的是成分实际值随时间的变化趋势,“百分比堆积面积图”显示的是成分所占比例随时间的变化趋势。
差异:
堆积面积图:既能显示各成分随时间的变化趋势,又能显示整体随时间的变化趋势。
百分比堆积面积图:只能显示各成分在总体中所占比例随时间的变化,不能观察总体随时间的变化趋势。从任意时间节点垂直切开,各部分比例之和为100%,等于整个节点。
相似之处:
堆积面积图和堆积柱形图的数据集格式类似,都是由“一个分类字段+多个连续数值字段”组成,多个连续数值字段是一个整体的组成部分。
两者都可以观察一个节点的整体值和各个分量的具体值,都有数据对比的功能。
差异:
堆积面积图:堆积面积图的分类字段,通常是时间序列。当需要分析整体随时间的变化趋势,了解整体各组成部分随时间的变化情况时,应使用堆积面积图。从它的用途可以看出,堆积面积图的分类字段(即时间序列)是按时间顺序排列的。
堆积直方图:堆积直方图的分类字段,一般是非时间类型的分类数据。在比较不同整体的数据量和观察整体的各个组成部分的数据量时,应该使用堆积直方图。如果整体中组件过多,为了突出重点,需要对组件进行重新分类,以显示TOP5的分类,其余归类为“其他”。
相似之处:
散点图和气泡图都是用来显示数据分布的图形。
散点图和气泡图都是将两个字段映射到X轴和Y轴的位置,(X,Y)的值决定了一个点或气泡在直角坐标系中的位置。
差异:
散点图:一般用来显示二维数据(x,y)的分布,重点是二维数据的两个变量x,y之间的相关性。在散点图中,还可以显示多组数据序列的比较,比如分布规律的比较。
气泡图:一般用于显示三维数据(x,y,z)的分布。与散点图相比,气泡图增加了一个数据展示的维度,将数值映射到气泡大小。气泡图还可以显示多组数据序列的分布情况,从而发现不同序列的分布规律和差异。
注意:
一般来说,散点图主要用于研究数据集的分布规律和相关性,并不太关注每个数据点的具体数值。当数据集的数量太大时,不适合在散点图中显示所有数据点。这时候就需要对整个人群进行抽样展示,通常采用分层抽样的方式,但分层抽样的依据和影响因素需要根据具体的业务场景来确定。
与散点图相比,气泡图不适合数据容量太大的情况,气泡过多会使图表难以阅读。另外,对于气泡图中隐藏的一些数据信息,通常可以利用交互来辅助图标信息的读取,比如悬停显示详细数据,缩放观察覆盖的数据点等等。
1.想知道所有配送物品单价的分布,每10元为一个区间?
?因为是(单价)分布,所以考虑散点图,但是因为要分类的项目太多(使用子类别),所以在纵轴使用对数比例,解决价格分布不均匀的问题。
2.展示销量TOP5的第二类产品?
TOP5是从二级分类中筛选出来的,可以用一个普通的直方图显示出来。
3.按月显示商品销量趋势?
因为是为了显示趋势,所以选择折线图。
4.展示不同年份的商品销量,以及三种运输方式在不同年份的占比?
因为需要显示数量和比例,所以选择饼状图。
在可视化之前,我们需要明确可视化的目的,期望展示或探索数据的规律。这就决定了你应该选择什么样的图表,如何统计和组装你的数据集,可视化效果能否达到预期目标。
参考阅读:
1.如何优雅地选择数据图表:常用图表的比较