34招精通商业智能数据分布分析

2020/12月/16BI 3.0, 大数据技术与运用0 条评论

分布分析用于展现同一维度下不同个体的分布情况。例如,散点图、直方图就是分布分析的普遍应用。本章内容涵盖次数分布分析、时间分布分析、合计百分比分布分析等案例。

1. 次数分布分析

商业场景:本节案例为分析客户购买次数分布,主要目的在于找出一段时间范围内客户购买的规律。

图1所示为依据客户ID统计客户购买次数的分布情况。结果呈现正态分布,即大部分客户的购买次数为5~7次,分析师可进一步分析这组客户的用户特征,获取更有价值的洞察。

C:\Users\datafocus\AppData\Local\YNote\data\weixinobU7Vjgr3B4YDfKPbe-slVjqMOL0\d9ed648512f64fe29a2b406d4369ade4\clipboard.png

图1:依据客户ID统计客户购买次数的分布情况

解题思路:

1. 依据【客户ID】字段,计算订单数,并保存为中间表。

2. 依据步骤1中生成的中间表,按订单数进行不重复计数(每个客户ID只进行1次计数)。

在DataFocus中的实现步骤:

DataFocus中选择数据表,在左侧选择【客户Id】列,输入【unique_count(订单Id)】,对客户购买次数进行非重复计数。需要提醒的是,必须使用【unique_count】进行非重复计数,避免统计重复的订单。

完成后,将结果保存为中间表,重新选择数据表将中间表导入。在DataFocus中提供了中间表用来将新生成的维度快速保存下来,进行下一步操作。

选择新增公式,命名为【按订单数排序】,公式=【to_integer(to_string(订单数))】。保存后在搜索框中输入count(客户Id),左侧选择公式输入,工作表中立马出现了柱状图,按购买次数升序显示对应的客户数量。结果如图1所示。

可视化实现:

柱形图。柱形图有利于呈现客户购买次数的分布情况。

 

0条评论

递交一条评论

邮箱地址不会被公开。 必填项已用*标注

DataFocus Cloud 让数据分析像搜索一样简单!

AI驱动,SaaS部署,引领数据分析云时代!