当数据中出现“峰值”时,就一定代表好或者糟糕么?正如我们所知,数据可能具有欺骗性,不能贸然下结论。
那么,当数据出现这样的“异常”时,我们如何解决呢?
1、这个指标重要吗?
首先,先确定一下这个指标是否重要。对问题进行分类,可以确保我们快速响应最重要的问题,而不必分散注意力。
问问自己,这个峰值是否真实并代表了现实世界的变化?后果会很严重吗?它们需要多大程度的关注?
情景A:意义重大,需要紧急关注。
这可能是一个关键问题,因此您可能需要开始一个并行过程。对问题作出真实的回应,同时开始调查过程。请记住,要向他人清楚地传达您能够验证数据的程度。
情景B:很重要,但不需要紧急关注。
安排一段时间来调查这类问题(并确保您坚持到底)。因为,如果您对数据中的每一个问题都立即响应,那么您可能无法完成其他事情。
情景 C:不会有任何重大后果。
请记住,并非每个异常都需要详细调查。当然,对于任何处理数据的人来说,好奇心都是一种宝贵的品质,但效率也是如此。生活在“大数据时代”并不意味着你必须跨越每一个数据点,聪明人会选择关注重要的指标。
2. 尖峰只是一种自然变化吗?
有时我们会看到数据中的异常情况,实际上这些异常情况是完全正常的。问问自己:指标通常表现如何?它通常是稳定的,还是带有变化?(换句话说,它的起伏大吗?)
一个简单的检查方法是查看趋势如何随时间变化。以前有过如此极端的尖峰吗?当前的峰值是否与更广泛的趋势一致?
例如下图,一位客户经理正在查看过去几天的平均首次响应时间,并已经注意到数据中出现了一个峰值。那么,这一天的响应时间,真的出现了异常么?
因为这个指标有很大的差异,尤其是在每天计算的时候。通过查看一段时间内的趋势线,经理可以看到这个峰值是完全正常的。
通常,就像上面的例子一样,查看一段时间内数据的波动,会告诉你峰值是否正常。但是,如果您想更加严谨,可以采用统计过程控制(SPC)。
3. 考虑季节性趋势和自然周期
一些指标因自然周期而异。例如,许多销售模式与日历年相关。想想春节前后的消费者购买行为以及情人节前、双十一活动或夏季的冰淇淋销售情况。
当我们正确确定自然周期时,我们可以使用它为我们的数据添加有价值的信息。例如,确定某电商数据中6月和12月的峰值是正常的还是季节性趋势的结果。
在DataFocus中搜索“销售数量 按年统计 按月统计”,为数据添加年度比较。
同样,对周期的认识可以帮助我们发现是否发生了原本看似正常的异常情况。例如,某产品在11月的销量通常会上升,但2020年没有发生这种情况。如果没有比较,我们可能会错误地将趋势线解释为“正常”,而没有发出警报。
进行周期性或季节性比较时要小心,因为它们可能会倾向于我们自己的偏见。
接下来,我们可以对数据再进行一些验证或假设。敬请关注后续内容......