你的数据出现过“异常”的峰值么?当数据出现峰值时,你是如何解决的呢?


你的数据出现过“异常”的峰值么?当数据出现峰值时,你是如何解决的呢?

之前提到,当数据出现异常时,我们的首要任务是对问题进行分类,以确保能快速响应最重要的问题。对于需要我们关注的问题,我们可以对比一下过去的数据,以确定该“异常情况”是否正常或季节性趋势。

大屏.png

那么,除此之外,我们还可以如何确定数据是否真的“异常”,并进行解决呢?

1、数据是否存在质量问题

你的峰值可能是由数据质量问题引起的,而不是现实世界的变化。

当收集或记录数据的方式存在问题,或者由于非真实输入时,就会出现数据质量问题。常见问题包括:

  • § 工具中断
  • § 内部测试
  • § 损坏的代码(例如事件跟踪)
  • § 更改你的平台
  • § 机器人
  • § 垃圾邮件(例如垃圾邮件注册)
  • § 导致事件触发/不触发的错误
  • § 人为错误/未完成手动步骤
  • § SQL 作业未运行

一旦你排除了一些导致数据质量问题的更常见原因,你就应该着眼于验证峰值。

使用数辅助据来验证峰值

如果你的 KPI 确实飙升,那么导致该峰值的原因可能会影响其他相关指标。

image.png

例如,我们的页面浏览量真的增加了,但两个密切相关的指标(会话和唯一页面浏览量)没有增加。只有一个指标出现峰值,这表明存在数据质量问题。

同样,你可以使用不同的工具来跟踪相同的指标。不同工具报告的数据之间的差异是数据质量问题的信号。

例如,如果你的分析工具没有记录到支付页面的网站流量,但你的支付工具记录了持续的新支付,那么你的数据质量可能存在问题。但是,如果这两个工具都记录到了下降,那么更有可能是在用户旅程中发生了一些事情导致。

2、分割数据,进行细分

分割数据是检验现有观点和推动新观点的一种好方法。

例如,我们看到12月的销量大幅下降。

2020每月销量.png

如果我们假设,这是由我们运营所在国家/地区的国定假日造成的,那么你可以根据国家/地区对数据进行细分,从而很容易地检验这一观点。如果这是真的,你会看到这个国家/地区的销量下降,而其他是正常的。

2020区域每月销量.png

如果你没有任何可行的看法,那么按不同变量进行分割可以提供线索。例如,按采集源对数据进行细分。

当然,这本身并不能解释导致问题的根本原因,但它确实给了我们下一步调查的方向。你可以重复这个分割过程,以深入了解导致峰值的具体原因。

3、有什么改变么?

另一种方法是提出一个非常简单的问题,即有什么变化吗?

我们改变了什么吗?

从内部开始,检查是否有新的更新、新功能、工作领域。并密切关注事件的日期和顺序。如果事件的顺序不匹配,可以排除工作上的原因。这种方式还能够揭示巧合,当两件不寻常但看似无关的事情同时发生时。

保持完全开放的心态很重要。出现峰值的原因可能是完全不相关的事情导致的意外结果。通常,这是因为某处发生了变化。

外面的世界有什么变化吗?

当然,你不能调查所有事情,但一定要从有嫌疑的地方开始。如果你的峰值与网络流量有关,请检查网站是否更新了他们的算法。如果你的峰值与 IT 系统故障有关,请检查其他用户是否发生了同样的事情。

4、让他人参与

可以询问一下其他人,他们自己的数据有没有出现峰值?有谁知道是什么原因导致的么?

你的团队是解决数据问题的最佳资源之一。他们可以贡献宝贵的知识和观点!

5、持续监控

尽管可能令人沮丧,但你应该接受并非总能找到数据峰值的真正起因,至少不是马上可以找到。

而这种数据“异常”情况可能会再次发生。

如果它再次发生,那么你就有了一个再次发生的问题,这对你和你的企业来说意义重大。

此外,如果它再次发生,你将有两倍的数据点需要调查和比较。

所以,我们最好继续进行监控。因为你知道的越多,最终发现问题起因的可能性就越大。你可以在DataFocus中创建实时 KPI 仪表板,来跟踪重要的指标,设置阈值预警以及时获得提醒。

看板.png 官网.png

 

声明:DataFocus|版权所有,违者必究|如未注明,均为原创|本网站采用BY-NC-SA协议进行授权

转载:转载请注明原文链接 - 你的数据出现过“异常”的峰值么?当数据出现峰值时,你是如何解决的呢?


让数据分析像搜索一样!