以DataFocus为例,简单介绍一下如何从0搭建BI系统。

一、接入数据

大型企业集团多年的IT信息化建设,积累了海量的数据,这些数据分散在多达数十种的业务系统数据库中,形成了一个个数据孤岛。这一方面导致了数据标准不统一、无法准确的进行分析;另一方面,传统关系型数据库的查询性能也越来越低,导致分析效率的低下。

DataFocus标准版以上版本自带的大数据仓库,能够轻松对接各类传统关系型数据库抽取数据或直连数据。独有的雪花模型,支持复杂的数据库结构;通过多数据源整合,支持跨系统分析,彻底打破数据孤岛。

数据分析

数据分析

二、数据清洗

数据清洗工作是数据分析工作中不可缺少的步骤,如果不清洗数据的话,那么数据分析的结果准确率会变得极低。另外数据清洗工作占据数据分析工作整个过程的七成以上的时间,所以说我们要格外的重视数据清洗工作

数据清洗的具体步骤包括但不限于数值口径统一、删除或补充空值、异常值处理、列拆分、列合并、修改数据类型、分组等。

将现有的数据进行归类整理,将一些结构不规范、零散的数据进行清洗、关联,创建数据模型,这为后续使用DataFocus进行分析创造了条件。

三、数据分析

这一步就需要发挥分析师的逻辑思考能力和想象力,对数据进行有效的探索,逐步揭示出事物运行的规律,找到解决问题的钥匙。探索分析过程往往需要大量的尝试和重复操作,这个时候,高效的探索分析工具显得尤为重要。

四、数据可视化

将数据分析的结果进行可视化展示和分享,这一步是传达整个数据分析项目价值的关键一步,因此要善用视觉可视化的基本原则。数据可视化方式多种多样,每种不同的展示方法都从特定的视角表达了信息,但是遵从数据可视化设计原则,可以更好地向读者展示数据的内在规律。

1.一个类别只用一种颜色;

2.排序和分类要符合逻辑;

3.使用标注突出重点信息;

4.展示多种数据时尽量用可对比的方式进行;

5.减少不必要的标签;

6.单个图形颜色不要超过6种;

7.谨慎使用分散注意力的字体或原色。

标签: , , , ,
版权声明:除非注明,否则均为DataFocus企业大数据分析系统 原创文章,转载请以链接形式标明本文地址。否则将追究法律责任。
转载请注明来源:https://www.datafocus.ai/38155.html
上一篇:
下一篇: