数据仓库基础应用
一.数据仓库的类型
三种主要类型的数据仓库 (DWH) 是:
- 企业数据仓库(EDW):企业数据仓库 (EDW) 是一个集中式仓库。它为整个企业提供决策支持服务。它提供了一种用于组织和表示数据的统一方法。它还提供根据主题对数据进行分类的能力,并根据这些部门提供访问权限。
- 运营数据存储:当数据仓库和 OLTP 系统都不支持组织报告需求时,操作数据存储(也称为 ODS)只不过是所需的数据存储。在ODS中,数据仓库是实时刷新的。因此,它被广泛用于日常活动,例如存储员工的记录。
- 数据集市:数据集市是数据仓库的一个子集。它专为特定业务线而设计,例如销售、财务、销售或财务。在独立的数据集市中,数据可以直接从来源收集。
二.数据仓库的一般阶段
早些时候,组织开始使用相对简单的数据仓库。然而,随着时间的推移,开始使用更复杂的数据仓库。
以下是使用数据仓库 (DWH) 的一般阶段:
- 离线操作数据库:在这个阶段,数据只是从一个操作系统复制到另一个服务器。这样,复制数据的加载、处理和报告不会影响操作系统的性能。
- 离线数据仓库:数据仓库中的数据定期从操作数据库更新。Datawarehouse 中的数据被映射和转换以满足 Datawarehouse 目标。
- 实时数据仓库:在此阶段,每当操作数据库中发生任何事务时,都会更新数据仓库。例如,航空公司或铁路订票系统。
- 集成数据仓库:在此阶段,当操作系统执行事务时,数据仓库会不断更新。然后,数据仓库生成传递回操作系统的事务。
三.数据仓库的组成部分
数据仓库的四个组件是:
- 负载管理器:负载管理器也称为前端组件。它执行与将数据提取和加到仓库相关的所有操作。这些操作包括为进入数据仓库准备数据的转换。
- 仓库管理员:仓库管理员执行与仓库中数据管理相关的操作。它执行诸如数据分析以确保一致性、索引和视图的创建、非规范化和聚合的生成、源数据的转换和合并以及归档和烘焙数据等操作。
- 查询管理器:查询管理器也称为后端组件。它执行与用户查询管理相关的所有操作操作。此数据仓库组件的操作是直接查询适当的表以安排查询的执行。
- 最终用户访问工具:这分为五个不同的组,例如 1.数据报告。2.查询工具。3.应用程序开发工具。4.EIS工具。5.OLAP工具和数据挖掘工具。
四.数据仓库的用途
- 整合公司所有业务数据,建立统一的数据中心。
- 产生业务报表,用于作出决策。
- 为网站运营提供运营上的数据支持。
- 可以作为各个业务的数据源,形成业务数据互相反馈的良性循环。
- 分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果。
- 开发数据产品,直接或间接地为公司盈利。
作者:liuyang 创建时间:2023-09-19 17:33
最后编辑:liuyang 更新时间:2023-10-23 13:28
最后编辑:liuyang 更新时间:2023-10-23 13:28