数据仓库系统结构模型.ppt
《数据仓库系统结构模型.ppt》由会员分享,可在线阅读,更多相关《数据仓库系统结构模型.ppt(69页珍藏版)》请在第壹文秘上搜索。
1、Inmon数据仓库设计体系结构化环境三级模型高级模型中级模型低级模型性能优化目录目录数据仓库设计概述与数据库设计的区别处理类型应用需求设计目标数据来源设计方法对比内容对比内容数据库系统设计数据库系统设计数据仓库系统设计数据仓库系统设计面向的处理类型面向应用面向分析应用需求比较明确不太明确系统设计的目标事务处理的并发性、安全性、高效性保证数据的四个特征和全局一致性数据来源业务操作员的输入业务系统系统设计的方法需求驱动数据驱动数据仓库设计概述数据仓库设计概述数据仓库与数据库设计的区别处理类型不同处理类型不同数据库系统设计 面向应用来进行设计,根据具体的操作事件和操作对象(实体)来进行设计; 目的是
2、建立一个操作型的数据环境。 从需求开始,逐步展开数据仓库设计 面向分析的; 从最基本的主题开始,不断完善已有主题,发展新主题; 最终建立起一个面向主题的分析型数据环境。应用需求不同应用需求不同n 数据库系统设计 面向明确的应用需求 设计人员能够清晰地了解应用的需求和数据流程n 数据仓库设计 很难获得对用户需求的确切了解 应用人员往往是企业的中高层人员 他们自己一开始不知道想看什么,需要引导 后期又想什么东西都看,需要解释系统设计的目标系统设计的目标数据库系统设计为了进行OLTP处理通常是对一个或者一组记录的查询和修改,“一次一集合”主要为企业的特定应用服务的事务处理响应时间、数据的安全性和完整
3、性是系统的目标数据仓库设计为了分析决策主要目标是保证数据的四个特征(面向主题、集成的、稳定的、时变的),建立起一个全局一致的数据环境,作为企业决策支持的基础只有查询而无更新,“一次加载一批”对响应时间不敏感数据量大,海量数据数据来源不同数据来源不同数据库系统设计 数据来源主要是业务操作员的输入 描述如何通过操作员输入获取数据 描述如何将获取的数据按照OLAP的需求合理存放 如何使得OLTP的性能更加优化 如何保证事务处理的安全性数据仓库设计 数据主要来源于业务系统 主要解决如何从业务系统中得到完整一致的数据 如何对数据进行转换、清洗、综合,ETL 如何有效提高数据分析的效率与准确性系统设计方法
4、不同系统设计方法不同数据库系统设计“需求驱动”;先收集需求、分析需求,再进行设计和开发;系统的需求在收集和分析需求阶段之后就定下来了,一旦进入构建数据库阶段,系统的需求就基本不变了。数据仓库设计“数据驱动”从业务系统已经存在的数据出发,获取之后对数据进行集成并检查数据的准确性按照分析领域对数据及数据之间的联系重新考察,组织数据仓库中的主题。“数据驱动”的系统设计方法的优点是可以通过了解原有数据库系统中的数据和需要建设的数据仓库中主题的数据的共同性,最大限度地利用现有系统,减少系统建设的工作量。开发生命周期开发生命周期-CLDS传统的数据库系统的系统开发生命周期(SDLC)是需求驱动的,而数据仓
5、库系统的开发生命周期则是数据驱动的,与SDLC相反,一般写作CLDS,这种写法没有对应的实际意义,是一种幽默的写法。CLDS由数据开始,一旦数据到手就集成数据。然后,如果数据有偏差,就检验看看数据存在什么偏差。再针对数据写程序,分析程序执行结果。最后,系统需求才得到了理解。因此,CASE工具和技术用于数据仓库领域是不合适的。 促销分析促销分析 销售分析销售分析 市场分析市场分析 产品组合分析产品组合分析 财务绩效分析财务绩效分析 合并报表合并报表 EIS 管理报告管理报告 公司季报、年报公司季报、年报 投资者报表投资者报表 预测模型预测模型 指标体系指标体系 业务模式规划业务模式规划 What
6、-if分析分析 投资预算投资预算 长期发展预算长期发展预算 战略规划战略规划 日常运营预算日常运营预算数据仓库 / DM 螺旋式方式业务需求分析业务需求分析设计设计建造建造测试测试培训培训试点试点部署部署使用运行使用运行监控监控维护维护确认新需求确认新需求/改进改进实施范围实施范围业务驱动的业务驱动的需求分析需求分析设计设计建造建造测试测试培训培训试点应用试点应用部署部署使用使用监控监控维护维护发掘新需求发掘新需求和改进和改进两种数据仓库设计两种数据仓库设计Inmon数据仓库数据库设计的模式三级模型(高级、中级、低级)存储:关系数据库Kimball数据仓库维度建模技术维度设计/度量设计存储:多
7、维数据库/关系数据库两种数据仓库都需要面临的主要设计问题粒度与分割元数据ETL索引小结小结数据仓库的设计不同于事务处理的数据库的设计,是一个循序渐近的过程。数据仓库的选型是一个非常重要的问题,当前,选用Kimball数据仓库进行设计是很流行的,因此,实践中可优先考虑。面对复杂的数据,基于维度建模技术的Kimball数据仓库显得无能为力,还需要深入探索,因此,面向复杂数据类型的数据仓库是目前的研究热点。数据库数据库设计的三级模型设计的三级模型概念模型从客观世界到主观认识的映射首先将现实世界抽象为概念模型,然后再用适合计算机世界的模型和语言来描述ER图逻辑模型ER模型关系模型规范化视图约束物理模型
8、DBMS选型选择数据库文件的存储结构索引分配存储空间Inmon的三级模型的三级模型高级模型(高层模型)高级模型(高层模型)(数据库设计(数据库设计-概念模型)概念模型)即概念模型,用即概念模型,用E-R图表示图表示首先将现实世界抽象为概念模型,然后再用适合计算机世界的模型首先将现实世界抽象为概念模型,然后再用适合计算机世界的模型和语言来描述和语言来描述中级模型(中层模型)中级模型(中层模型)(数据库设计数据库设计-逻辑模型)逻辑模型)数据项(数据项(Data item set,DIS)模型)模型ER图的细分图的细分每个主题都与一个每个主题都与一个DIS对应对应DIS中的数据分为中的数据分为4个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 系统 结构 模型
