SAS 数据仓库方法论.docx
《SAS 数据仓库方法论.docx》由会员分享,可在线阅读,更多相关《SAS 数据仓库方法论.docx(5页珍藏版)》请在第壹文秘上搜索。
1、SAS数据仓库方法论目* II快一垄际方法论浏览o1,K么是一邦仓库O2.龙史数据仓库侑北齐现金O3.龙一仓一的技术募由O4,敷一仓库的一术将在o5,K-与雷图/饵仓库的目标o6.关悚成方国亲 B.SAS独立秋线生在方法花的胡巧o】业务夔动o2.收集需求的一Oo3.快速应用开发(RA1.O C.方法论的框栗A.快速童率方法论浏览一个企业在开发和实施敛播仓扉时,傥用一个音效和经验证的方兴论是关键婚.达一点巳是十分清笑的T.专座到这一点,多年未SAS研比.开展和我麦丁经验在利实施敷据仓库的方法论.我们件之为伐金成库方法论.本文件的这一节科福城达午方法论.1 .什么是蒙冬仓、?一个敛据仓库通*是一个
2、分嵌的敷据存储,在冀中信息是存为达4的一种形式,它适合于史务智健化和决策支持皋徙.据可能是以不冏形式有枕的,它并不影南O1.ni系蜕的运作.依据仓库的建立是用一林循环的i?步克善的过也而不是一步完善切.概括仓库通常是与解决企土不断致受的组织凡题的个过程有关.数据仓库通常是图绕主更凄立的.主Jg就是企业界兴JS的论题.比方你门、活动和爆作结果.敦据仓库的站构是由效据仓岸应淌足的应用决定的.快速报次信息是成功矣疑数据仓库的关钝.由于这一点,花引入T象鼓粕集市和信息臬市这处楂急.我寻呆市是敷籍仓库的一个孑集,它通常史力噬括.以满足对关心敷搭的查询有比我据仓库本身更快的速度。稿息集市存储可用生亩引hi
3、wcr)显示的Bi处理的信息.在信息集市中*包去以下儿荚信息;报告输出(打印的文本.观形等)多媒体介质(录京和录&内容的记录电子盘用2 .电文效福仓寿的史寿爱由效据仓肆为管理者和业务用户提供其正决立支琼的基础.企业为这些业务用户存储了多年的信息,但是数据仓库渔供方为他们设计的甫狗架的信息.数捉仓库实侑的最初阶段姓往娶饵决现成依义务同题(即较为枝动的),而以后总实电博是更为主动的.知据仓库的一个我In是它支持对数蠢的限时需委的查询和进行未方案典数据板术的需,就是说,数据仓库给史齐用户以不同方法分析数据的前:力和自由度.而不受我先设定的一俎系告的眼用。3 .建立效,舍库的技术理由就立数据仓*最共同
4、的技术理由是企生现用的信息技术错构不能清惫地请足业务寄晏.11去.信息技术集中于楚作票施.它保证业务过程运行所必须的任务的自动化.但是.运作桌统一敷不能气好地满足决里支持的需要.一个运作盛筑典型的有多小事务代龙kmnsacion)的应用构戊,年个应用使用门的一个过程和功能自出化.在运件票统中,争小亭多”争一分台的:k%细节郡记乘在与事务二闭美既做效据率中.事务系统的设计要才虑移部门运作翦要的组节信息有效地进入密使。有效性的要求导Ik应用开发者实更高度希市的数据和在存档发生之前就处筑决定作用应用的一周的有多少量据可存储.屋蚣小作累使对日常业各活的支药是非惇有效的.但他力对于运用常规的软件技术文材
5、报来制作.决俺加行政信息系猊并不是最好的.他们的信步点是在欺邦的有戕.米夕健供访同数据和轿数据文为有用决枭僖息协工JU系统和数非包库是完全不同的.内咨是不同的,恰的是不同的.硬件和软件的寄求是不同的.管理是不同的和用户是不同的.新据仓.*的存储是设计存能提供决策支持信息的.它由业务应用致据来构求,但数据要先经过提JR.再世行4逑.核检并追织列反映,需要的主题中去.数髡仓库的敷露是控这一粒时同的收集,并用于比较./分分析和赖利的.若用运作箴发存储的敷据袋决策支衿.将会45到以下的一年画建:决策要求计历史魏邦进行比九“桥和tfi测.这线付息通常在运件果筑中是无法律到的. 数据义为从运作敷露存区中提
6、取.Rt看时何推移,it些摄取也Jf长和犷大.敷舞的可率性.有效性和通用性都是无法咬定的,因为创立各种分析帝美的戛本叶巳生成了原始数揖源的多个复本和多个不Pi水平的数据子集. 在运作系施中的敷据是按一小转殊的肯动而格式化的.它并不考虑单垃决J1.的有要.从多个运作票掘唐中祖到的效据需要提案和处理,这使存假率顾及单 效据仓序的敷据不是多文的.这。味着不同人员对同一信息的需求樗费雪相同的普H.这也。味着在您分析的过程中敷禁不会改交。敷非仓库的数据装板是适时如可用于反测的。 数格仓库反映企业机枸蛆织的需要.敷据仓摩的物件是直接反映磨们单位的主题.这些主JQ规大得可谓是企业的需要而不*运作系统的要求.
7、 敏据仓*是整合的.所有义务索加的有价值营门都要蔓合到数据仓房的主Ji中去.多个业务数据与傲据的差异应该在襄优到象身仓库之前进行砂词. 数据仓库提供企业的历史回忆.多年的数据常以汇总的方式加以存储.与此片黑的.典理卸业务鹿用只存储一个较短时段的敢舞.,数据仓库片JE询劝能是优化的.优化戏暂看要对数据授汇总,授索引和油取子集.将敏并分隔和组合为详多可健的处合(分片和切块)的能力和有效地反复查询大量数据的能力是数据仓落的根本妾求. 最后.票据仓库必须与分析工具项小龙.蒙爽和维护微IS仓摩只是过程约一局部.一个ItIS仓库只有具备了辅助的决策支特工具时才是克善的,这一决策文村工具应反膜和利用据仓库的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 数据仓库方法论 数据仓库 方法论