主题:  数据仓库的概念(copy)

临时球迷

职务:普通成员
等级:3
金币:10.0
发贴:869
注册:2000/9/18 15:42:52
#12000/11/23 1:04:41
整理编辑:China ASP

网友 【blackwhites】 创作

随着市场竞争的加剧和信息社会需求的发展,从大量数据中提取(检索、查询等)
制定市场策略的信息就显得越来越重要了。这种需求既要求联机服务,又涉及大量用
于决策的数据,而传统的数据库系统已无法满足这种需求。其具体体现在三个方面:

历史数据量很大。
辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成。
由于访问数据的能力不足,它对大量数据的访问性能明显下降。

随着C/S技术的成熟和并行数据库的发展,信息处理技术的发展趋势是从大量的
事务型数据库中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据
聚合在一种特殊的格式中。随着此过程的发展和完善,这种支持决策的、特殊的数据
存储即被称为数据仓库(Data Warehouse, DW)。

W。H。Inmon对数据仓库的定义为数据仓库是支持管理决策过程的、面向主题的、集成
的、稳定的、不同时间的数据集合。

主题是数据归类的标准,每个主题对应一个客观分析领域,如客户、商店等,它可为
辅助决策集成多个部门不同系统的大量数据。数据仓库包含了大量的历史数据,经集
成后进入数据仓库的数据是极少更新的。数据仓库内的数据时限为5年至10年,主要
用于进行时间趋势分析。数据仓库的数据量很大,一般为10GB左右。它是一般数据库
(100MB)数据量的100倍,大型数据仓库达到TB级。

数据仓库主要应用在两个方面:

使用浏览分析工具在DW中寻找有用的信息。
数据仓库系统支持在DW上的应用,形成决策支持系统(DSS)。

---
数据仓库是关系型的
仓库保存的数据通常是历史数据,而且数据仓库保存的数据量极大,可能达到GB、TB级,
甚至更大。这些数据在数据仓库中很少变动。
对于数据仓库,通常只进行APPEND操作。
对信息源的数据的提取和集成采用批处理的方式进行,通常脱机处理。



搏人

职务:普通成员
等级:1
金币:1.0
发贴:150
注册:2000/11/16 9:23:09
#22000/11/23 10:01:10
HI
好想知道B2B网站所谓得数据库是用什么写的(JAVA、。。。)