首页 > 新闻动态 > 综合新闻

综合新闻  | 2017/12/29

1、汇集整理各种源数据

源数据是指企业来自于不同业务系统的、以不同形式存储的数据,包括企业数枣件和其他:由各种途径收集的源数据的来源。由各种途径收集的源数据不是简单的直接加载入数据仓库,而必须通过数据转换,采取吸取、合并、删除、识别、扩展、校验、更新等方法转换成一致的格式,进入数据仓。

2、存储管理数据和数据挖掘

企业的数据经汇集整理后,集中到中央数据仓库,形成企业级得一致和完整的数据仓库可以根据不同主题需要将中央数据仓库划分为不同数据集市(当然也可以根据不同数据集市统一成为中央数据仓库),利用数据复制和传播工具保证数据集市与中央数据仓库的数

据同步,利用数据挖掘发现数据间的内在联系或预测其以后的发展方向和模式。

3、获取所需信息

企业各级业务或主管人员可以利用不同级别和主题的信息存取工具进行查询,也可以结合图形化查询和报表工具、多维OLAP工具等使用。

随着数据仓库技术的不断发展,它已经在实际应用中发挥了巨大的作用。总得来说,数据仓库是一种面向数据应用的数据管理技术,它提供了集成化的、历史化的数据管理功能,支持综合性的数据分析,特别是战略分析。对于企业来讲,数据仓库可使决策者们再繁杂的日常业务信息中找到一些有规律的特征,以利于其正确的决策。如果发现某种商品的销售量增加时,另外一种相关商品的销售量也随之增加,这表明了它们之间的关联性等等。根据美国META集团的调查研究,数据仓库技术在金融业、制造业、商贸业以及社会服务等方面都有广泛的应用前景,已经采用数据仓库的企业的投资回报率(return on investment)均在40%以上,部分企业高达每年600%。国际数据集团IDC在对20世纪90年代前期进行的62个数据仓库项目的调查结果表明:进行数据仓库项目开发的公司在平均2.73年得时间内获得了平均为321%的投资回报率。正是因为如此,数据仓库市场需求量以每年数倍的速度扩张,儿同时数据仓库技术及产品的发展将出现以下趋势。

(1)并行化和可扩展话。为提高数据仓库的性能和可扩展能力,数据仓库已趋向并行化。在硬件层次上,已越来越明显的采用多处理器并行结构;在数据库层次上,许多数据库厂商已推出并行产品,以适应数据仓库市场的需要。

(2)数据仓库与Internet的集成。数据仓库与Internet进行很好的集成将大大提高其应用的广度和深度。主流系统的前台将是Web服务器,后台是数据仓库系统。Web数据仓

库将成为信息共享的基础构架。