“DataStage”的意思、由来-中文百科全书

DataStage用来做什么

DataStage 是由IBM公司开发的，是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化，并将其输入数据集市或数据仓库目标数据库的集成工具。

DataStage 能够处理多种数据源的数据，包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统等，以下列出它所能处理的主要数据源：

大型主机系统数据库：IMS,DB2,ADABAS,VSAM等

开放系统的关系数据库：Informix,Oracle,Sybase,DB2,Microsoft SQL Server等

ERP系统：SAP/R3,PeopleSoft系统等

普通文件和复杂文件系统：FTP文件系统，XML等

Web服务器系统：IIS,Netscape,Apache等

Email系统：Outlook等

DataStage可以从多个不同的业务系统中，从多个平台的数据源中抽取数据，完成转换和清洗，装载到各种系统里面。其中每步都可以在图形化工具里完成，同样可以灵活地被外部系统调度，提供专门的设计工具来设计转换规则和清洗规则等，实现了增量抽取、任务调度等多种复杂而实用的功能。其中简单的数据转换可以通过在界面上拖拉操作和调用一些DataStage预定义转换函数来实现，复杂转换可以通过编写脚本或结合其他语言的扩展来实现，并且DataStage提供调试环境，可以极大提高开发和调试抽取、转换程序的效率。

数据抽取工作步骤

根据以往的项目实施经验，通常数据抽取工作分抽取、清洗、转换、装载几个步骤：

抽取主要是针对各个业务系统及不同网点的分散数据，充分理解数据定义后，规划需要的数据源及数据定义，制定可操作的数据源，制定增量抽取的定义。

清洗主要是针对系统的各个环节可能出现的数据二义性、重复、不完整、违反业务规则等问题，允许通过试抽取，将有问题的记录先剔除出来，根据实际情况调整相应的清洗操作。

转换主要是针对数据仓库建立的模型，通过一系列的转换来实现将数据从业务模型到分析模型，通过内建的库函数、自定义脚本或其他的扩展方式，实现了各种复杂的转换，并且支持调试环境，清楚的监控数据转换的状态。

装载主要是将经过转换的数据装载到数据仓库里面，可以通过数据文件直接装载或直连数据库的方式来进行数据装载，可以充分体现高效性。在应用的时候可以随时调整数据抽取工作的运行方式，可以灵活的集成到其他管理系统中。

DataStage工具介绍

DataStage是基于客户机/服务器的数据集成架构，优化数据收集，转换和巩固的过程。它提供了一套图形化的客户工具：

包括：Designer(设计器)：创建执行数据集成任务Job的同时，对数据流和转换过程创建一个可视化的演示。

Manager（管理器）：对每个工程的各个单元，包括：库表定义，集中的数据转换，元数据连接等对象进行分类和组织。

Director（控制器）：为启动，停止，监视作业提供交互式控制。

Administrator（管理器）：在服务器端管理DataStage的项目和使用者权限的分配

在v8.1版本中，Manager（管理器）已经取消，合并到Designer。

词条	DataStage
释义	数据仓库中的数据来自于多种业务数据源，这些数据源可能来自于不同硬件平台，使用不同的操作系统，数据模型也相差很远，因而数据以不同的方式存在于不同的数据库中。如何获取并向数据仓库加载这些数据量大、种类多的数据，已成为建立数据仓库所面临的一个关键问题。针对目前系统的数据来源复杂，而且分析应用尚未成型的现状，强烈推荐使用专业的数据抽取、转换和装载工具--DataStage DataStage用来做什么数据抽取工作步骤 DataStage工具介绍 DataStage用来做什么 DataStage 是由IBM公司开发的，是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化，并将其输入数据集市或数据仓库目标数据库的集成工具。 DataStage 能够处理多种数据源的数据，包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统等，以下列出它所能处理的主要数据源：大型主机系统数据库：IMS,DB2,ADABAS,VSAM等开放系统的关系数据库：Informix,Oracle,Sybase,DB2,Microsoft SQL Server等 ERP系统：SAP/R3,PeopleSoft系统等普通文件和复杂文件系统：FTP文件系统，XML等 Web服务器系统：IIS,Netscape,Apache等 Email系统：Outlook等 DataStage可以从多个不同的业务系统中，从多个平台的数据源中抽取数据，完成转换和清洗，装载到各种系统里面。其中每步都可以在图形化工具里完成，同样可以灵活地被外部系统调度，提供专门的设计工具来设计转换规则和清洗规则等，实现了增量抽取、任务调度等多种复杂而实用的功能。其中简单的数据转换可以通过在界面上拖拉操作和调用一些DataStage预定义转换函数来实现，复杂转换可以通过编写脚本或结合其他语言的扩展来实现，并且DataStage提供调试环境，可以极大提高开发和调试抽取、转换程序的效率。数据抽取工作步骤根据以往的项目实施经验，通常数据抽取工作分抽取、清洗、转换、装载几个步骤：抽取主要是针对各个业务系统及不同网点的分散数据，充分理解数据定义后，规划需要的数据源及数据定义，制定可操作的数据源，制定增量抽取的定义。清洗主要是针对系统的各个环节可能出现的数据二义性、重复、不完整、违反业务规则等问题，允许通过试抽取，将有问题的记录先剔除出来，根据实际情况调整相应的清洗操作。转换主要是针对数据仓库建立的模型，通过一系列的转换来实现将数据从业务模型到分析模型，通过内建的库函数、自定义脚本或其他的扩展方式，实现了各种复杂的转换，并且支持调试环境，清楚的监控数据转换的状态。装载主要是将经过转换的数据装载到数据仓库里面，可以通过数据文件直接装载或直连数据库的方式来进行数据装载，可以充分体现高效性。在应用的时候可以随时调整数据抽取工作的运行方式，可以灵活的集成到其他管理系统中。 DataStage工具介绍 DataStage是基于客户机/服务器的数据集成架构，优化数据收集，转换和巩固的过程。它提供了一套图形化的客户工具：包括：Designer(设计器)：创建执行数据集成任务Job的同时，对数据流和转换过程创建一个可视化的演示。 Manager（管理器）：对每个工程的各个单元，包括：库表定义，集中的数据转换，元数据连接等对象进行分类和组织。 Director（控制器）：为启动，停止，监视作业提供交互式控制。 Administrator（管理器）：在服务器端管理DataStage的项目和使用者权限的分配在v8.1版本中，Manager（管理器）已经取消，合并到Designer。
随便看	守贞守贞卡守镇之舞守正不阿守正不回守正不挠守正不移守正不桡守正出奇守正出新守正楼守支守职而不废，处义而不回守制守中丸守株待兔守株网守株缘木守诛人守住婚姻守住爱守捉守捉使守拙守着寂寞守着你守着你到永久费尔达芬陆军通信学校及陆军电工技术专科学校费尔顿·赞迪费尔马定理费尼杰剧院费岳费工费巩费巩烈士费希尔费希尔，R.A. 费希纳规律费彝民费彝民（1908～1988）费德费德昭费德里费德里克·吉恩蒂费德里克·巴扎雷蒂费德里奥费德里科·巴罗奇费德里科·巴萨维尔巴索费德里科·马加拉尼斯费德鲁斯费志融费恩阁