词条 | 数据归档 |
释义 | 将相对不重要的数据转移到速度较慢并且价格便宜的存储介质上,是一种最原始却最为有效的节约成本的方式。 利用数据归档优化数据仓库基础设施自从二十世纪五十年代后期计算机的首次使用以来,数据和信息的世界一直在不断的发展。随着时间的过去,很明显数据像许多实体一样都有生命周期,并且特定于生命周期中的每个时点、不同的一组特征、存储和访问需求。数据仓库的概念由业务需求演变而来,业务需要在不同数据源之间基于其生命周期内的不同点进行可靠、统一和集成的数据报告和分析。 就总的感觉而言,数据仓库只是组织以电子方式存储数据的一个资料库;重要的是必须意识到,任何仓库都会受限于在仓库中查找和访问项目以及将项目移入和移出仓库的流程。对于数据而言,数据仓库系统的主要组成部分包括有选择地存储数据的能力、检索和分析数据的能力(不管数据在哪里),以及管理数据字典的能力。为了有效操作数据仓库,组织需要了解数据仓库中存储的信息在数据生命周期内的不同点存在的固有差异。 随着数据变旧: 1. 访问数据的可能性会降低。简言之,数据变得越旧,它的使用频率就越低。 2. 数据结构会改变。随着软件逐渐发展得更加复杂以更有效率地处理更多数据,数据库体系架构必然也要改变。透过一系列利用越来越强大的硬件和软件技术的软件版本稳定发布可看到这一点。 3. 存储的数据量呈指数方式增长。受行业及政府法规的制约,数据必须存储和保持可访问数年之久。然后只有第一年的数据价值被有效利用,维护历史数据可能轻易地让数据存储激增到比当前生产数据库多20倍。 实施强大存档技术将为数据仓库提供最佳的和经济高效的存档基础设施: 1. 在多种格式之间保持数据完整性 2. 实现方便的按需访问存档数据 3. 提供通用连接,并与多种存档平台集成以确保卓越和经济高效的可扩展性和性能 4. 高效存储存档数据以节约存储容量,同时促进快速检索数据 数据存档帮助优化存储层可以利用数据存档,以物理方式自动将数据仓库中具有较低业务价值的数据迁移到更适合、更经济高效的存储层。有许多标准可用来确定业务价值较低的数据:如 数据访问和性能需求、数据的使用年限、数据属于哪个地区或部门,以及分区 用途。当访问率低的数据发展为消耗数据仓库的最大一份,最合理的处理方式是以物理和逻辑方式从核心生产数据仓库中分离此数据。 一旦组织了解到数据管理的问题、相关经济情况、休眠数据的问题以及由于数据 增长引发的发展压力,必然结果是第一代数据仓库演变为数据仓库 2 .0,在此过程中将创建存档数据存储层。 数据仓库 2 .0 的数据仓库环境中的存档存储层有许多不同特性,让它与数据仓库的其他部分区分开来。存档层中数据的访问概率低。存档环境中的数据通常不会更新。两个环境之间的数据库设计可能一样,也可能不同。 数据仓库存档的主要驱动因素通常是为了通过存储分层来降低基础设施成本、降低维护成本以及维护峰值数据仓库性能。只需将非活动数据从生产数据仓库迁移到 低成本的服务器和存储设备即可达成这些目标,但是您的业务需求有可能更加 复杂,例如如何访问和检索存档数据。在选择数据仓库存档解决方案时,您需要 考虑组织的预算限制及性能和访问需求。 您的 IT 组织访问存档数据的频率可能低于访问活动数据的频率。但是您可能仍需要直接从原始应用程序接口中定期检索组合的存档和当前数据。在这种情况下,数据应存档到查询性能相当高的数据仓库中,如位于成本较低的基础设施上的另一个 数据仓库实例。 另一方面,如果非活动数据非常旧且准备停止使用,则可能很少访问这些数据。 在这种情况下,通过报告或电子搜索工具进行访问就可以了,而不用通过应用程序 接口进行访问。此时可以忍受较慢的查询性能,可将数据存档为更适宜的压缩 格式,如压缩文件。 全面的数据仓库存档解决方案Informatica Data Archive帮助您的IT组织经济高效地管理数据仓库中激增的数据量。它使您能够轻松、安全地存档非活动数据,在需要时很容易访问这些数据。Informatica Data Archive提供您的IT组织有效管理数据仓库中的数据增长所需的所有功能,包括: 1. 强大的存档技术,可确保存档后的数据完整性并支持多种存档格式,实现存储层最优化 2. 多种方法轻松访问存档数据 3. 自动索引存档数据 4. 自动管理变化数据结构 5. 通过连接 6. 与其他存档平台、ECM及存储解决方案(如Symantec、Commvault和EMC)集成 借助Informatica平台(行业领先的数据集成平台)的强大功能,Informatica Data Archive让组织能够处理大型跨国企业通常拥有的海量数据。该软件提供优秀的扩展性和性能,根据数据的价值将它们传送到最经济高效的存储设备中。它还提供无比的互操作性。该软件基于开放式、易于扩展的体系架构,很容易与第三方解决方案集成。 强大的存档技术实现存储层最优化使用Informatica Data Archive,可以存档到另一个数据仓库实例,或存档到能极大节省存储空间的高度压缩文件格式。随着数据变旧和访问需求随时间变化,Informatica Data Archive自动将数据从一种存档格式转成另一种格式,并从一个位置迁移到另一个位置,启动多个经济高效的存储层。 Informatica Data Archive只允许存档事务数据和明细数据,这些数据是增长最快的。在维护数据完整性以及指向可能仍然存储在生产系统中的维表和聚合表的链接时执行此操作。最后 ,有些较旧的维记录也可能需要存档。Informatica Data Archive非常清楚应存档哪些类型的表来支持最优的存档策略。 Informatica Data Archive提供一个简单易用的图形用户界面,不需大量的配置、编写脚本或编制程序就可以轻松定义存档工作。利用提供多种存档格式和辅助功能选项的数据仓库存档解决方案,IT组织可以在存档大小、性能、应用程序可存取性以及成本之间确定一个适当的平衡点。 多种方法轻松访问存档数据不管是哪种存档格式,已存档的数据都需要能够从原始应用程序接口或通过标准接口轻松访问,以便进行报告或合规性审计。Informatica Data Archive支持使用任何报告或商业智能工具通过标准SQL/ODBC/DBC接口进行报告。该解决方案还让您选择从应用程序能够识别的数据发现门户访问数据,能够基于业务实体轻松搜索、浏览和查看已存档或已停止使用的数据,并且使用与原始应用程序接口有类似外观的接口。 自动索引存档数据在将数据存档到另一个数据仓库实例时,Informatica Data Archive自动建立和维护在生产数据仓库实例中存在的索引。当存档到高度压缩存档文件时,数据会自动进行索引并以最优格式存储,以便于高效存储和可扩展检索。不需对存档数据进行性能调整和维护、减少IT职员的工作时间。 自动管理变化数据结构随着生产数据仓库结构不断演变,Informatica Data Archive自动更新存档数据仓库的元数据和结构。当存档到高度压缩文件格式时,Informatica Data Archive维护多个版本的元数据,与生产数据仓库结构的定期快照相对应。这样就可以基于某个时间点的数据仓库结构对存档数据执行时间点查询。根据生产数据仓库的结构变化自动管理存档数据的元数据和结构,Informatica Data Archive减少了存档基础设施所需的维护工作。 通用连接如果您的组织与许多其他企业类似,则您的数据仓库和应用程序可能在不同操作系统上的多个数据库系统中运行。为了支持您的企业需求,Informatica?Data?Archive允许您管理数据仓库和使用不同数据库的应用程序的存档过程,这些数据库包括:关系型(如Oracle、DB2、Sybase、SQL?Server、Teradata、Informix)、大型机(如 IDMS、VSAM 和 IMS)、文件以及开放系统(如 Windows、Linux 和 UNIX)或大型机系统(如 z/OS 和 AS/400)上的封装 CRM 和 ERP 应用程序。 与其他存档平台、ECM 和存储解决方案集成您的公司可能已经有用于电子邮件和文件的存档解决方案。此外,您的 IT 组织可能也有自己的企业内容管理 (ECM) 解决方案标准来管理您的非结构化数据。为了支持合规性需求并确保留存数据的不变和单实例存储,可以使用需要专属连接的存档 平台,如内容寻址存储 (CAS)。 为 了 让 您 的 组 织 快 速 而 精 确 地 响 应 审 计 请 求 以 及 经 济 高 效 地 长 期 留 存数据,Informatica Data Archive 允许您集中管理和发现所有类型(结构数据和非结构数据)的存档数据。这通过与现有存档、内容管理和存储解决方案(包括EMC Documentum、Symantec Enterprise Vault 和 Discovery Accelerator、CommVault Simpana 和 eDiscovery)集成来完成,以促进所有类型存档数据的集中管理和电子搜索。 Informatica Data Archive 使组织能够处理大型跨国企业通常拥有的海量数据。通过提供全面而强大的技术来轻松、安全地存档非活动数据,然后在需要时很容易访问数据,Informatica Data Archive 提供了全面的存档解决方案,可提供最优化、经济高效的数据仓库基础设施。 小结Informatica Data Archive 使组织能够处理大型跨国企业通常拥有的海量数据。通过提供全面而强大的技术来轻松、安全地存档非活动数据,然后在需要时很容易访问 数据,Informatica Data Archive 提供了全面的存档解决方案,可提供最优化、经济高效的数据仓库基础设施。 当您的 IT 组织实施一个完整、可扩展和灵活的存档解决方案时,可以通过以下方面 来降低数据仓库及其他应用程序的总拥有成本: · 降低存储、服务器、软件和维护成本 · 改善数据仓库性能 · 提高数据仓库可用性 · 支持遵守内部、行业及政府法令和法规 同时,Informatica 和您的 IT 组织可以结合数据的业务价值与最适合和经济高效的 IT 基础设施来管理它。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。