词条 | Informatica |
释义 | Informatica公司介绍Informatica,1993年创立于美国加利福尼亚州,并于1999年4月在纳斯达克上市。作为全球领先的独立企业数据集成软件提供商,Informatica 帮助世界各地的组织为其首要业务提供及时、相关和可信的数据,从而在当今全球信息经济中获得竞争优势。 借助Informatica全面、统一、开放且经济的数据集成平台,组织可以在改进数据质量的同时,访问、发现、清洗、集成并交付数据,以提高运营效率并降低运营成本。Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、数据质量控制、主数据管理、B2B Data Exchange、应用程序信息生命周期管理、复杂事件处理、超级消息和云数据集成。 Informatica(纳斯达克代码:INFA)是全球第一的企业数据集成软件独立供应商。世界各地的组织机构依赖Informatica为其重要业务提供及时、相关和可信的数据,从而赢得竞争优势。目前,全球已有超过4630家企业依靠Informatica的数据集成、数据质量和大数据解决方案,来访问、集成并信任其位于企业内及云中的信息资产。 Informatica在全球Informatica,1993年创立于美国加利福尼亚州,并于1999年4月在纳斯达克上市。 作为全球领先的企业数据集成解决方案提供商,Informatica提供专业数据集成软件和服务,以解决系统间的数据碎片问题,从而帮助企业获得了数据的更大商业价值。 Informatica开放、独立于平台的软件降低了企业IT的运营成本、加快了产出速度,可伸缩处理不同规模或不同复杂程度的数据集成项目。Informatica拥有遍布全球的客户关系网络,其出色的成功案例显示,Informatica将帮助更多的企业和政府机构实现其企业数据的商业价值。 Informatica在中国Informatica于2005年正式进入中国。短短的几年时间中,凭借全球领先的技术和完善的服务,Informatica很快就在包括金融、电信、制造、政府、保险、公众服务等多个领域获得突破,并帮助众多企业构架随时随地呈现正确而重要信息的数据整合平台。 随着全球信息化步伐的日趋加快,精准的数据和可用的信息将在最大程度上提高企业IT投资回报率。高速发展中的中国正在积极推进各项信息整合工程及企业信息化的投资建设,Informatica把中国列为其全球投资的最重要国家之一。 在不断拓展自身业务的同时,Informatica还积极推动中国信息化产业的发展。通过与国内的企业和合作伙伴分享国际领先的理念、技术和经验,帮助他们加强信息化管理,提升信息化水平,并最终共同推进中国的信息化建设,把中国的信息化产业推向国际市场。 Informatica产品简介Informatica Enterprise Data Integration包括Informatica PowerCenter和Informatica PowerExchange 两大产品,凭借其高性能、可充分扩展的平台,可以解决几乎所有数据集成项目和企业集成方案。 · Informatica PowerCenter用于访问和集成几乎任何业务系统、任何格式的数据,它可以按任意速度在企业内交付数据,具有高性能、高可扩展性、高可用性的特点。Informatica PowerCenter包括4个不同版本,即:标准版,实时版,高级版,云计算版。同时,它还提供了多个可选的组件,以扩展Informatica PowerCenter的核心数据集成功能,这些组件包括:数据清洗和匹配、数据屏蔽、数据验证、Teradata双负载、企业网格、元数据交换、下推优化(Pushdown Optimization)、团队开发和非结构化数据等. · Informatica PowerExchange 是一系列的数据访问产品,它确保 IT 机构能够根据需要随时随地访问并在整个企业内传递关键数据。凭该能力,IT机构可以优化有限的资源和数据的业务价值。Informatica PowerExchange支持多种不同的数据源和各类应用,包括企业应用程序、数据库和数据仓库、大型机、中型系统、消息传递系统和技术标准。 Informatica Data Quality通过一个全面、统一的平台,为所有项目和应用程序的相关人士、项目和数据域(无论在内部预置,还是在云中),提供普遍深入的数据质量控制。 · Informatica Data Quality结合了强大的数据分析、清洗、匹配、报告、监控能力和易于使用的界面,使业务信息所有者能够在整个企业范围内实施和管理数据质量计划。 · Informatica Data Quality Cloud Edition (云计算版)将普遍数据质量的功效和功能与最新云计算平台的灵活性、易用性和经济性相结合,向所有相关人士、项目和数据域交付数据质量。 · Informatica Identity Resolution是一款功能强大且高度可扩展的身份识别解决方案,让企业和政府机构能够批量且实时地搜索和匹配来自超过60种语言的身份数据。 · Informatica Data Explorer通过强大的数据探查、数据映射能力和前所未有的易用性的完美组合,让您轻松发现、监控数据质量问题。 · AddressDoctor为全球200多个国家和地区提供全球地址验证技术,其功能包括对多级地址(如街道级别)的支持,以及交付点验证和地理编码。 Informatica Cloud提供了面向数据集成云应用,确保企业用户能够跨基于云的应用程序和预置系统及数据库来集成数据。Informatica Cloud利用底层的PowerCenter数据集成引擎,包括在线注册、用户和任务流管理、工作调度和监控、错误处理、压缩、加密和安全代理功能,来访问和集成预置数据源和云数据。借助Informatica Cloud,客户与合作伙伴可以在云中构建、管理和共享定制的数据集成服务。 Informatica B2B Data Exchange是一款业界领先的工具,用于多企业的数据集成。它增加了安全通信、管理和监控功能,来处理来自内部和外部的数据。 · Informatica B2B Data Exchange为多企业数据集成、合作伙伴管理以及业务事件监控提供了一个全面的技术基础设施。它能帮助企业有效且经济高效地与其贸易合作伙伴和客户所组成的外延网络进行协作,从而帮助企业降低成本,保持并增加收入。 · Informatica B2B Data Transformation是一款高性能软件,可以将数据在结构化、非结构化格式与更常用的数据格式之间进行转换,来支持企业与企业(B2B)以及多企业的事务。这一统一的无代码环境支持几乎任意形式的数据转换,并且可供组织内多个业务级别的人员(分析师、开发人员和程序员等)进行访问。 Informatica Master Data Management通过提供整合且可靠的关键业务数据,帮助企业用户来改善业务运营。它能够以独特方式识别所有关键业务主数据以及它们之间的关系,通过多域主数据管理,使客户能够从小规模起步,随着需求的增长进行扩展,并且可在同一平台上支持所有的MDM要求——数据集成、探查、质量和主数据管理。 Informatica MDM业经证明和灵活的主数据模型、解决方案框架,以及统一的产品架构最大限度降低了前期采用和实施成本,使您可以随着时间的推移来管理和逐步扩展MDM计划。 Informatica Application ILM系列产品旨在帮助IT 部门管理数据生命周期中从开发、测试到存档、淘汰的各个阶段,同时保护数据的隐私。 · Informatica Data Archive是一款高度可扩展的高性能软件,可以帮助IT部门经济高效地管理众多企业业务应用中数据的增长。该软件使IT团队可以轻松、安全地对应用程序数据进行归档,包括主数据、参考数据和事务数据,并可根据需要随时对其进行访问。 · Informatica Data Masking是一款全面、灵活且可扩展的软件,用于管理对如信用卡信息、社会保险号、姓名、地址和电话号码等敏感数据的访问。该软件可以防止机密信息被无意中暴露,降低数据外泄的风险。 · Informatica Data Subset是一款灵活的企业软件,可以自动完成将大型复杂 数据库创建为较小的目标数据库的任务。 通过完整引用的小型生产数据目标副本,IT机构可以大幅缩减支持测试环境所需的时间、工作量和磁盘空间。 Informatica Complex Event Processing使企业能够迅速地对数据驱动型事件进行探测、关联、分析和响应。凭借CEP与数据集成的结合,企业将具有更出色的响应性、适应性和灵活性。 · Informatica RulePoint是一款CEP软件,可帮助各种规模的企业和政府机构获得运营智能——实时警报和深入了解相关信息,从而实现更智能、更快、更高效和更有竞争力地运营。 Informatica Ultra Messaging产品使用“无中介”(nothing in the middle)架构而设计,该架构消除了对后台程序或消息代理的需要。该设计实现了超低延迟信息和高效的系统,降低了硬件基础设施的成本,同时提高了吞吐量、弹性和可用性。 · Informatica Ultra Messaging Streaming Edition是业界第一款采用“无中介”(nothing-in-the-middle)设计的消息系统。它是市场中领先的低延迟消息软件,也是一款高效、可配置、可靠且得到广泛部署的消息传送解决方案。 · Informatica Ultra Messaging Persistence Edition通过创新的并行架构提供了高质量的消息送达方式,无需使用中央消息代理,消除了对存储-转发架构的需要,同时提供传统消息系统所无法企及的弹性和性能。 · Informatica Ultra Messaging Queuing Edition扩展了Ultra Messaging的功能,包括了高效、低延迟、具有弹性的消息队列功能。对于希望实现“一次且仅有一次”的消息交付,低延迟负载平衡或智能索引队列的客户,Informatica Ultra Messaging Queuing Edition将是其首选的消息传送产品。 Informatica ETL工具介绍一、总体概述 ETL 包括 Extract 、 Transform 、 Cleaning 和 Load ,它是用于从生产库中提取数据到数据仓库中,再由具体的报表、统计、分析工具对数据仓库的内容进行分析,分析出自己所需要的数据。 其中 ETL 培训的内容是如何利用 Informatic PowerCenter 把源数据库的内容提取存放到目标数据库中。主要 Informatic 主要包括四个部分: Client , Reposity Server , Reposity Database 和 Informatic Server 每个部分实现自己的功能。 二、系统体系结构 此部分介绍了 Informatic ETL 工具包括的主要内容。 1.Client Informatic Client 主要有五个部分。 Client 可以和 Reposity 分离,通过 TCP/IP 连接,连接到远程的 Reposity Server 。 2. Reposity Manager 主要用于进行一个 Reposity 库的管理,当用户使用 Client 工具登录一个 Reposity 服务器之后,进行文件夹权限的创建,用户权限、密码的管理等。 3. Designer 主要是进行数据抽取的转换工具的设计,主要是 mapping 的设计、设计源数据库的结构,目标数据库的结构,然后设计把源数据导入到目标数据库中,所需要进行的转换操作( Transformation )。 同一个 Reposity 的 folder 之间可以建立 shortcut 方式,多个 reposity 的 folder 之间只能做拷贝。 4. Workflow Manager 主要用于流程任务( workflow Task )的设计。 进行任务流程的设计、每一个 Tast 针对一个 Session ,一个 session 针对一个 mapping ,其中 workflow 中的 Folder 和 Designer 中的 folder 相对应的关系。一般来说,用户都是建立自己的 Folder 。 5. Workflow Monitor 主要进行流程运行、及任务运行时的流程运行情况跟踪。可以跟踪日志。包括 Session 日志和 Workflow 日志,可以设置生成日志的循环个数。分析 session 运行是对源数据库的数据抽出信息和对目标数据库的更新信息。 6. Reposity Server Application Console 主要进行 Reposity 的管理,包括 Reposity Server 的 start , shutdown 操作。进行 Reposity 库的 backup 、 restore 等操作,进行 Reposity 库级别的管理,级别较高。 7. Reposity Server Reposity server 是为客户端服务的,客户端可以和各种 client 不在一台服务器上。关于数据抽取的设计成果转换成为 XML 格式的源数据,都是通过 Reposity Server 存放到 Reposity Database Server 上的。 8. Reposity Database Server 用于存放的是进行 ETL 设计的元数据。可以支持各类的数据库。方式为数据库中用户的一个表目录和用户关系即可。 Reposity Database 可以和 Reposity server 不安装在一台服务器。如果在一台机器上, server 通过 native 方式连接到 database ,如果不在一台及其上,需要在 database 上安装一个 reposity agent ,用户通过 agent ,以 native 方式连接到 reposity 数据库,然后 reposity agent 再以 tcp/ip 方式连接到 reposity server 。 9.Informatic Server Informatic server 是实际执行数据抽取任务的运行环境。即 workflows 、 task 、 sessions 等。它是根据定义的 workflow 元数据库,然后在自己的实际环境中,执行数据抽取操作。 三、系统组件功能 Informatic 的功能主要体现在 Designer 和 Workflow Manager 上,其中 Designer 实现的是对数据抽取的数据转换方式设计,以及效率设计目标等。而在 Workflow Manager 中再把具体的数据转换方式应用到一个具体的工作任务中,包括目标库、源库的选择,以及一条具体的执行任务的属性设置等等。包括任务的 insert 、 truncate 、 delete 、 increment insert 等。 1.Designer 组件 ( 1 )工作区 在 Designer 中,涉及到的工作区主要包括有 Source Analyzer 、 Warehouse Designer 、 Transformation Designer 、 Mapplet Designer 和 Mapping Designer 。 其中每个工作区的功能分别介绍: Source Analyzer : Source Analyzer 的功能是实现对源数据库表的设计,可以手工的进行源数据库的设计,一般都是通过从 Flat File 或者 Relation DBMS 中导入数据库的表结构。 XLS 文件结构。 Warehouse Designer 用于设计目标数据库库的结构,可以利用手工设计,也可以利用 import 工具导入导一个 warehouse 的结构。 Transformation Designer 用户设计可重用的 transformation 组件,这里的组件,在一个 folder 里面都是可以重用的,而且以 shortcut 的方式使用。 Transformation 组件的修改,会直接反映到使用此 transformation 的 mapping 中。 Mpplet 设计可以重用的多个组件,只要有 output 组件,可以有 input 组件,也可以没有 input 组件,实现的功能就和一个 expression 的功能类似,实现功能。 Mapping Designer 实现的功能是设计具体进行抽取数据的 mapping ,这些 mapping 应用到一个 workflow 中,形成了 workflow 的一个 session ( task )。 ( 2 ) 组件功能 ETL 支持的组件主要包括两类: Active 组件和 Passive 组件,其中 Active 组件是对输入记录集在输出时个数有变化的组件, Passive 组件,输入的记录集,输出时记录集的个数不发生改变。 Informatic 提供的组件包括: (1) Source Qualifier: reads data from flat file & relational sources (2) Expression: performs row-level calculations (3) Filter: drops rows conditionally (4) Sorter: sorts data (5) Aggregator: performs aggregate calculations (6) Joiner: joins heterogeneous sources (7) Lookup: looks up values and passes them to other objects (8) Update Strategy: tags rows for insert, update, delete, reject (9) Router: splits rows conditionally (10) Sequence Generator: generates unique ID values (11) Normalizer:izes records from relational or VSAM sources (12) Rank: filters the top or bottom range of records (13) Union : merges data from multiple pipelines into one pipeline (14) Transaction Control: allows user-defined commits (15) Stored Procedure: calls a database stored procedure (16) External Procedure : calls compiled code for each row (17) Custom: calls compiled code for multiple rows (18) Midstream XML Parser: reads XML from database table or message queue (19) Midstream XML Generator: writes XML to database table or message queue 每一类组件都有自己独特的功能和特点,这里介绍主要的组件包括上述红色的内容。每一种组件的详细功能这里不详细介绍。 2.Workflow 组件 Workflow 是对执行任务的执行进行控制,可以在执行时对执行的任务进行传参数进行传入,这样就能在执行的时候把数据库表进行动态的设置。 可以在执行的时候选择参数文件,对 mapping 、 workflow 中的 Session 的参数进行传入。达到动态执行的目的。 Workflow 中定义 workflow 、 session 等任务,对这些任务的执行进行管理控制。 四、补充说明 Source Qualifier 支持同构数据源的连接,异构数据源的连接通过 N-1 个 jointer 组件实现。 Lookup 为 passive 组件,查出的多条记录集,要么取 first ,或者 last ,或者报错。 Lookup 可以时动态 / 静态 ,可以 connected/unconnect 。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。