将数据映射项目从开发阶段过渡到测试阶段,再到生产环境

数据映射项目通常与软件开发项目类似,具有明确的阶段,包括设计、测试和部署。尤其是在ETL(提取、转换、加载)项目中,当需要重复执行数据映射以处理新的数据时,情况更加复杂,而且随着数据量的增加,风险也随之增大。Altova MissionKit和Server Software产品提供了全局资源,用于定义每个项目阶段的配置,并实现各个阶段之间的平稳过渡。

让我们来看一个例子,该例子基于 MapForce 将源文件中的数据映射到数据库的过程。

当然。请提供您需要翻译的英文文本 数据映射项目 以下描述的映射功能以包含一个或多个简单销售订单的CSV文件作为输入。每个订单包含产品编号和数量,该映射功能会根据当前产品价格计算总销售额,生成一个唯一的订单编号,并将订单信息插入到现有的数据库中。

开发并将其整合到企业工作流程中的数据映射过程,需要三个明确的步骤:首先,开发人员或数据专家设计数据映射;其次,质量保证测试人员验证数据映射;最后,将数据映射部署到生产环境。Global Resources 允许各个项目相关方在每个阶段切换数据映射项目的数据源文件和目标数据库,而无需修改数据映射本身。

全局资源是指可移植的、指向文件、文件夹或数据库的引用,它们的作用类似于别名。当以全局资源的形式存储时,路径和数据库连接信息可以被重复使用,并在多个 Altova 应用程序中共享。下图展示了指向输入数据文件和数据库的全局资源。

全局引用也可以被组织成不同的配置。例如,某些数据映射项目可能需要为映射设计、测试和生产分别设置不同的配置。在不同配置之间切换会同时改变源数据文件和目标数据库。

以下图片展示了 MapForce 工具栏的一部分,以及“全局资源”配置的下拉菜单。用户可以在此处选择生效的配置。

在数据映射过程中,无论是输入文件还是目标数据库,都定义为指向全局资源。以下是源数据文件作为全局资源时,组件设置对话框的示例:

对于每个全局资源配置,也需要定义目标数据库

数据映射项目的设计师首先使用一个小型样本数据集和一个数据库结构的副本。当映射完成后,开发人员直接在 MapForce 中执行它,以创建并执行一个 SQL 脚本,用于插入数据。MapForce 的输出窗口会报告结果:

在测试阶段,我们希望 直接执行数据映射 在MapForce Server的测试环境中,使用与开发人员最初使用的不同输入文件和数据库副本进行操作。

开发人员可以通过“MapForce 文件”菜单将映射编译成一个 MapForce Server 执行文件

MapForce Server 的执行文件包含了映射关系、以及与该映射关系相关的全局资源文件和数据库引用,但它不会解析任何特定的全局资源配置。这使得全局资源配置可以在运行时进行选择。全局资源的定义存储在一个名为 GlobalResources.xml 的 XML 文件中,该文件位于映射设计器的工作站上。在测试阶段,设计人员需要提供 MapForce Server 的执行文件以及全局资源文件。

测试团队使用 MapForce Server 的命令行界面来执行所需的映射配置。以下展示了 MapForce Server 命令行的通用形式,其中包含映射名称以及全局资源文件和全局资源配置的参数:

以下是该命令在命令行窗口中可能出现的实际形式:

如果测试结果令人满意,则可以将映射关系和全局资源部署到 FlowForce 服务器,并在 FlowForce 服务器的任务中执行,例如作为某个流程的一部分 企业计划数据导入 操作。可以通过上方主菜单中的“部署到 FlowForce 服务器”选项来部署映射文件:

全局资源可以通过“管理全局资源”对话框进行配置和部署

每个配置都被存储为一个独立的 FlowForce Server 对象,并在 FlowForce Server 的任务定义中被引用。

下载免费试用版,以便在您的企业工作流程的各个阶段,顺利进行数据映射项目!