如何创建批量数据映射项目

数据处理中,批量数据映射是一个常见的需求,尤其是在数据转换和集成方面。它涉及批量转换数据,而不是一次处理单个数据点。在数据集成或 ETL 场景中,经常需要进行批量数据映射,以便将来自多个来源的数据进行统一或转换。两种常见的场景是“批量到批量”和“批量到单一

在我们的批量数据处理视频系列中,我们将逐步引导您使用MapForce中的可视化工具,完成这些项目的实施。

批次间数据映射

批量数据处理在以下情况下非常有用:当您需要处理一批批的数据更新或变更,并且需要将这些批次的数据同步或转换时。这可能包括将数据转换为不同的格式、执行某种排序或计算,或者这些操作的组合。

在这个演示中,我们将创建一个数据映射项目,该项目可以从一个目录读取文件,并使用通配符来设置映射关系,从而一次性处理多个文件中的数据。 接下来,我们将探讨另一种定义批量转换的方法,该方法使用映射关系提供的动态文件名。 此外,这个演示还将展示如何在数据映射项目中添加计算和注释。

虽然这个视频展示了将一批JSON文件转换为XML文件的过程,但MapForce支持各种组合的XML、JSON、PDF、数据库、文本、Protobuf、Excel、XBRL以及Shopify等格式之间的转换和转换,从而实现高级数据集成和ETL(抽取、转换、加载)流程

批量数据转换

批量化到单件化 数据转换 另一个常见的需求是,例如,当您想要将多个文件合并或组合成一个统一的文档,并在过程中进行一些数据转换、格式转换或计算操作时。

这个例子探讨了定义批处理过程的多种方法,这些方法适用于不同的场景

  1. 使用通配符指定同一目录下的一组文件

  2. 根据存储在不同目录中的文件名称列表,选择批处理文件

这个演示还展示了如何在将数据写入目标文件之前,对从多个文件中合并的数据进行排序。

观看这些简短的演示后,您可以下载一个 MapForce 免费试用版 您可以尝试亲自进行批量映射、转换和数据处理。

更多 MapForce 演示案例

如果您喜欢这些视频,请查看更多关于MapForce 演示系列的内容,该系列涵盖了从将 XML 和 JSON 映射到数据库,到配置数据处理函数以及从 PDF 文档中提取数据的各种主题。