使用 XPath 表达式来精确选择数据

在这个大数据时代,我们经常需要通过创建针对大型文件的特定视图来简化分析和沟通。 XPath,即XML路径语言的缩写,旨在允许用户访问大型XML文档的特定部分。 XMLSpy 支持XPath,并提供XPath分析器窗口,以及在XML数据图表界面中提供XPath支持。 MapForce 支持XPath函数,用于XML数据映射。 StyleVision 在条件模板、扩展模板和模板过滤中支持XPath。

Altova 的工具在可能的情况下,采用相同的用户界面,因此在一个工具中掌握的技能可以很容易地应用于其他工具。我们之前在博客中介绍过 StyleVision 中的 XPath 自动计算功能,现在我们来看一个不同的例子。

通常,一个大型数据集包含多个独立的表格。例如,这里展示了一个来自美国教育部关于近期大学毕业生就业情况的信息,以CSV文件形式呈现:

每张表格描述了不同专业和不同毕业年份的毕业生就业情况中的一项统计数据。

一个用于描述数据的 XML 模式,在 XMLSpy 的模式视图中可能如下所示:其中,每个独立的数据表都由 元素描述,而展开 元素会显示每个专业或研究方向的更多子元素。

一个简单的 MapForce 数据映射可以将 CSV 文件中的数据转换为 XML 格式,然后我们可以使用 XMLSpy 打开这些数据

如果我们要为某个图表创建图形,最简单的方法是从 XMLSpy 的网格视图开始。在这里,我们可以选择一个子表格,然后在右键菜单中选择“新建图表”

在接下来弹出的“图表数据选择”对话框中,XMLSpy 会自动生成一个 XPath 表达式,用于描述所选的数据:

相应的折线图如下所示:

要绘制不同的表格,我们可以返回到数据源,手动选择不同的数据集,或者直接编辑 XPath 表达式。在数据选择窗口中,原始表达式是:/data/set[3]/row

我们可以修改数字“3”来选择不同的表格,或者我们可以利用“setnum”属性,根据表格的内容而非在文件中的顺序来选择表格。这是一种更好的方式,可以在数据发生变化时,明确地选择特定的表格。例如,在未来的版本中,一个关于兼职工作的表格可能会插入到第二个位置,从而改变所有后续表格的序号。

一个 XPath 表达式,它使用 "setnum" 属性来选择数据,从而在图表中显示毕业生在与他们所学专业密切相关的领域就业的百分比,其形式如下:![在图表数据选择对话框中编辑 XPath 表达式]

(https://lh3.ggpht.com/-79L2DcOC2qQ/Ui4g0MGs4mI/AAAAAAAABSg/WrX4KY8qlaE/image%25255B20%25255D.png?imgmax=800 "在图表数据选择对话框中编辑 XPath 表达式")

以下图表显示了员工从事的工作与他们所学专业相关程度的百分比:

如果您在开发 XPath 表达式时希望尝试各种选项,那么 XPath 分析器窗口是一个非常有用的工具。XPath 分析器会在您输入时检查语法,并预览结果:

下一步是使用在 XMLSpy 中创建的图表和 XPath 数据选择表达式,并在 StyleVision 中利用它们来创建用于数据报表的样式表。我们将在未来的文章中详细介绍这个主题。

同时,您可以 点击此处下载 Altova MissionKit 的免费试用版,该试用版包含 XMLSpy、MapForce 和 StyleVision,您可以亲自体验一下!