在您常用的 XML 编辑器中,使用 Avro 处理大数据
大数据的发展趋势使得开发人员在处理其他数据协议的同时,也需要使用XML JSON 并且,XMLSpy 专门支持 Apache Avro 和 XML 格式,提供了专门的编辑视图和功能。
让我们来看看XMLSpy中专门的Avro支持如何让可视化和搜索Avro文件,以及编辑Avro模式变得异常简单。 此外,我们还将探讨使用RaptorXML Server进行高性能Avro处理的一些优势。

什么是Avro?
Apache Avro (公司名称或品牌名,具体含义取决于上下文)™ 是一种用于高效、快速、二进制序列化大型数据的系统,它通常被应用于 Apache 项目中 Hadoop Avro 是一种数据序列化框架。除了其紧凑的二进制格式带来的优势外,Avro 还具有平台无关性,可以用于在用不同编程语言编写的程序之间交换数据。与 Avro 消息一起传输的始终是相应的 Avro 模式,这使得任何应用程序都可以对数据进行反序列化。

Apache 软件基金会的标志商标
查看和编辑 Avro 模式
Avro 模式 这些数据以 JSON 格式编写,因此可以使用 XMLSpy 轻松查看和编辑 JSON 编辑器, 它允许您在基于文本的编辑模式和/或网格视图之间切换,网格视图可以直观地展示文档的结构。
以下截图展示了Avro模式的文本视图,该视图提供了行号显示、代码折叠、括号匹配、智能输入辅助功能以及其他有用的功能,方便编辑JSON格式的数据,同时还内置了对Avro规范的验证功能。
查看和搜索 Avro 文件
二进制 Avro 文件不仅体积庞大,而且使用现有工具也很难以有效的方式进行查看。为了简化这一过程,开发者可以利用 XMLSpy 中专门的 Avro 查看功能。
以下展示了一个用户友好的 Avro 视图器,它使用网格以易于阅读的表格形式显示 Avro 数据结构。

左侧的“块”面板允许您选择任何数据块,这些数据块会以索引编号显示,以便在“数据”面板中查看。
您还可以快速搜索整个文件,并且搜索到的每一个匹配项都会在数据面板以及包含该字符串的任何区域中被高亮显示。此外,该功能还支持使用正则表达式进行搜索。
由于 Avro 文件包含了相应的模式(schema),因此该模式也会显示在“块”(Blocks)面板的顶部。点击箭头按钮可以提取 Avro 模式,并在“文本视图”(Text View)中查看它。您可以在“文本视图”中保存和/或编辑该模式,具体取决于您的需求。
Avro Viewer 还支持对 Avro 二进制文件进行验证,以确保其符合相应的模式(schema)。
这些Avro 工具是 XMLSpy 的绝佳补充,对于所有使用大数据、无论何种格式的开发者来说都非常有用。现在,让我们进一步提升处理能力,以便更好地应对大量 Avro 文件。
在 RaptorXML 服务器上进行 Avro 数据处理
RaptorXML 服务器,Altova 第三代验证和处理引擎,非常适合处理大量存储在 Avro 文件中的数据。RaptorXML 从底层设计就为了优化并行计算,它包含众多功能,能够提供超高性能、更高的处理能力以及高效的内存利用率,从而实现对大数据进行验证和处理。
RaptorXML 除了支持 XML、JSON 和 XBRL 之外,还支持 Avro 格式。该工具提供了提取 Avro 模式的功能,以及验证 Avro 模式和验证 Avro 数据实例与对应模式的功能。
现在,您可以在 XMLSpy 中体验 Avro 的支持功能。您还可以免费试用 RaptorXML Server 30 天。了解更多。
