お気に入りのXMLエディタで、Avroのビッグデータを活用する方法
ビッグデータに関する動向により、開発者はXMLに加えて、他のデータプロトコル(例:)も利用するようになっています JSON そして、Apache AvroやXMLSpyは、これらのデータ形式に対応しており、専用の編集ビューと機能を提供しています。
XMLSpyにおけるAvroの専門的なサポート機能が、Avroファイルの可視化と検索、そしてAvroスキーマの編集を、他に類を見ないほど容易にする方法を見ていきましょう。また、RaptorXML Serverを活用することで得られる、高性能なAvro処理のメリットについても解説します。

Avroとは何ですか?
アパッチ アブロ™は、大規模データをコンパクトかつ高速に二進数形式でシリアライズするためのシステムであり、特にApacheプロジェクト内で広く利用されています Hadoop Avroは、コンパクトなバイナリ形式という利点に加え、プラットフォームに依存しないため、異なるプログラミング言語で記述されたプログラム間でデータを交換することができます。また、Avroメッセージには常に対応するAvroスキーマが含まれているため、どのアプリケーションでもデータをデシリアライズすることが可能です。

Apache Software Foundationのロゴマーク(商標)
Avroスキーマの表示と編集
Avroスキーマ これらのデータはJSON形式で記述されており、そのため、XMLSpy上で容易に閲覧および編集することができます JSONエディタ, これにより、テキストベースでの編集と、ドキュメントの構造を視覚的に表示するグリッドビューの切り替えが可能になります。
以下に示されたスクリーンショットは、テキスト表示でAvroスキーマを表示したものです。この表示では、行番号、コードの折りたたみ、括弧のマッチング、インテリジェントな入力支援機能など、JSONの編集に役立つ様々な機能が提供されており、さらにAvro仕様に対する組み込みの検証機能も備わっています。
Avroファイルを表示および検索する
バイナリ形式のAvroファイルは、サイズが大きいだけでなく、既存のツールを使って有効に閲覧することも困難です。この問題を解決するために、開発者はXMLSpyに搭載されている専用のAvroビューを活用することができます。
以下に、使いやすいAvroビューアの画面を示します。このビューアは、Avroのデータ構造を、読みやすい表形式で表示するために、グリッドを使用しています。

左側の「ブロック」パネルでは、データパネルに表示されるデータブロックを選択できます。各データブロックは、そのインデックス番号で表示されます。
また、ファイル全体を一度に検索することも可能です。検索文字列が見つかった箇所は、データ表示領域だけでなく、その文字列が含まれるブロック内でもハイライト表示されます。正規表現による検索にも対応しています。
Avroファイルには対応するスキーマが含まれているため、そのスキーマもBlocksパネルの上部に表示されます。矢印ボタンをクリックすると、Avroスキーマが抽出され、テキスト表示で確認できます。必要に応じて、テキストを保存したり、編集したりすることも可能です。
Avro Viewerは、Avroバイナリデータが、定義されたスキーマに準拠しているかどうかを検証する機能も備えています。
これらのAvroツールは、あらゆる形式のビッグデータを扱う開発者にとって、XMLSpyにとって非常に有用な追加機能です。それでは、大量のAvroファイルを取り扱う際に、処理能力をさらに向上させる方法について説明します。
RaptorXMLサーバーにおけるAvroデータ処理
RaptorXML Serverは、Altovaが開発した第3世代の検証・処理エンジンであり、Avroファイルに含まれる膨大なデータを効率的に処理するのに最適です。並列処理に最適化された設計に基づいて構築されており、RaptorXMLは、ビッグデータの検証と処理において、非常に高いパフォーマンス、処理能力の向上、そして効率的なメモリ利用を実現する様々な機能を備えています。
RaptorXMLは、XML、JSON、XBRLに加えて、Avroもサポートしています。Avroのスキーマをデータから抽出したり、Avroスキーマを検証したり、Avroデータが関連するスキーマに準拠しているかどうかを検証するための機能が用意されています。
XMLSpyで、Avro形式のサポートが利用できるようになりました。ぜひご確認ください。https://www.altova.com/download
