XPath式を使用して、データ選択をより詳細に絞り込むことができます
ビッグデータ時代において、私たちはしばしば、より大きなファイルの一部に対してカスタマイズされたビューを作成することで、分析やコミュニケーションを簡素化する必要があります。XPathは、XML Path Languageの略で、ユーザーが大規模なXMLドキュメントの特定の部分にアクセスできるように設計されています。XMLSpyは、XPathアナライザーウィンドウと、XMLデータをグラフ表示するためのインターフェースでXPathをサポートしています。MapForceは、XMLデータのマッピングにおいてXPath関数をサポートし、StyleVisionは、条件付きテンプレート、拡張テンプレート、およびテンプレートフィルタリングにおいてXPathをサポートしています。

Altovaのツールは、可能な限り同じユーザーインターフェースを採用しているため、あるツールで習得したスキルは、他のツールでも容易に活用できます。以前にも、StyleVisionにおけるXPathの自動計算機能についてブログで紹介しましたが、今回は別の例を見てみましょう。
非常に多くの場合、大規模なデータセットには、例えば、米国教育省が提供する、最近の大学卒業生の雇用に関する情報のような、複数の個別のテーブルが含まれています。以下に、その例をCSVファイルとして表示します

各表は、異なる専攻分野および卒業年度の卒業生に関する、特定の雇用統計データを示しています。
XMLSpyのスキーマビューで表示される、データを記述するためのXMLスキーマは、例えば以下のようになります。各テーブルは

シンプルなMapForceの設定で、CSVファイルをXMLスキーマにマッピングすることで、データをXML形式に変換できます。変換されたデータは、XMLSpyで開くことができます

もし、あるグラフを作成したい場合は、XMLSpyのグリッドビューから始めるのが最も簡単です。そこで、まずサブテーブルを1つ選択し、次に右クリックメニューから「新規グラフ」を選択します

次に表示される「グラフデータ選択」ダイアログでは、XMLSpyが自動的に選択されたデータを記述するXPath式を生成します

対応する折れ線グラフは、以下のようになります

別のテーブルのグラフを作成するには、データに戻って別のデータセットを手動で選択するか、XPath式を直接編集することができます。データ選択ウィンドウに表示されていた元の式は、/data/set[3]/row でした
数値「3」を変更することで、別のデータセットを選択できます。あるいは、setnum 属性を利用して、ファイル内の順番ではなく、内容に基づいてテーブルを選択することも可能です。これは、後でデータが変更された場合に、特定のテーブルを明確に選択するためのより良い方法です。例えば、将来のバージョンで、パートタイムの雇用に関するテーブルが2番目の位置に挿入された場合、その後のすべてのテーブルの順番番号が変更される可能性があります。
特定の属性(setnum)を使用してデータを抽出し、卒業生の就職状況を分野別にパーセンテージで表示するグラフを作成するためのXPath式は、以下のようになります。![グラフデータ選択ダイアログでのXPath式の編集]
(https://lh3.ggpht.com/-79L2DcOC2qQ/Ui4g0MGs4mI/AAAAAAAABSg/WrX4KY8qlaE/image%25255B20%25255D.png?imgmax=800 "グラフデータ選択ダイアログでのXPath式の編集")
従業員が、自身の専攻分野と密接に関連する職種に就いている割合を示すグラフは、以下のようになります

XPath式を開発する際に、さまざまなオプションを試したい場合は、XPathアナライザーウィンドウが便利なツールです。XPathアナライザーは、入力中に構文をチェックし、結果をプレビュー表示します

次に、XMLSpyで作成したチャートやXPathデータ選択式をStyleVisionに取り込み、データレポート用のスタイルシートを作成します。この点については、今後の記事で詳しく解説します。
その間、 こちらをクリックして、Altova MissionKitの無料試用版をダウンロードできます。XMLSpy、MapForce、StyleVisionなどが含まれており、ぜひご自身で試してみてください。