---
title: "Altova MissionKitを使用して、サッカーの統計データを分析します"
date: "2011-11-22"
tags: 
  - "charts"
  - "data-mapping"
  - "flextext"
  - "mapforce"
  - "xml-charts"
description: Altova MissionKitを使用して、NFLのクォーターバックの統計データを分析する方法を解説します。従来のパス成功率などの指標と、ESPNが提供するTotal QBRを、データマッピング技術を用いて比較します。
---
Status: #blog

Tags:  #charts #data-mapping #flextext #mapforce #xml-charts

Categories: [Altova](/blog/ja/category/altova.md) 
# Altova MissionKitを使用して、サッカーの統計データを分析します

この記事では、[NFL.com](http://www.nfl.com/)と[ESPN.com](http://espn.go.com/)のデータを用いて、オンライン上のデータを新しい方法で処理・分析することがいかに容易であるかを示します。これは、データが異なる指標を使用し、テキスト形式でのみ提供されている場合でも当てはまります。 以前のブログ記事で、インターネット上で広く利用可能なXML形式のデータを収集することがいかに容易であるかを見てきましたが、オンラインで利用可能であるもののXML形式ではないデータ、または古いデータ処理システムに埋もれており、テキスト形式のレポートとしてのみ利用可能なデータはどうでしょうか？ 

例えば、クォーターバックの評価指標というものがあります。 NFL（アメリカンフットボールのプロリーグ）では、クォーターバックの能力を評価する指標として、「パス成功率」があり、これはクォーターバックのパス成功数、パス試投数、タッチダウン数、そしてインターセプト数に基づいて算出されます。 ESPNは、今年、クォーターバックの総合的な能力を評価する新しいシステム「Total QBR（クォーターバック・レーティング）」を導入しました。 Total QBRは、ESPNが「クォーターバックのパフォーマンスをより正確に評価できる」と主張する指標で、平均得点や重要な場面でのプレーの評価など、より多くのデータを取り入れています。 これらのシステムが出力するランキングを比較してみましょう。もしかしたら、役立つ情報が得られるかもしれません。 今回の例では、Altova MissionKitに含まれるデータインポートおよび分析ツールを使用して、評価を比較します。 もしご自身で試してみたい場合は、MissionKitが利用可能です [30日間の無料トライアル版をダウンロードしてください](https://www.altova.com/ja/download-trial/) Altova社のウェブサイトより。 この例で使用されているファイルは、こちらからアクセスできます。[こちら](https://www.altova.com/ja/library/Analyze_Football_Stats.zip)。 まず最初に、分析に必要な生データが必要です。 2010年シーズン全体のデータをデータソースとして利用しましょう。 テーブルを入手できます [NFL.comによるパス成功率の評価](http://www.nfl.com/stats/categorystats?archive=true&conference=null&statisticCategory=PASSING&season=2010&seasonType=REG&experience=null&tabSeq=0&qualified=true&Submit=Go) そして、それをコピーして、新しいテキストファイルとして貼り付けてください。 

[![NFL.comにおける2010年のトップ5パス成功者](https://lh4.ggpht.com/-NFI7wG2wUrs/TsZmOXa00FI/AAAAAAAAAJE/uCkScVLIjuI/NFL_top5_passers%25255B12%25255D.png?imgmax=800 "NFL.com_top5_passers_2010")](http://www.nfl.com/stats/categorystats?archive=true&conference=null&statisticCategory=PASSING&season=2010&seasonType=REG&experience=null&tabSeq=0&qualified=true&Submit=Go) 

同様のものを利用することができます [ESPNのウェブサイトに掲載されている、クォーターバックの総合評価一覧表](http://espn.go.com/nfl/story/_/id/6834591/nfl-tom-brady-led-nfl-qbr-2010-season) そして、別のテキストファイルを作成します。 

[![ESPNが発表した、2010年のクォーターバックの総合評価（Total QBR）トップ5](https://lh6.ggpht.com/--qirc5-52q4/TsZmOv717GI/AAAAAAAAAJM/Ve-k_TN3hjY/QBR_Top5%25255B6%25255D.png?imgmax=800 "ESPN_Total_QBR_Top5_2010")](http://espn.go.com/nfl/story/_/id/6834591/nfl-tom-brady-led-nfl-qbr-2010-season) 

現在、異なる順序でデータが格納された2つのテキストファイルがあります。次のステップは、これらのテーブルを1つのファイルに統合し、グラフを作成することです。まず、データを格納する際のスキーマファイルが必要です。XMLSpyを使用すると、XSDファイルを迅速かつ視覚的に作成できます。このファイルには、氏名、チーム、パス成功率とランキング、および総合的なQBRとランキングといった子ノードを持つ、一連のQBノードを含めることができます。 

[![QB_Schema.xsd (これはファイル名なので、そのまま翻訳する必要はありません。)](https://lh3.ggpht.com/-9h9gpOW-kqU/TsZmPXj_F7I/AAAAAAAAAJc/_DHTF90Sv5E/QB_Schema_thumb%25255B4%25255D.png?imgmax=800 "QB_Schema.xsd")](http://lh6.ggpht.com/-qXpexJy1EGU/TsZmOxjUSII/AAAAAAAAAJU/FT2UQU_yVgw/s1600-h/QB_Schema%25255B6%25255D.png) 

さて、MapForceでテキストファイルを開き、FlexTextを使ってテキストを解析し、それをカテゴリのリストに変換します。 

[![NFLのクォーターバックに関するデータ（フレキシブルテキスト形式）](https://lh3.ggpht.com/-npZOeSDInk8/TsZmP7U5MLI/AAAAAAAAAJs/WHiPtNpWqIc/NFL_QB_Data_FlexText_thumb%25255B2%25255D.png?imgmax=800 "NFL_QB_Data_FlexText")](http://lh3.ggpht.com/-mh92ItHpYW4/TsZmPvKSwaI/AAAAAAAAAJk/tUpiq04Nabo/s1600-h/NFL_QB_Data_FlexText%25255B6%25255D.png) 

[![合計クォーターバック評価 (Total Quarterback Rating)](https://lh3.ggpht.com/-27iEt2-Jsnc/TsZmQl8KVkI/AAAAAAAAAJ8/wpo08a8R-Tg/Total_QBR_thumb%25255B1%25255D.png?imgmax=800 "Total_QBR")](http://lh4.ggpht.com/-KhYTL2EEOws/TsZmQSUo9yI/AAAAAAAAAJ0/PA_XAqBd1kI/s1600-h/Total_QBR%25255B3%25255D.png) 

次に、MapForceを使用して、テキストファイルからXMLファイルへのデータ変換を行うためのマッピングファイルを作成します。組み込み関数を使用することで、プレイヤー名から氏名と名字を簡単に抽出できます。また、値マッピング機能を使用することで、チームの略称を文字列に変換します（例えば、ARIをArizona Cardinals、ATLをAtlanta Falconsなどに変換します）。さらに、フィルターのテストにおいて、優先コンテキストを設定することで、各クォーターバックに対して正しいデータセットを取得できるようにしています。 

[![QBスキーマ](https://lh5.ggpht.com/-vVdpMSTjr7g/TsZmRelhLqI/AAAAAAAAAKM/_HYG6G38x58/QB_Schema_thumb%25255B6%25255D.png?imgmax=800 "QB_Schema")](http://lh3.ggpht.com/-jOytwVfR0SA/TsZmRJYIzRI/AAAAAAAAAKE/NBETC3PmYoc/s1600-h/QB_Schema%25255B10%25255D.png) 

マッピングを実行すると、結果として得られたXMLデータファイルを保存し、StyleVisionでスタイルシートをデザインするためのソースファイルとして利用できます。このスタイルシートでは、上位10位のパス成功者の一覧表を作成し、パス成功率（Passer Rating）と総合評価指標（Total QBR）をグラフで表示します。 

[![QB_Charts1 (グラフデータ)](https://lh4.ggpht.com/--dzB3khn8Bs/TsZmSR90j9I/AAAAAAAAAKc/NdQ_e0U9cxc/QB_Charts1_thumb.png?imgmax=800 "QB_Charts1")](http://lh4.ggpht.com/-K08g7lYmPTo/TsZmRvA_AxI/AAAAAAAAAKU/MjdwKcOXYA8/s1600-h/QB_Charts1%25255B2%25255D.png) 

[![QB_Charts2 (または、QBチャート2)](https://lh6.ggpht.com/-olKarjh0n3c/TsZmSy4ocyI/AAAAAAAAAKs/6gGgwbA-R6g/QB_Charts2_thumb%25255B1%25255D.png?imgmax=800 "QB_Charts2")](http://lh3.ggpht.com/-ES18REY87K4/TsZmSs7KsBI/AAAAAAAAAKk/NpHX2YcUR2k/s1600-h/QB_Charts2%25255B3%25255D.png) 

両方の評価システムのランキングを視覚的に表現することで、その違いを詳しく調べ、どちらがより効果的かを検討することができます。例えば、ペイトン・マニングはパス成功率ランキングで10位でしたが、Total QBRでは2位でした。これは、Total QBRが重要な場面での貢献度を考慮しているためです。ペイトン・マニングは2010シーズンにおいて、終盤での劇的な逆転劇を何度か演出しました。

現在、[ファイル群（XMLSpyで作成されたXSDファイル、MapForceから提供されたFlexTextファイルとマッピングファイル、そしてStyleVisionで作成されたスタイルシートデザイン）](https://www.altova.com/ja/library/Analyze_Football_Stats.zip)を揃えているため、新しいクォーターバックのデータセットを分析するために、テキストデータファイルを簡単に更新できます。シーズン後半には、2011年のデータでテキストテーブルを更新し、そのデータをマッピングを通じてスタイルシートに流し込み、グラフを更新して、現在のシーズンのランキングを確認することができます。

この例では、NFLのデータに焦点を当てていますが、この方法は、テキストファイルとしてアクセスできる他のデータセットやデータソースにも容易に適用できます。また、他の形式のデータにも対応可能です。 

Altova MissionKitの製品の使い方について、当社の[無料オンライン研修コース](https://www.altova.com/ja/aot/online-training.aspx)を受講することで、さらに詳しく学ぶことができます。
