Altova MissionKit을 사용하여 축구 통계를 분석합니다

본 기사에서는 NFL.comESPN.com에서 제공하는 통계 자료를 활용하여 온라인 데이터를 새로운 방식으로 처리하고 분석하는 것이 얼마나 쉬운지 보여줍니다. 이는 데이터가 서로 다른 측정 기준을 사용하고 텍스트 형식으로만 제공되더라도 마찬가지입니다. 이전 블로그 게시물에서 인터넷에서 널리 사용되는 XML 형식의 데이터를 수집하는 것이 얼마나 쉬운지 살펴보았습니다. 하지만 온라인에서 제공되지만 XML 형식이 아닌 흥미로운 데이터나, 기존 데이터 처리 시스템에 숨겨져 텍스트 보고서 형식으로만 제공되는 데이터는 어떻게 처리해야 할까요?

예를 들어, 쿼터백 평가 시스템을 생각해 볼 수 있습니다. NFL은 쿼터백의 능력을 평가하는 지표로 "패서 레이팅"을 사용하는데, 이 지표는 쿼터백이 던진 패스의 성공률, 시도 횟수, 터치다운 횟수, 그리고 인터셉트 횟수만을 기준으로 계산됩니다. ESPN은 올해 새로운 평가 시스템인 "토탈 QBR(쿼터백 평가 시스템)"을 도입했습니다. ESPN은 "토탈 QBR"이라는 지표를 통해 쿼터백의 경기력을 보다 정확하게 평가한다고 주장하며, 이 지표는 예상 득점 평균과 중요한 순간에 보여주는 활약 정도를 포함한 더 많은 데이터를 활용합니다. 이 시스템들이 생성하는 순위 결과를 비교해 보면, 유용한 정보를 얻을 수 있을지 확인해 볼 수 있습니다. 이번 예제에서는 Altova MissionKit의 데이터 가져오기 및 분석 도구를 사용하여 평가 결과를 비교해 보겠습니다. 직접 이 기능을 사용해보고 싶으시다면, MissionKit을 이용하실 수 있습니다 30일 무료 체험을 위해 다운로드 받으세요 Altova 웹사이트에서 발췌. 이 예제에서 사용된 파일은 여기에서 확인하실 수 있습니다. 분석을 위해 가장 먼저 필요한 것은 원본 데이터입니다. 2010년 전체 시즌의 데이터를 분석 자료로 활용해 봅시다. 다음 방법으로 테이블을 얻을 수 있습니다 NFL.com에서 제공하는 패서(쿼터백) 평가 정보 그런 다음, 해당 내용을 복사하여 붙여넣어 새로운 텍스트 파일로 저장하세요.

저희는 유사한 것을 이용할 수 있습니다 ESPN 웹사이트에서 제공하는 쿼터백 종합 평가 순위표 그리고 두 번째 텍스트 파일을 생성합니다.

현재 두 개의 텍스트 파일이 있는데, 각 파일에는 서로 다른 순서로 데이터 테이블이 포함되어 있습니다. 다음 단계는 이 테이블들을 하나의 파일로 합치고, 차트를 생성하는 것입니다. 먼저, 데이터를 저장할 대상에 대한 스키마 파일이 필요합니다. XMLSpy에서는 XSD 파일을 빠르게, 그리고 시각적으로 생성하여, 이름(이름, 성), 팀, 패스 성공률 및 순위, 그리고 총 QBR 및 순위와 같은 자식 노드를 가진 일련의 QB 노드를 포함할 수 있습니다.

이제 MapForce에서 텍스트 문서를 열고, FlexText 기능을 사용하여 텍스트를 분석하고 이를 여러 범주로 분류된 목록으로 변환합니다.

다음으로, MapForce에서 텍스트 파일의 데이터를 대상 XML 파일에 매핑하는 매핑 파일을 생성합니다. 내장된 함수를 사용하여 플레이어 문자열에서 이름과 성을 쉽게 추출할 수 있으며, 값 매핑 기능을 통해 팀 약어를 문자열로 변환합니다 (예: ARI는 Arizona Cardinals로, ATL은 Atlanta Falcons로 변경). 또한, 필터 테스트 시 우선순위 컨텍스트를 설정하여 각 쿼터백에 대해 정확한 데이터 세트를 얻도록 합니다.

매핑 작업을 완료하면 생성된 XML 데이터 파일을 저장하고, StyleVision에서 스타일 시트를 디자인하는 데 소스 파일로 사용할 수 있습니다. 이 스타일 시트에서, 우리는 상위 10명의 패서(쿼터백) 순위를 보여주는 표와 패서 레이팅 및 총 QBR을 그래픽으로 표시하는 차트를 만듭니다.

이제 두 가지 평가 시스템의 순위를 시각적으로 확인할 수 있으므로, 그 차이점을 분석하고 어떤 시스템이 더 효과적인지 파악할 수 있습니다. 예를 들어, 페이튼 매닝은 패스 성공률에서 10위였지만, 총 쿼터백 성과 지수(Total QBR)에서는 2위였습니다. 이는 총 쿼터백 성과 지수가 중요한 순간의 기여도를 고려하기 때문이며, 페이튼 매닝이 2010 시즌 후반에 몇 차례 극적인 역전승을 이끌었다는 점을 반영합니다. 이제 우리는 다양한 파일들(XMLSpy에서 생성된 XSD 파일, MapForce에서 가져온 FlexText 및 매핑 파일, StyleVision에서 제작된 스타일 시트 디자인)을 확보했으므로, 텍스트 데이터 파일을 쉽게 업데이트하여 새로운 쿼터백 데이터를 분석할 수 있습니다 시즌 후반에는 텍스트 테이블을 2011년 데이터로 업데이트하고, 데이터를 매핑을 통해 스타일 시트로 전달하여 차트를 업데이트하고 현재 시즌의 순위를 확인할 수 있습니다. 이 예시는 NFL 데이터를 중심으로 설명했지만, 이 방법은 텍스트 파일로 제공되거나 다른 형식으로 제공되는 다른 데이터 세트 및 데이터 소스에도 쉽게 적용할 수 있습니다.

Altova MissionKit 제품의 사용법에 대해 더 자세히 알아보려면, 저희가 제공하는 무료 온라인 교육 과정을 수강하시면 됩니다.