Użyj wyrażeń XPath, aby precyzyjniej określić zakres danych

W dobie ogromnych zbiorów danych często konieczne jest upraszczanie analiz i komunikacji poprzez tworzenie spersonalizowanych widoków fragmentów większych plików. XPath, czyli język ścieżek XML, został zaprojektowany, aby umożliwić użytkownikom dostęp do fragmentów dużych dokumentów XML. XMLSpy obsługuje XPath dzięki oknu analizatora XPath oraz w swoim interfejsie do wizualizacji danych XML. MapForce obsługuje funkcje XPath do mapowania danych XML, a StyleVision obsługuje XPath w szablonach warunkowych, szablonach rozszerzonych oraz w filtracji szablonów.

Narzędzia Altova wykorzystują ten sam interfejs użytkownika, o ile to możliwe, dzięki czemu umiejętności zdobyte przy użyciu jednego narzędzia można łatwo przenieść na inne. Wcześniej pisaliśmy na blogu o funkcji automatycznego obliczania wyrażeń XPath w programie StyleVision, więc przyjrzyjmy się teraz innemu przykładowi.

Bardzo często duży zbiór danych zawiera wiele oddzielnych tabel, takich jak ten przykład zawierający informacje o zatrudnieniu absolwentów uczelni w Stanach Zjednoczonych, pochodzący z Departamentu Edukacji USA, który jest tutaj przedstawiony jako plik CSV:

Każda tabela przedstawia jeden wskaźnik zatrudnienia dla absolwentów różnych kierunków studiów i roczników.

Schemat XML opisujący dane mógłby wyglądać w następujący sposób w widoku schematu XMLSpy: każdy pojedynczy zestaw danych byłby opisany w elemencie , a rozwinięcie elementu wyświetlałoby dodatkowe elementy potomne dla każdego kierunku studiów lub specjalizacji.

Prosty proces mapowania danych w MapForce, który przekształca dane z pliku CSV na schemat XML, pozwala na konwersję danych do formatu XML, który następnie możemy otworzyć w programie XMLSpy

Jeśli chcemy utworzyć wykres dla jednego z wykresów, najłatwiej zacząć od widoku tabeli w programie XMLSpy, gdzie możemy wybrać jedną podtabelę, a następnie wybrać opcję "Nowy wykres" z menu kontekstowego, które pojawia się po kliknięciu prawym przyciskiem myszy:

W oknie dialogowym "Wybór danych z wykresu", które się otworzy, program XMLSpy automatycznie generuje wyrażenie XPath opisujące wybrane dane:

Odpowiedni wykres liniowy wygląda następująco:

Aby wyświetlić wykres dla innego zestawu danych, możemy wrócić do danych i ręcznie wybrać inny zestaw, lub możemy po prostu edytować wyrażenie XPath. Oryginalne wyrażenie w oknie wyboru danych brzmiało: /data/set[3]/row

Możemy zmienić liczbę 3, aby wybrać inny zestaw danych, lub możemy wykorzystać atrybut "setnum", aby wybrać tabelę na podstawie jej zawartości, a nie jej kolejności w pliku. To byłoby lepsze rozwiązanie, jeśli chcemy wyraźnie wybrać konkretną tabelę, w przypadku gdy dane ulegną zmianie w przyszłości. Na przykład, w kolejnej wersji programu, tabela dotycząca zatrudnienia na część etatu mogłaby zostać wstawiona na drugą pozycję, co zmieniłoby numery kolejności wszystkich kolejnych tabel.

Wyrażenie XPath, które wybiera dane i wyświetla wykres przedstawiający procent absolwentów zatrudnionych w dziedzinie ściśle związanej z ich kierunkiem studiów, wygląda następująco: ![Edycja wyrażenia XPath w oknie dialogu wyboru danych do wykresu]

(https://lh3.ggpht.com/-79L2DcOC2qQ/Ui4g0MGs4mI/AAAAAAAABSg/WrX4KY8qlaE/image%25255B20%25255D.png?imgmax=800 "Edycja wyrażenia XPath w oknie dialogowym wyboru danych wykresu")

Poniższy wykres przedstawia procent pracowników, którzy pracują na stanowiskach ściśle związanych z kierunkami, które ukończyli:

[tutaj powinien być wykres]

Jeśli chcesz eksperymentować z różnymi opcjami podczas tworzenia wyrażenia XPath, okno analizatora XPath jest przydatnym narzędziem. Analizator XPath sprawdza składnię w trakcie pisania i wyświetla podgląd wyniku:

Następnym krokiem jest wykorzystanie schematów i wyrażeń do wyboru danych XPath, opracowanych w programie XMLSpy, oraz użycie ich w programie StyleVision do stworzenia arkusza stylów do generowania raportów z danych. Omówimy ten temat szczegółowo w kolejnym wpisie.

W międzyczasie, mogą Państwo Kliknij tutaj, aby pobrać bezpłatną wersję próbną pakietu Altova MissionKit...w tym XMLSpy, MapForce i StyleVision, i zacznij korzystać z nich już dziś!