Wie man eine verkettete Datentransformation erstellt
Komplexe ETL- und Datenintegrationsprojekte passen selten in eine einzige Transformation. Entwickler erstellen oft mehrstufige Datenverarbeitungsprozesse, bei denen die Ausgabe eines Schritts zur Eingabe für den nächsten wird. Dieser Ansatz erleichtert das Management von Abhängigkeiten, die Wiederverwendung von Logik und die Wartbarkeit großer Arbeitsabläufe. Durch die Aufteilung von Transformationen in kleinere, gestaffelte Zuordnungen werden auch Tests, die Fehlersuche und die langfristige Skalierbarkeit vereinfacht.
Altova MapForce unterstützt diesen Ansatz durch die Verwendung von verketteten Datenabbildungen, die es ermöglichen, mehrere Transformationen zu einer strukturierten Verarbeitung abzuleiten. Dieser Artikel erläutert, wann verkettete Transformationen sinnvoll sind, welche Probleme sie in realen Datenverarbeitungsprozessen lösen und wie Sie in MapForce einen modularen, mehrstufigen Workflow erstellen können.

Vorteile der verketteten Datenverarbeitung
Der Ansatz der verketteten Datentransformation bietet zahlreiche Vorteile, insbesondere bei der Verarbeitung komplexer ETL- und Datenintegrationsprozesse. (Möchten Sie eine kurze Zusammenfassung? Sehen Sie sich dieses Anleitungsvideo an, um zu sehen, wie einfach es ist, Datenpipelines mit mehreren Transformationen mithilfe visueller Werkzeuge in Altova MapForce zu erstellen.)
Die Vorteile der Erstellung eines schrittweisen Datenkonvertierungsprozesses umfassen:
Vereinfachung komplexer Datenverarbeitung: Ein kettenartiger Ansatz zur Datenzuordnung erleichtert die Bearbeitung komplexer Datenverarbeitungsprozesse, indem die Transformation in kleinere, übersichtlichere Schritte unterteilt wird. Jeder Schritt in der Kette führt eine spezifische Operation an den Daten durch, was das Verständnis, die Prüfung und die Wartung vereinfacht.
Einfache Fehlerbehebung: Jede Transformation in der Kette ist so konzipiert, dass sie für einen bestimmten Aspekt der Datenverarbeitung verantwortlich ist. Dies erleichtert das Verständnis der Datenverarbeitungsschritte und ermöglicht es, Fehler oder Probleme, die während der Verarbeitung auftreten können, leichter zu identifizieren und zu isolieren.
Flexibilität und Anpassungsfähigkeit: Die mehrstufige Datentransformation bietet Flexibilität bei der Verarbeitung verschiedener Datenszenarien. Entwickler können die Transformationskette einfach anpassen oder erweitern, indem sie Transformationen hinzufügen, entfernen oder neu anordnen, um neuen Anforderungen oder Veränderungen in den Eingabedaten gerecht zu werden. Diese Anpassungsfähigkeit ist wichtig, wenn sich die Anforderungen an die Datenverarbeitung im Laufe der Zeit ändern.
Einfaches Verständnis und Wartung: Die sequentielle Datentransformation erleichtert das Verständnis und die Wartung eines Mapping-Projekts. Jeder Schritt in der Kette repräsentiert eine klar definierte Transformationsoperation, wodurch es für die Teammitglieder einfacher wird, den gesamten Datenfluss und die zugrunde liegende Logik zu verstehen. Und wenn ein Fehler oder ein Problem auftritt, können Entwickler den problematischen Schritt identifizieren und ihn isoliert debuggen, ohne den Rest des Workflows zu beeinträchtigen.
Definition von mehrstufigen Datentransformationen
MapForce bietet einen visuellen, code-freien Ansatz zur Definition jedes einzelnen Schritts im Datenkonvertierungsprozess. Die grafische Darstellung bietet einen klaren Überblick über die gesamte Datenverarbeitung und ihre einzelnen Phasen, was das Verständnis und die Anpassung erleichtert.
MapForce wird mit einer umfangreichen Bibliothek von Datenverarbeitungsfiltern und -funktionen geliefert, mit denen Datenumwandlungsregeln definiert und komplexere, visuell definierte Funktionen erstellt werden können. Die sofortige Anzeige der Ergebnisse erleichtert das Testen und die Fehlerbehebung.

Bei einer mehrstufigen Datenzuordnung fungiert mindestens eine Komponente sowohl als Quelle als auch als Ziel. Diese Zwischenkomponente (mit B gekennzeichnet) erzeugt eine Ausgabe, die dann als Eingabe für die weitere Verarbeitung im nächsten Schritt der Kette verwendet wird. Die verketteten Schritte in MapForce umfassen die Funktion "Durchleitung", mit der Sie die Ausgabe, die in jeder Phase der Zuordnung erzeugt wird, anzeigen können, um Fehler schnell zu beheben. Beispielsweise können Sie in der obigen Zuordnung die Ausgabe anzeigen (und speichern), die durch die Transformation von A nach B entsteht, sowie die Ausgabe, die durch die Transformation von B nach C entsteht.
Obwohl dieses Beispiel eine verkettete XML-Zuordnung zeigt, ist MapForce ein Datenzuordnungstool, das Daten zwischen beliebigen Formaten umwandeln kann. Es unterstützt die Konvertierung zwischen XML, SQL- und NoSQL-Datenbanken, JSON, Textdateien, Excel-Tabellen, EDI-Formaten, Shopify-Daten und vielem mehr.
Sehen Sie sich dieses Video an, um zu erfahren, wie eine verkettete Datentransformation funktioniert. Das Beispiel zeigt eine mehrstufige Datenumwandlung von XML zu JSON und dann zu CSV und behandelt die Verwendung von Funktionen zur Datenfilterung und -sortierung. Sie werden lernen:
- Wie man die Ergebnisse einer Transformation in einer anderen Transformation wiederverwendet
- Wie man komplexe Datentransformationen in kleinere Schritte aufteilt
- Die Vorteile der Aufteilung großer ETL-Prozesse in modulare Komponenten
- Wie verwaltet man Abhängigkeiten in komplexen Datenabgleichsprozessen
- Wie man wiederverwendbare Transformationskomponenten erstellt
Sie können sich selbst mit der Verknüpfung von Datenmodellen vertraut machen, indem Sie eine kostenlose 30-Tage-Testversion von MapForce herunterladen und das Beispielprojekt "MapForce-Beispiele" öffnen, das eine Funktion zur Verknüpfung von Datenmodellen enthält.