Trasformare i progetti di mappatura dei dati, dalla fase di sviluppo fino alle fasi di test e produzione

I progetti di mappatura dei dati spesso riflettono le attività di sviluppo software, con fasi distinte per la progettazione, il test e l'implementazione. Questo è particolarmente vero per i progetti ETL (estrazione, trasformazione e caricamento), in cui è necessario ripetere la mappatura dei dati man mano che diventano disponibili nuovi dati, e l'importanza aumenta con l'aumentare della quantità di dati elaborati. I prodotti Altova MissionKit e Server Software offrono risorse globali per definire le configurazioni per ogni fase del progetto e per facilitare la transizione tra di esse.

Esaminiamo un esempio basato su una mappatura dei dati con MapForce, che trasforma i dati da un file sorgente a un database.

The progetto di mappatura dei dati La procedura descritta di seguito prende in input un file CSV contenente uno o più ordini di vendita semplici. Ogni ordine contiene un codice prodotto e una quantità, e la procedura calcola l'importo totale della vendita in base al prezzo corrente del prodotto, genera un numero d'ordine univoco e inserisce l'ordine in un database esistente.

Il processo per sviluppare una mappatura dei dati di questo tipo e integrarla in un flusso di lavoro aziendale richiede tre fasi distinte: uno sviluppatore o un esperto di dati progetta la mappatura, un tester di controllo qualità la verifica, e infine la mappatura viene implementata nell'ambiente di produzione. Global Resources consente a diversi soggetti coinvolti nel progetto di modificare il file di dati di origine e il database di destinazione per ogni fase, senza dover modificare la mappatura stessa.

Le risorse globali sono riferimenti portatili a file, cartelle o database che funzionano come alias. Quando vengono salvate come risorse globali, i percorsi e i dettagli di connessione al database diventano riutilizzabili e disponibili in diverse applicazioni Altova. L'immagine sottostante mostra risorse globali che fanno riferimento a un file di dati di input e a un database.

Le definizioni globali possono essere organizzate in configurazioni. Ad esempio, alcuni progetti di mappatura dei dati richiedono configurazioni separate per la progettazione, il test e la produzione. Il passaggio da una configurazione all'altra modifica sia il file di dati di origine che il database di destinazione.

L'immagine sottostante mostra una parte della barra degli strumenti di MapForce, con il menu a tendina per la configurazione delle risorse globali. È in questa sezione che l'utente seleziona la configurazione attiva.

Nella mappatura dei dati, sia il file di input che il database di destinazione sono configurati per fare riferimento a risorse globali. Di seguito è mostrata la finestra di dialogo delle impostazioni del componente per il file di dati di origine, configurato come risorsa globale:

Per ogni configurazione delle risorse globali, viene inoltre definito il database di destinazione

Il progettista del progetto di mappatura dei dati inizia lavorando con un piccolo set di dati di esempio e una copia della struttura del database. Una volta completata la mappatura, lo sviluppatore la esegue direttamente in MapForce per creare ed eseguire uno script SQL che inserisce i dati. La finestra di output di MapForce mostra i risultati:

Per la fase di test, desideriamo eseguire direttamente la mappatura dei dati all'interno di MapForce Server, in un ambiente di test che utilizza un file di input diverso e una copia del database rispetto a quelli utilizzati inizialmente dallo sviluppatore.

Lo sviluppatore compila la mappatura e la trasforma in un file di esecuzione per MapForce Server tramite il menu "File" di MapForce

Il file di esecuzione del server MapForce contiene la mappatura, il file delle risorse globali e i riferimenti al database associati alla mappatura, ma non risolve alcuna configurazione specifica delle risorse globali. Questo permette di selezionare la configurazione delle risorse globali durante l'esecuzione. Le definizioni delle risorse globali sono memorizzate in un file XML chiamato GlobalResources.xml sulla workstation del progettista. Il progettista fornirebbe sia il file di esecuzione del server MapForce che il file delle risorse globali per la fase di test.

Il team di test utilizza l'interfaccia a riga di comando di MapForce Server per eseguire la mappatura nella configurazione desiderata. Qui è mostrata la forma generica dell'interfaccia a riga di comando di MapForce Server, con il nome della mappatura e i parametri per il file delle risorse globali e la configurazione delle risorse globali:

Ecco il comando effettivo, così come potrebbe apparire in una finestra di comando:

Se i risultati dei test sono soddisfacenti, la mappatura e le risorse globali possono essere implementate sul server FlowForce ed eseguite come parte di un processo sul server FlowForce, eventualmente come parte di un importazione programmata dei dati per aziende L'operazione può essere eseguita dal menu principale, come mostrato sopra, tramite l'opzione "Distribuisci su FlowForce Server":

Le risorse globali vengono configurate dalla finestra di dialogo "Gestisci risorse globali":

Ogni configurazione viene memorizzata come un oggetto FlowForce Server separato e viene referenziata in una definizione di lavoro di FlowForce Server.

Scaricate una versione di prova gratuita per gestire in modo efficiente i progetti di mappatura dei dati, integrando le diverse fasi del vostro flusso di lavoro aziendale!