Bedrijfstoepassingen voor ETL-software

ETL-tools (Extract-Transform-Load) bieden een mechanisme om data uit externe bronnen te halen, deze om te zetten naar een gestandaardiseerd dataformaat en vervolgens in een eindbestemming of opslagplaats te laden.

MapForce is een uiterst effectief, lichtgewicht en schaalbaar ETL-tool met ondersteuning voor veelgebruikte bedrijfsgegevensformaten (XML, JSON, PDF, databases, platte bestanden, EDI, Protobuf, Shopify/GraphQL, enz.). MapForce biedt een eenvoudige, visuele ETL-mappinginterface waarmee u gemakkelijk alle ondersteunde structuren kunt laden en vervolgens met behulp van drag-and-drop functionaliteit knooppunten kunt verbinden, datatransformatiefuncties en filters kunt toevoegen, of de visuele functiebouwer kunt gebruiken voor complexere ETL-projecten.

Krachtige tools voor data-mapping en ETL-processen in MapForce

Om de visuele interface aan te vullen, kunnen de MapForce ETL-tools naadloos worden geautomatiseerd via de krachtige MapForce Server.

ETL-gegevensverwerking en -transformatie

MapForce stelt u in staat om gegevensstructuren eenvoudig te koppelen met behulp van de drag-and-drop functionaliteit voor ETL-datamapping.

Geavanceerde filters en functies voor dataverwerking kunnen worden toegevoegd via een ingebouwde functiebibliotheek. U kunt de visuele functiebouwer gebruiken om meerdere inline- en/of recursieve bewerkingen te combineren in complexere ETL- of data-integratieprojecten, en zelfs functies opslaan voor gebruik in andere projecten.

MapForce ondersteunt ook geavanceerde ETL-scenario's die meerdere invoer- en uitvoerschema's, meerdere bron- en/of doelbestanden, of complexe, meerstapsdata-transformaties omvatten.

Directe bestandsinvoer en -uitvoer (gegevensstroming)

Ondersteuning voor datastromen zorgt voor een aanzienlijke prestatieverbetering van uw ETL-projecten, doordat u gegevensstromen kunt ontvangen van extreem grote XML-, CSV- en FLF-bestanden en relationele databases, en deze gegevensstromen kunt doorsturen naar even grote XML-, CSV- en FLF-bestanden, of deze kunt opslaan in een database.

Deze ingebouwde functionaliteit betekent dat MapForce grote hoeveelheden data en ETL-projecten eenvoudig kan verwerken, waarbij de enige beperking de beschikbare schijfruimte op uw lokale computer of op een netwerk is.

Om deze functie te activeren, selecteert u eenvoudigweg het pictogram "BUILTIN" in de werkbalk in het ontwerpvenster van MapForce.

Met ondersteuning voor het massaal invoegen van gegevens in databases, evenals directe datastroming, is MapForce Server ook uitermate geschikt voor het uitvoeren van ETL-datamappingen.

Grafische tools voor ETL-mapping

De MapForce-interface maakt data-integratie mogelijk, wat vaak vereist is in ETL-projecten, met een grafische interface die veel opties biedt voor het beheren, visualiseren, manipuleren en uitvoeren van individuele mapping-processen en complexe ETL-mappingprojecten. Gebruik het ontwerpvenster om mapping-componenten grafisch te definiëren, functies en filters toe te voegen voor data-manipulatie, en sleep connectoren om data te transformeren tussen bron- en doelformaten.

Definieer transformatieregels grafisch met behulp van de MapForce ETL-software

Het ontwerpvenster bevat gebruiksvriendelijke functies die u helpen om eenvoudig te werken met, te identificeren en opnieuw te definiëren, zelfs de meest complexe datamappingen. Zo selecteert een klik op een itemnaam dit item automatisch voor het verbinden met een ander item. Er verschijnen pop-upvensters wanneer u de muis over delen van de mappingverbindingen beweegt, waar u aanvullende informatie kunt bekijken, zoals de doelitems van de mapping of het datatyp.

Verbindingen kunnen eenvoudig worden verplaatst door te klikken en te slepen naar de gewenste bestemming. Dubbele verbindingen (van dezelfde bron naar een andere bestemming) kunnen worden gemaakt door een verbinding vast te houden en te slepen terwijl u de CTRL-toets ingedrukt houdt. Door op het pictogram voor automatische verbinding van onderliggende elementen te klikken, worden automatisch alle onderliggende elementen met dezelfde naam onder het bovenliggende element verbonden.

De MapForce ETL-software ondersteunt meerdere invoerbronnen en meerdere uitvoerbestemmingen, en u kunt volledig verschillende soorten data combineren.

MapForce bevat een uitgebreide bibliotheek met functies voor dataverwerking, waarmee vrijwel elke benodigde dataomzetting kan worden uitgevoerd die vereist is voor het integratieproject. Een handig overzichtsscherm stelt u in staat om een compleet data-omzettingsproject te visualiseren en in te zoomen op specifieke onderdelen indien nodig. Bovendien geeft het de positie binnen de mapping weer wanneer u door het ontwerpvenster scrollt. Navigeer moeiteloos, zelfs door de grootste data-omzettingsprojecten!

Leer meer over ETL met MapForce

Converteer gegevensformaten

In ETL-toepassingen arriveert nieuwe informatie die bedoeld is voor import vaak in een dataformaat dat niet compatibel is met de bestaande database. MapForce biedt ongeëvenaarde kracht en flexibiliteit voor geavanceerde conversie en transformatie, waardoor het een efficiënt ETL-gereedschap is voor wereldwijde en interne data-integratieprojecten. U kunt eenvoudig data uit meerdere bestanden in verschillende formaten integreren.

MapForce is een ideaal middleware-product voor het verbinden van gedistribueerde applicaties, en biedt ondersteuning voor het automatiseren van data-integratie. Het is geschikt voor gebruik in elke lokale onderneming, webgebaseerde workflows of zelfs cloud-architecturen.

Drie datavormen zijn opgenomen in de ETL-mapping die hieronder wordt weergegeven. Het belangrijkste bronbestand is een Excel-spreadsheet, en de uiteindelijke uitvoerbestemming is een database. Echter, de gegevens in de kolom "SharesAndLeaves" van de database worden opgeslagen als een JSON-object. Het MapForce ETL-tool maakt het JSON-object dynamisch aan en voegt het toe aan de gegenereerde SQL-insert-statement, zoals te zien is in de voorbeeldweergave rechtsonder op de screenshot.

Gebruik de MapForce ETL-tools om data te transformeren en te laden, ongeacht het type data

Herbruikbare datamappingen

Of het nu gaat om een XML-, JSON- of databaseschema, een Shopify API, een EDI-configuratiebestand, een PDF-sjabloon, of een XBRL-taxonomie, MapForce integreert data op basis van datastructuren, ongeacht de specifieke inhoud. Dit betekent dat u datamappingen opnieuw kunt gebruiken, zelfs als de bedrijfsdata veranderen.

Automatiseer de ETL-processen

MapForce kan uitvoeringsbestanden genereren voor gebruik door MapForce Server, of royalty-vrije code voor data-integratie in Java, C# of C++, voor het automatisch opnieuw verwerken van ETL-projecten. Dit stelt u in staat om geplande of op gebeurtenissen gebaseerde data-integratie-/migratietaken te implementeren, die kunnen worden opgenomen in rapportage-, e-commerce- of SOA-gebaseerde applicaties. MapForce data-integratietaken kunnen ook worden geautomatiseerd via een data-integratie-API of een ActiveX-component.

Gegevensmanipulatie

ETL-projecten vereisen datagegevens worden bewerkt om invoergegevens om te zetten voordat deze door het doel systeem worden gebruikt. MapForce biedt een intuïtieve, visuele functiebouwer, volledig schaalbare databewerkingsfuncties met ingebouwde bibliotheken, filters en voorwaarden, en meer, om u in staat te stellen gegevens eenvoudig te bewerken en verschillende formaten te integreren.

Kostenefficiënt

MapForce vereist geen verzameling van adapters of andere extra kosten met zich meebrengende add-ons. Gebruikers hebben volledige controle over het ontwerp en de implementatie van data-integratie en -transformatie van alle datatypes, inclusief elke combinatie van XML, JSON, databases, tekstbestanden, EDI, Excel, XBRL en/of web services data.

Functies voor dataomzetting

In elk ETL-scenario moeten inkomende gegevens worden aangepast aan de vastgestelde standaarden van de databron. Afhankelijk van de specifieke kenmerken van de gegevens, kunnen elementen zoals naamgeving, datum- en tijdformaten, decimale precisie, valuta, temperatuur en meeteenheden, en andere factoren, moeten worden omgezet. MapForce biedt een uitbreidbare bibliotheek met functies voor gegevensverwerking en -conversie, waarmee u gegevens kunt filteren en manipuleren volgens de behoeften van uw ETL-mappingproject. Om tijd te besparen en gebruik te maken van werk dat u al heeft voltooid en getest, kunt u bestaande code voor gegevensconversie of een XSLT 1.0- of 2.0-bestand importeren om te gebruiken als een functiebibliotheek. MapForce bevat ook een unieke visuele functiebouwer waarmee u aangepaste functies kunt definiëren en hergebruiken die meerdere bewerkingen combineren.

MapForce-functies voor data-transformatie

MapForce kan de meest complexe conversies aan, waardoor u regels kunt definiëren op basis van voorwaarden, Booleaanse logica, stringbewerkingen, wiskundige berekeningen, SQL- en SQL/XML-statements, of elke door de gebruiker gedefinieerde functie. U kunt zelfs een bestaande webservice gebruiken om gegevens op te zoeken of te verwerken in elke conversie.

MapForce Data Conversie:

  • Dataverwerkingsfuncties converteren data direct tijdens het proces.
  • Wiskundige berekeningen.
  • Conversie van booleaanse waarden, data, tijd, getallen of strings.
  • Programmatische parsing van strings en datums.
  • Speciale functies voor nodes, sequenties, EDIFACT en databases.
  • Ondersteunt filters, voorwaarden, parameters en variabelen.
  • Databasefuncties in SQL of SQL/XML.

Functiebibliotheek

Veel van de ingebouwde functies, zoals concateneren, optellen, vermenigvuldigen, enz., ondersteunen een onbeperkt aantal parameters, waardoor het eenvoudig is om wiskundige bewerkingen uit te voeren en meerdere parameters te combineren. Aggregatiefuncties stellen u in staat om berekeningen uit te voeren op groepen gegevens, waaronder tellingen, sommen, minimumwaarden, gemiddelden, het samenvoegen van strings en andere bewerkingen. Er zijn conversiefuncties beschikbaar om complexe datatypes gemakkelijk te verwerken.

De functies in de kernbibliotheek zijn algemeen en niet specifiek voor een bepaald type uitvoer. Met behulp van deze kernfuncties kunt u XSLT 1.0/2.0, XQuery, Java, C++ of C# code voor dataomzetting genereren, door simpelweg de gewenste taal(en) te selecteren.

Tussenliggende variabelen

Tussenliggende variabelen zijn een speciaal type component dat een tussenresultaat van een mapping opslaat voor verdere verwerking en gebruikt kan worden om diverse complexe mappingproblemen op te lossen. Een tussenliggende variabele is vergelijkbaar met een reguliere (niet-inline) door de gebruiker gedefinieerde functie, en is een structureel component zonder een apart configuratiebestand.

Filters en voorwaarden

Het toevoegen van filters en voorwaarden aan een mapping maakt het mogelijk om data uit de bron te selecteren op basis van logische criteria.

De "if-else"-voorwaarde in MapForce is vergelijkbaar met een "switch"-statement in veel programmeertalen. Hiermee kunt u eenvoudig de datastroom in uw mappingprojecten beïnvloeden door een waarde te koppelen aan een specifiek criterium.

Transformatieparameters

MapForce ondersteunt transformatie-invoerparameters, waardoor externe parameters invloed kunnen uitoefenen op de mappingtransformaties.

Tools voor het extraheren, transformeren en laden van data in databases

De MapForce database ETL-tools bieden uitgebreide ondersteuning voor database-mapping, inclusief het omzetten van databasegegevens tussen elke combinatie van XML, JSON, PDF, CSV, EDI, Excel, Protobuf, XBRL, Shopify/GraphQL, webdiensten en zelfs andere databaseformaten.

Wanneer u een database structuur in het ontwerpvenster laadt, interpreteert MapForce automatisch het databaseschema, stelt u in staat om beschikbare databasetabellen en -weergaven te selecteren, en herkent het de relaties tussen de tabellen.

Het transformeren van databasegegevens met behulp van de MapForce ETL-mapping

Zodra u alle benodigde contentmodellen voor uw database-ETL-mapping heeft ingeladen, kunt u de mapping voltooien door eenvoudig verbindingslijnen te slepen tussen de bron- en doelstructuren.

Functies voor database-mapping:

  • Databasevragen voor alle belangrijke databasesystemen
  • Het omzetten van gegevens van elk ondersteund databasetype naar een ander
  • Specificeer de instellingen voor de database-sleutel
  • Definieer de acties die op de database-tabel kunnen worden uitgevoerd
  • Raadpleeg databases direct
  • Verbind met en koppel XML-gegevens aan databasevelden
  • Sorteer de invoerelementen van de database

MapForce ondersteunt alle belangrijke relationele databases en populaire NoSQL-databases, waardoor u grafische database-mapping ontwerpen kunt maken tussen brondata uit databases, databewerkingfuncties en filters, en andere datastructuren van verschillende types.

Ondersteunde relationele databases voor ETL:

  • Firebird
  • IBM DB2 for iSeries®
  • IBM DB2®
  • Informix®
  • MariaDB
  • Microsoft Access™
  • Microsoft® Azure SQL
  • Microsoft® SQL Server®
  • MySQL®
  • Oracle®
  • PostgreSQL
  • Progress OpenEdge
  • SQLite
  • Sybase® ASE
  • Teradata

Ondersteunde NoSQL-databases voor ETL:

  • MongoDB
  • CouchDB

Filteren en verwerken van databasegegevens

Veel database-ETL-transformaties vereisen datagegevens tussen de bron en de bestemming worden aangepast op basis van boolean-voorwaarden of SQL- en SQL/XML-statements. Mogelijk moet u logische vergelijkingen uitvoeren, wiskundige berekeningen maken of stringbewerkingen uitvoeren, controleren of databasegegevens een bepaalde waarde hebben, en andere wijzigingen aan de gegevens aanbrengen. In de bovenstaande screenshot worden de databewerkingsfuncties weergegeven als de vakken tussen de lijnen die de bron- en doeldatamodellen verbinden.

De functies voor dataverwerking stellen u in staat om geavanceerde databasekoppelingen in real-time te maken, voor een breed scala aan praktische transformatiebehoeften. U kunt bijvoorbeeld databasekoppelingen maken die XML- of EDI-berichten gebruiken om databasegegevens te extraheren op basis van filtercriteria die zijn afkomstig van de XML- of EDI-elementen.

Directe databaseconversie

Zodra uw mapping is gedefinieerd, stelt de ingebouwde MapForce-engine u in staat om de resultaten met één klik te bekijken en op te slaan.

De mapping naar een database genereert uitvoer in de vorm van SQL-scripts (bijvoorbeeld SELECT-, INSERT-, UPDATE- en DELETE-statements) die direct vanuit MapForce of via MapForce Server worden uitgevoerd op uw doeldatabase.

ETL-tools voor EDI

EDI-standaarden zijn een veelgebruikte methode voor de uitwisseling van e-commercegegevens, waardoor organisaties een snelle en nauwkeurige manier hebben om transactiegegevens uit te wisselen. EDI is voorafgegaan aan andere geïntegreerde bedrijfstechnologieën, zoals ERP, CRM en vele andere technologieën die de supply chain ondersteunen. Daarom zijn datamapping en -transformatie belangrijke overwegingen wanneer EDI-berichten de bron van gegevens vormen voor een ETL-applicatie.

MapForce is een grafische ETL-tool voor elektronische data-uitwisseling (EDI) met native ondersteuning voor alle belangrijke bedrijfsgegevensformaten die tegenwoordig in gebruik zijn, waaronder XML, JSON, databases, platte bestanden, Excel, webdiensten, en tevens de EDIFACT, X12, HL7, NCPDP SCRIPT, IDoc en PADIS EDI-transactiesets.

Een ETL-project dat EDI-gegevens omzet naar een databaseformaat

MapForce vereenvoudigt data-integratie door u de mogelijkheid te bieden om op een visuele manier mappings te definiëren voor ETL-processen tussen UN/EDIFACT, ANSI X12, HIPAA X12, Health Level 7 (HL7), NCPDP SCRIPT, SAP IDoc, IATA PADIS of TRADACOMS en XML, databases, CSV-bestanden, Excel-bestanden en andere EDI-systemen, evenals web services. Deze ETL-tools voor EDI stellen uw organisatie in staat om de voordelen te benutten van elektronische informatie-uitwisseling, zonder de kosten of de complexiteit van uw applicatie-infrastructuur te verhogen.

Verwerk verschillende soorten EDI-berichten

MapForce stelt u in staat om één mapping te definiëren die geschikt is voor EDI-bestanden die meerdere berichttypes bevatten. Er wordt ondersteuning geboden voor EDI-bestanden met meerdere berichttypes, zowel in de bron als in de bestemming van uw datamappingproject, waardoor optimale flexibiliteit wordt geboden voor EDI-mapping.

Berichtbevestiging

In de EDI X12-standaard geeft het berichttype 997 een bevestiging van de status van een inkomende data-uitwisseling. Dit bericht bevestigt bijvoorbeeld de ontvangst van een transactie of geeft informatie over eventuele fouten in de transactie.

MapForce kan eenvoudig worden geconfigureerd om automatisch een koppeling te creëren tussen uw inkomende X12-berichten en 997-bevestigingen, waardoor u naadloze handelsrelaties kunt opzetten, zowel binnen als buiten uw partnernetwerk.

Valideer de EDI-uitvoer

MapForce stelt u in staat om de nauwkeurigheid van de EDI-uitvoer van uw mapping te controleren door alle EDI-bron- en doelcomponenten, evenals de mapping-uitvoer, te valideren. Dit helpt u ervoor te zorgen dat alleen geldige EDI-berichten worden verwerkt.

Tool voor het verwerken van tekstbestanden en platte bestanden (Extract, Transform, Load)

Bestaande tekstbestanden kunnen worden doorzocht en bijgewerkt om consistent te zijn met een bestaande ETL-repository. MapForce bevat de unieke FlexText-tool voor het verwerken en converteren van tekstbestanden, zoals tekstrapporten van mainframe-systemen, tekstgebaseerde logbestanden en andere soorten legacy-tekstbestanden, binnen de mapping-ontwerpen. Met de visuele interface kunt u met FlexText een bestaand tekstbestand invoegen en de gewenste delen extraheren om ze in de MapForce-mappinginterface te converteren.

FlexText genereert een sjabloon dat vervolgens in MapForce wordt geladen. Hierin kunnen individuele tekstblokken worden omgezet in een combinatie van XML, databases, PDF, EDI, XBRL, platte bestanden, Excel, JSON, Protocol Buffers en web services data. Door de configuratie die u in FlexText maakt op te slaan, kunt u hetzelfde sjabloon hergebruiken om meerdere tekstbestanden om te zetten met verschillende mappinginstellingen.

MapForce: Tekstverwerking

FlexText stelt u in staat om regels te definiëren voor conversiemallen van tekstbestanden, die gebruikt worden voor ETL-mapping. Wanneer u een tekstbestand opent in de FlexText-interface, wordt het bestand weergegeven in twee blokken. Het hoofdblok vertegenwoordigt het originele bestand, terwijl het actieblok (aan de rechterkant) de gegevens van het bestand in real-time weergeeft, terwijl u de benodigde gegevens selecteert.

Het resultaat van elke actie die u uitvoert is direct zichtbaar, waardoor u onmiddellijk kunt zien of u het gewenste resultaat heeft bereikt.

Oude tekstbestanden kunnen nuttige gegevens bevatten in CSV- (waarde gescheiden door komma's) of FLF- (velden met vaste lengte) formaten, verpakt in een complexer plat bestand. FlexText stelt u in staat om deze gegevens direct te extraheren met behulp van de CSV- en FLF-bewerkingen. Nadat u bewerkingen zoals "Splitsen" en andere bewerkingen hebt uitgevoerd, kunt u de overgebleven velden in CSV- of FLF-formaat opslaan door de veldnamen, lengtes, enz. te configureren.

Haal relevante gegevens op

FlexText stelt u in staat om de gegevens die u wilt benaderen te isoleren door irrelevante tekst, tekens en witruimte te verwijderen met behulp van splitsingsfuncties. Elke splitsing presenteert uw gegevens in twee nieuwe blokken: één blok bevat de gegevens die u hebt gesplitst, en het andere toont de gewijzigde weergave van uw geconverteerde bestand. U kunt direct het resultaat van elke uitgevoerde bewerking zien.

Knooppunt, Negeren, Schakelaar en Regulieren Expressies

FlexText ondersteunt functies voor het toevoegen en negeren van elementen, waardoor u meer flexibiliteit heeft bij het opbouwen van de informatieboom. Met de "Ignore"-functie markeert u een tekstblok als irrelevant voor de conversie, waardoor MapForce dit blok negeert. Met de "Node"-functie maakt u een nieuw element in de informatieboom in MapForce, zodat u de hiërarchische structuur van uw tekstgegevens correct kunt weergeven indien nodig.

De "Switch"-functie stelt u in staat om meerdere voorwaarden te definiëren voor een enkel tekstblok. De gegevens in het tekstbestand worden alleen aan de bijbehorende container doorgegeven en gebruikt in uw MapForce-conversie, als ze aan een bepaalde voorwaarde voldoen.

FlexText ondersteunt ook reguliere expressies. Zo kan een invoerbestand bijvoorbeeld een door het systeem gegenereerd rapport zijn met getallen en lettercodes in de linker marge, die recordtypen aangeven. Een reeks van vijf cijfers gevolgd door de letter "O" kan bijvoorbeeld het begin van een nieuwe sectie voor een specifieke vestiging aangeven.

Automatiseer de uitvoering van ETL-tools met MapForce Server

Altova MapForce Server bevat de ingebouwde datatransformatie-engine die is ontwikkeld voor MapForce en is aanzienlijk verbeterd om te kunnen functioneren in serveromgevingen. MapForce Server voert.. gegevensomzettingen voor elke combinatie van XML, JSON, databases, EDI, XBRL, platte bestanden, Excel, Protobuf en/of webdiensten, met behulp van vooraf verwerkte en geoptimaliseerde datamappingen die zijn opgeslagen in uitvoeringsbestanden, gebaseerd op.. gegevenskoppelingen die in MapForce zijn gedefinieerdMapForce Server brengt datatransformatie naar een hoger niveau met serverfunctionaliteiten, waaronder parallelle verwerking, multi-threading, bulk SQL-inserts, ondersteuning voor verschillende platforms en meer.

Voorbewerking maakt snellere prestaties en een kleiner geheugengebruik mogelijk voor de meeste datatransformaties. MapForce Server wordt beheerd door FlowForce Server en kan op verschillende manieren worden gebruikt: als een standalone configuratie die via de commandoregel wordt uitgevoerd, of programmatisch via een API.

Nadat een MapForce ETL-mapping is ontworpen en getest, kan deze worden uitgevoerd door MapForce Server om bedrijfsprocessen te automatiseren die repetitieve datatransformaties vereisen.

MapForce Server is een krachtig hulpmiddel voor het automatiseren van ETL-processen

MapForce verwerkt en optimaliseert ETL-datamappingen, slaat ze op in uitvoerbestanden voor MapForce Server, zodat MapForce Server ze via de commandoregel kan uitvoeren, en uploadt ze voor gebruik in FlowForce Server-taken.

Wanneer MapForce Server wordt beheerd door FlowForce Server, worden de datamappingen uitgevoerd als stappen binnen een FlowForce Server-taak, op basis van triggers die zijn gedefinieerd als onderdeel van die FlowForce Server-taak. Bijvoorbeeld, een nieuw XML-bestand komt in een map terecht, wat een meerstaps FlowForce Server-taak activeert. Deze taak valideert eerst het bestand met behulp van RaptorXML+XBRL Server, en voert vervolgens MapForce Server uit om bepaalde gegevens uit de XML te extraheren en deze in een ETL-repositorydatabase op te slaan.