Altova MapForce 2024 Enterprise Edition

Mit Hilfe des Teilen-Objekts (siehe Abb. unten) wird ein bestimmter Ausschnitt einer Seite in Bereiche geteilt. Beim Teilen-Objekt kann eine festgelegte Anzahl von Anfangs- und/oder Endfragmenten einer Region verworfen werden. Es werden verschiedene Methoden unterstützt, um die Positionen für die Teilung festzulegen. Nähere Informationen dazu finden Sie im Unterabschnitt Eigenschaften weiter unten.

 

Informationen dazu, wie Sie Objekte zur Modellstruktur hinzufügen, finden Sie unter Einfügen eines Objekts.

PDFEX_SplitObject

Eigenschaften im Eigenschaftsfenster

Für das Teilen-Objekt können die folgenden Eigenschaften konfiguriert werden:

 

 

Beispiel 1: Linien oder Kanten suchen

In diesem Beispiel wird gezeigt, wie Sie die Methode Linien oder Kanten suchen konfigurieren. Die Aufgabenstellung in diesem Beispiel ist folgende:

 

Es sollen Daten aus der Tabelle extrahiert werden.

Der obere Bereich der Seite (mit der Überschrift, der Firma, dem Kunden und den Rechnungsinformationen), die Kopfzeile der Tabelle und der untere Bereich der Seite sollen von der Verarbeitung ausgenommen werden.

 

Wir haben das Teilen-Objekt zu diesem Zweck folgendermaßen konfiguriert:

 

Die Eigenschaft Erste überspringen wurde auf 2 gesetzt.

Die Eigenschaft Letzte überspringen wurde auf 1 gesetzt.

Die Methode wurde auf Linien oder Kanten suchen gesetzt.

Für die Region wurde kein Wert definiert, daher wird die gesamte Seite als Region behandelt.

 

Der Algorithmus hat als erste Kante den Beginn der Kopfzeile und als zweite Kante das Ende der Kopfzeile identifiziert. Der obere Bereich des Dokuments wurde daher zusammen mit der Kopfzeile der Tabelle von der Verarbeitung ausgenommen (in der Abbildung unten der obere ausgegraute Bereich).

 

Auf Grund des Werts Letzte überspringen (1) wurden die Zellen Subtotal, Sales Tax und Total ausgenommen, da die erste Kante ab dem unteren Rand der Region in der Zeile gefunden wurde, in der die Zeile Fence repair endet. Der Rest der Tabelle wird in Zeilen aufgeteilt (ausgegrauter unterer Bereich in der Abbildung unten).

PDFEX_SkipInitial2

 

Beispiel 2: Objekte suchen

In diesem Beispiel wird gezeigt, wie Sie die Methode Objekte suchen konfigurieren. Die Aufgabenstellung in diesem Beispiel ist, Tabellendaten aus der unten gezeigten Beispielrechnung zu extrahieren.

PDFEX_BookInvoice

Die Tabelle in der Abbildung unten enthält keine regulären Rasterlinien, wodurch die korrekten Teilungspositionen nicht so leicht ermittelt werden können. Außerdem überlappen einander die Zellen in der zweiten (No) und der dritten Spalte (Description). Wir haben die Methode Objekte suchen verwendet, um die Tabelle korrekt in Zeilen aufzuteilen. Wir haben die Methode folgendermaßen konfiguriert:

 

Die Eigenschaften Hintergrundfarbe und Toleranz haben Standardwerte (#FFF bzw. 10%).

Die Eigenschaft Mindestgröße wurde auf 4pt gesetzt, wodurch Objekte, die kleiner als dieser Wert sind, entfernt werden.

Da es keine zu füllenden Lücken gibt, hat die Eigenschaft Lücken füllen den Standardwert 0pt.

Die Eigenschaft Zu suchende Kante wurde auf Beginn gesetzt, d.h. die Objekte werden an ihrem jeweiligen Beginn geteilt.

Durch Versuch und Irrtum haben wir den idealen Wert für die Eigenschaft Versetzen ermittelt, nämlich -3pt. Aufgrund dieses Werts wurden die Teilungspositionen etwas nach oben versetzt, sodass keine Daten abgeschnitten werden.

Es wurden keine Nachbearbeitungsoptionen definieren.

 

Suchregion

Da keine einheitlichen Linien vorhanden sind, entlang derer die Tabelle in Zeilen aufgeteilt werden könnte, ermitteln wir geeignete Teilungspositionen, die anschließend auf die gesamte Region angewendet werden, mit Hilfe der Suchregion. In der Abbildung unten sehen Sie, dass die Region alle Zeilen der Tabelle enthält (hellgelber Bereich). Die Region stellt einen Bereich dar, der aufgeteilt werden soll. Allerdings beinhaltet die Suchregion (orangegelb unten) nur die erste Spalte der Tabelle, in der Objekte leichter als in anderen Teilen der Tabelle erkannt werden können.

PDFEX_BookInvoiceSearch

Wenn keine Suchregion verwendet wird, werden die unten gezeigten Teilungspositionen ermittelt, was in der Ausgabe zu falschen Ergebnissen führen würde.

PDFEX_BookInvoiceNoSearch

 

© 2018-2024 Altova GmbH