Altova MapForce 2024 Enterprise Edition

Mit Hilfe von Texterfassungsobjekten können Sie Text aus einer Seite eines PDF-Dokuments extrahieren. Wenn Sie ein Texterfassungsobjekt erstellen, wird es in der Modellstruktur des Schema-Fensters und im Ausgabefenster angezeigt. Sie können ein solches Objekt optional in einen XML-Tag verpacken, indem Sie dem erfassten Text einen Namen geben, wodurch Sie die Elemente im Ausgabefenster in einer beschreibenden Struktur anordnen können (siehe Codefragement unten). Der Standardname eines Texterfassungselements ist Capture. Informationen dazu, wie Sie Objekte zur Modellstruktur hinzufügen, finden Sie unter Einfügen eines Objekts.

 

<Invoice>

<Header>GARDENING SERVICES INVOICE</Header>

<BillTo>Oswald Grim

Darkwood St. 17

Boston, MA 02128

+1-617-8767675</BillTo>

<InvoiceNo>4560123</InvoiceNo>

<Date>2023-09-05</Date>

<...>

</Invoice>

 

Wenn Sie in der Modellstruktur des Schema-Fensters auf eine Texterfassung klicken, wird der erfasste Text im PDF-Ansichtsfenster sofort hervorgehoben (Abbildung unten), sodass Sie den Text auf der Seite leichter finden. Der markierte Bereich hat eine Textbeschriftung, die dem Namen des in der Modellstruktur und im Ausgabefenster angezeigten Texterfassungselements entspricht. Sie können auch auf Elemente oder deren Werte im Ausgabefenster klicken, um zu sehen, auf welche Objekte auf der Seite Ihres PDF-Dokuments sie sich beziehen. Nähere Informationen dazu finden Sie in Schritt 2 des Tutorials.

PDFEX_TextCaptureHighlighted

Eigenschaften im Eigenschaftsfenster

Für das Objekt "Texterfassung" können die folgenden Eigenschaften konfiguriert werden:

 

 

© 2018-2024 Altova GmbH