Altova MapForce 2024 Enterprise Edition

L’objet Collage prend toutes les pages qu’il obtient depuis son parent et les colle dans une page. Le collage présente cette page comme groupe unique d’une page unique à ses enfants (qui sont souvent des séparateurs). Les collages sont utiles dans les situations dans lesquelles, par exemple, une ligne de données commence au bas d’une page et continue à la prochaine page. Si vous utilisez l’objet Fusionner Cible qui recueille des snippets de différentes pages en un groupe de snippets, la ligne avec les données sur deux pages sera traitée comme deux lignes séparées. Dans ce cas, vous pouvez utiliser l’objet Collage pour fusionner les parties de cette ligne en une.

 

Pour savoir comment ajouter les objets à l’arborescence modèle, voir Insérer un objet.

 

Exemple

L’exemple discuté dans ce chapitre est similaire au modèle décrit dans le chapitre appelé Fusionner Source et Cible. Le fichier échantillon PDF utilisé dans cet exemple est semblable à celui utilisé dans Fusionner Source et Cible, à l’exception d’une ligne qui recouvre deux pages (capture d’écran ci-dessous).

PDFEX_CollageSplitRow

Afin d’extraire correctement les données depuis la ligne de fractionnement, nous utiliserons les procédures suivantes :

 

1.Nous allons devoir créer un Fusionner Source séparé pour chaque page. Pour chaque Fusionner Source, nous définirons la région manuellement (voir Insérer un objet pour les détails).

2.Nous combinerons ensuite les Fusionner Sources en un Fusionner Cible.

3.Nous ajouterons un objet Collage comme enfant de Fusionner Cible. Le Collage collera les (extraits) snippets recueillis dans Fusionner Cible.

4.Le Collage inclura l’objet Fractionner avec un groupe de Captures de texte, chaque Capture représentant une colonne particulière de la table.

 

Arborescence de modèle

Pour les détails relatifs à Fusionner Sources, Fusionner Cible et à l’objet Filtre/Groupe enveloppé dans Fractionner, voir Fusionner Source et Cible. Après avoir suivi les étapes décrites ci-dessus, nous avons créé l’arborescence modèle suivante :

PDFEX_CollageModelTree

Affiner Fusionner Source à la Page 2

Puisque la deuxième page commence par un bord, nous allons devoir déplacer le bord supérieur de la région vers le bas. Ceci fera que le Collage ignore la ligne supérieure, et les parties de la ligne qui s’étendent sur les deux pages seront fusionnées avec succès en une ligne. Vous pouvez ajuster manuellement la taille de la région, en cliquant sur le libellé Région dans le volet de l’Affichage PDF et en glissant le bord supérieur de la région vers le bas, tel qu’affiché dans la capture d’écran ci-dessous.

PDFEX_CollageModifyRegion

Après avoir déplacé le bord supérieur de la région vers le bas, la Collage à l’aspect suivant :

PDFEX_CollageBeforeMerge

Le Collage inclut l’objet Fractionner qui a identifié correctement les positions de fractionnement, et les parties de la ligne erronée sont désormais traitées comme ligne unique (capture d’écran ci-dessous).

PDFEX_CollageSplitPositions

Sortie

Le fractionnement du Collage en lignes résulte en l’aspect suivant de la ligne enjambant les deux pages dans le volet Sortie :

 

<Book>

<Title>Harry Potter and the Philosopher's Stone</Title>

<Author>J.K. Rowling</Author>

<ISBN>1408855895</ISBN>

<Publisher>Bloomsbury

Children's Books</Publisher>

<PrintLength>352</PrintLength>

<Year>2014</Year>

<Genre>Fantasy</Genre>

<Price>14.28</Price>

</Book>

 

© 2017-2023 Altova GmbH