Altova MapForce 2024 Enterprise Edition

El objeto División (ilustrado a continuación) corta en trozos una parte determinada de una página. El objeto División puede descartar un número fijo de fragmentos iniciales y/o finales de una región y admite distintos medios para ubicar las posiciones de división. Para más detalles, consulte la subsección Propiedades más abajo.

 

Para más información sobre cómo agregar objetos a la estructura jerárquica, consulte el apartado Insertar un objeto.

PDFEX_SplitObject

Propiedades en el panel Propiedades

Puede configurar las siguientes propiedades del objeto División:

 

 

Ejemplo 1: Búsqueda de líneas o bordes

Este ejemplo describe cómo configurar el método Búsqueda de líneas o bordes. Lo que pretendemos con este ejemplo es lo siguiente:

 

Extraer datos de la tabla

Excluir del procesamiento la parte superior de la página (que contiene el encabezado, la empresa, el cliente y los detalles de la factura), la fila de encabezado de la tabla y la parte inferior de la página.

 

Para ello hemos configurado el objeto División de la siguiente manera:

 

La propiedad Omitir inicio se ha configurado en el valor 2.

La propiedad Omitir final se ha configurado en el valor 1.

El método se ha configurado en Búsqueda de líneas o bordes.

Como no se ha configurado ningún valor para la opción ‘Región’, toda la página se tratará como una única región.

 

El algoritmo ha identificado el primer borde en el lugar donde empieza la fila del encabezado y el segundo borde en el lugar donde termina la fila del encabezado. Por lo tanto, la parte superior del documento junto con la fila del encabezado de la tabla se han excluido del procesamiento (ver la parte superior atenuada en color gris en la imagen siguiente).

 

El valor Omitir final (1) ha llevado al algoritmo a excluir las celdas Subtotal, Sales Tax y Total porque el primer borde desde la parte inferior de la región se ha identificado en la línea donde termina la fila Fence repair. El resto de la tabla se dividirá en filas (ver la parte inferior atenuada en color gris en la imagen siguiente).

PDFEX_SkipInitial2

 

Ejemplo 2: Búsqueda de objetos

Este ejemplo describe cómo configurar el método Búsqueda de objetos. La meta de este ejemplo es extraer datos de la factura de muestra (ver imagen siguiente).

PDFEX_BookInvoice

La tabla ilustrada en la imagen anterior no contiene líneas de cuadrícula regulares, lo que dificulta la tarea de identificar posiciones de división correctas. Aparte, las celdas de la segunda columna (No) y de la tercera columna (Description) se superponen. Para poder dividir la tabla en filas correctamente, hemos seleccionado el método Búsqueda de objetos que hemos configurado de la siguiente forma:

 

Las propiedades Color de fondo y Tolerancia tienen valores predeterminados (#FFF y 10%, respectivamente).

La propiedad Extensión mínima se ha configurado en 4pt, lo que permite eliminar objetos que son más pequeños.

La propiedad Rellenar vacíos tiene el valor predeterminado (0pt) dado que en la tabla de muestra no hay vacíos que se tendrían que rellenar.

La propiedad Borde a buscar está configurada en Inicio, es decir que los objetos se dividirán en las ubicaciones donde empiezan.

Por ensayo y error, hemos detectado el valor ideal de la propiedad Desplazar, que en este caso es -3pt. Debido a la configuración de este valor, las posiciones de división han subido un poco, lo que evita que los datos se truncarán.

No se ha definido ninguna opción de post procesamiento.

 

Región de búsqueda

Como no hay líneas coherentes en las que la tabla podría dividirse en filas, utilizamos la Región de búsqueda para identificar posiciones de división fiables, que luego se aplicarán a toda la región. En la imagen siguiente se puede ver que la Región contiene todas las filas de la tabla (ver área en amarillo claro). La Región representa un área que pretendemos dividir en diferentes partes. Sin embargo, la Región de búsqueda (rectángulo amarillo brillante de abajo) sólo cubre la primera columna de la tabla, donde la detección de objetos funciona de forma más fiable que en otras partes de la tabla.

PDFEX_BookInvoiceSearch

Si no se usa ninguna Región de búsqueda, el objeto División identificará las posiciones de división ilustradas a continuación, lo que llevará a resultados erróneos en la salida.

PDFEX_BookInvoiceNoSearch

 

© 2018-2024 Altova GmbH