Función de División de PDF API y SDK

Split PDF API & SDK

Divide documentos con control de precisión

Transforma tus flujos de documentos con división de PDF de precisión

La API y el SDK de división de PDF proporcionan a los desarrolladores capacidades sólidas para dividir documentos PDF en varios archivos más pequeños según páginas o rangos específicos. Esta tecnología permite la extracción precisa de secciones del documento, ya sea para separar capítulos, eliminar contenido confidencial o crear archivos más manejables para su distribución.

Construida para integrarse en aplicaciones de escritorio, servicios web y flujos de trabajo de documentos automatizados, nuestra solución mantiene la integridad del documento mientras brinda control total sobre la selección y organización de páginas. El modelo de procesamiento asíncrono de la API gestiona documentos de hasta 10 MB de forma eficiente, por lo que es adecuada tanto para procesamiento individual como para operaciones por lotes de gran volumen.

A diferencia de las bibliotecas PDF genéricas que ofrecen una funcionalidad limitada de división, nuestra API y SDK dedicados ofrecen control granular sobre el proceso con una complejidad de implementación mínima, permitiéndote centrarte en la lógica principal de tu aplicación en lugar de la manipulación de PDF.

Características técnicas clave

Motor flexible de selección de páginas

El motor de selección acepta números de página separados por comas y rangos con guiones (por ejemplo, "1,3,5‑8,10"), dándote un control preciso sobre qué páginas extraer. Las páginas pueden especificarse en cualquier orden y aparecerán en ese mismo orden en los documentos resultantes. Cuando no se proporciona selección de páginas, el motor genera automáticamente archivos PDF independientes para cada página del documento original.

POST/pdf-split/v1
Content-Type:multipart/form-data
...
file: [binaryPDFdata]
pages:"1,3,5-8,10"

Arquitectura de procesamiento asíncrono

Nuestra API implementa un modelo de procesamiento asíncrono, devolviendo un ID de operación inmediatamente mientras el procesamiento continúa en segundo plano. Esta arquitectura evita tiempos de espera en documentos grandes y permite que tu aplicación maneje varias operaciones de división simultáneamente sin bloquear la interacción del usuario.

{
"id":"3fa85f64-5717-4562-b3fc-2c963f66afa6"
}

Status checking is handled through a separate endpoint:

GET/operation/v1/{operationId}/status

Tecnología de preservación de formato

El motor de división de PDF preserva el diseño, la orientación y la estructura originales en los archivos extraídos. Esto garantiza que el formato del texto, las imágenes, las fuentes y los elementos interactivos permanezcan intactos en los documentos resultantes, independientemente de la complejidad del contenido.

Etiquetado personalizado de salida

Controla la convención de nombres de tus documentos divididos con el parámetro labelStart. El formato de nombres sigue '{nombreDelDocumentoOriginal}.pdf - númeroEtiqueta', donde númeroEtiqueta comienza en el valor especificado (predeterminado 0) y aumenta en 1 para cada archivo subsiguiente. Esta función simplifica la organización y el seguimiento de documentos en flujos de trabajo con múltiples archivos.

POST /pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
pages: "1-5,10-15,20-25"
labelStart: 100

Soporte para documentos protegidos con contraseña

La API procesa PDFs protegidos mediante el parámetro password en la solicitud. Esto permite a tu aplicación manejar documentos protegidos sin que los usuarios tengan que eliminar la protección previamente, manteniendo la seguridad durante todo el flujo.

POST/pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
password: "document_password"
pages: "1-10"

Extracción automática de una sola página

Para flujos que requieren cada página como archivo independiente, la API puede dividir automáticamente cada página en su propio documento PDF. Esta capacidad elimina la necesidad de múltiples llamadas API cuando se procesan documentos que necesitan separarse por completo, como formularios o certificados dentro de un compendio.

Enfoques de implementación

Implementación SDK

Para aplicaciones de escritorio y servidores que requieran integración más profunda, nuestro SDK proporciona la misma funcionalidad con menor sobrecarga de red y acceso directo al sistema de archivos, ideal para procesamiento de documentos de alto volumen.

Integración RESTful API

Integra la funcionalidad de división de PDF directamente en tus aplicaciones con nuestra API RESTful. La estructura de endpoints y el formato multipart/form-data la hacen compatible con cualquier lenguaje o framework que soporte solicitudes HTTP.

Sample Python Implementation:

import requests

url = "https://api.example.com/pdf-split/v1"
files = {"file": open("document.pdf", "rb")}
data = {"pages": "1-5,10,15-20", "labelStart": 1}

response = requests.post(url, files=files, data=data)
operation = response.json()

# Check operation status
status_url = "https://api.example.com/operation/v1/{operation['id']}/status"
status_response = requests.get(status_url)

Cómo funciona

El proceso de división de PDF sigue tres pasos sencillos:

Seleccionar documento para procesar: Sube un PDF desde tu computadora, arrástralo y suéltalo o recupéralo desde almacenamiento en la nube. La API acepta archivos de hasta 10 MB y valida el formato antes de procesar.

Definir parámetros de extracción: Especifica las páginas a extraer mediante números individuales, rangos o división página por página. Las páginas pueden seleccionarse en cualquier orden, permitiendo reorganizar el contenido durante la extracción.

Procesar y recuperar resultados: Tras enviar la solicitud, la API procesa el documento según tus especificaciones y pone los archivos resultantes a disposición para descarga. La verificación de estado permite a tu aplicación monitorear el progreso y recuperar los resultados cuando el procesamiento haya finalizado.

Ventajas técnicas

Reducción de la gestión documental

Al extraer solo las páginas necesarias, la API reduce los requisitos de almacenamiento y simplifica la gestión de documentos, especialmente en aplicaciones que manejan grandes volúmenes de documentos estandarizados.

Extracción de contenido precisa

La sintaxis de selección de páginas permite obtener exactamente el contenido necesario para procesos empresariales específicos, eliminando la edición manual y reduciendo el riesgo de incluir información sensible en documentos compartidos.

Habilitación de automatización de flujos

El diseño de la API la hace ideal para flujos automatizados, ya sea procesando documentos entrantes, preparando paquetes personalizados o archivando secciones específicas; puede incorporarse en pipelines CI/CD y entornos sin servidor.

Consistencia multiplataforma

La misma funcionalidad está disponible tanto en la API como en el SDK, garantizando resultados consistentes independientemente de dónde se procese el documento, simplificando el desarrollo y las pruebas.

Capacidades PDF complementarias

Recombinación de documentos

Complementa las operaciones de división con nuestra funcionalidad de combinación (Merge) para recomponer documentos según sea necesario, permitiendo escenarios avanzados donde el contenido se separa y luego se recompone selectivamente.

Opciones de compresión

Para aplicaciones en las que el tamaño del archivo es crítico, se pueden aplicar nuestras capacidades de compresión antes o después de la división, disponibles en la API y el SDK para equilibrar tamaño y calidad.

Preguntas frecuentes técnicas

¿Cuál es el tamaño máximo de archivo admitido?

La API admite archivos PDF de hasta 10 MB. Para archivos mayores, considera usar el SDK o dividir la operación.

¿Cómo se manejan los archivos protegidos por contraseña?

Los archivos protegidos requieren que el parámetro password se incluya en la solicitud; la contraseña solo se usa para acceder al documento y no se almacena.

¿Puedo extraer páginas específicas?

Sí. El parámetro pages acepta números y rangos en cualquier orden, permitiendo una extracción precisa del contenido deseado.

¿Se verá afectada la calidad después de la extracción?

No. Nuestra tecnología de preservación de formato mantiene la calidad, el diseño y los elementos interactivos originales.

¿Cómo puedo monitorear el estado de las operaciones?

Cada operación devuelve un ID que puede usarse con el endpoint de estado para comprobar el progreso y descargar los resultados cuando estén listos.