Funzionalità API e SDK di suddivisione PDF

API e SDK per la suddivisione dei PDF

Dividi i documenti con controllo di precisione

Trasforma i tuoi flussi di lavoro sui documenti con una suddivisione PDF di precisione

L’API e l’SDK Split PDF offrono agli sviluppatori potenti capacità per dividere i documenti PDF in file più piccoli in base a pagine o intervalli di pagine specifici. Questa tecnologia consente l’estrazione precisa di sezioni del documento, che si tratti di separare capitoli, rimuovere contenuti riservati o creare file più gestibili da distribuire.

Progettata per l’integrazione in applicazioni desktop, servizi web e flussi di lavoro documentali automatizzati, la nostra soluzione Split PDF mantiene l’integrità del documento garantendo al contempo il pieno controllo sulla selezione e l’organizzazione delle pagine. Il modello di elaborazione asincrona dell’API gestisce in modo efficiente documenti fino a 10 MB, rendendola adatta sia all’elaborazione di singoli documenti sia a operazioni batch ad alto volume.

A differenza delle librerie PDF generiche, che offrono funzionalità di suddivisione limitate, la nostra API e il nostro SDK dedicati forniscono un controllo granulare sul processo con una complessità di implementazione minima, permettendoti di concentrarti sulla logica principale della tua applicazione anziché sui dettagli di manipolazione PDF.

Caratteristiche tecniche principali

Motore di selezione pagine flessibile

Il motore di selezione pagine dell’API accetta numeri di pagina separati da virgola e intervalli uniti da trattino (es. “1,3,5-8,10”), offrendo un controllo preciso su quali pagine estrarre. Le pagine possono essere indicate in qualsiasi ordine e verranno restituite nello stesso ordine nei documenti elaborati. Se non viene specificata alcuna selezione, il motore genera automaticamente file PDF separati per ogni pagina del documento originale.

POST/pdf-split/v1
Content-Type:multipart/form-data
...
file: [binaryPDFdata]
pages:"1,3,5-8,10"

Architettura di elaborazione asincrona

La nostra API implementa un modello di elaborazione asincrona, restituendo subito un ID operazione mentre l’elaborazione continua in background. Questa architettura evita timeout su documenti di grandi dimensioni e consente alla tua applicazione di gestire più operazioni di suddivisione contemporaneamente senza bloccare l’interfaccia utente.

{
"id":"3fa85f64-5717-4562-b3fc-2c963f66afa6"
}

Status checking is handled through a separate endpoint:

GET/operation/v1/{operationId}/status

Tecnologia di preservazione del formato

Il motore Split PDF mantiene il layout, l’orientamento e la struttura originali nei file estratti. Ciò garantisce che formattazione, immagini, font ed elementi interattivi rimangano intatti nei documenti risultanti, indipendentemente dalla complessità del contenuto.

Etichettatura personalizzata dell’output

Controlla il nome dei documenti suddivisi con il parametro labelStart. Il formato di denominazione segue '{nomeDocumentoOriginale}.pdf - labelNumero', dove labelNumero parte dal valore specificato (predefinito 0) e incrementa di 1 per ciascun documento successivo. Questa funzione semplifica l’organizzazione e il tracciamento dei documenti in flussi multi‑file.

POST /pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
pages: "1-5,10-15,20-25"
labelStart: 100

Supporto a PDF protetti da password

L’API gestisce i PDF protetti da password accettando il parametro password nella richiesta. Ciò permette alla tua applicazione di elaborare documenti protetti senza richiedere agli utenti di rimuovere la protezione in anticipo, mantenendo la sicurezza del documento durante l’intero flusso.

POST/pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
password: "document_password"
pages: "1-10"

Estrazione automatica pagina per pagina

Per flussi che richiedono file separati per ogni pagina, l’API può dividere automaticamente ciascuna pagina in un documento PDF distinto. Questa capacità elimina la necessità di più chiamate API quando si processano documenti che devono essere completamente separati, ad esempio nel caso di estrazione di moduli o certificati da una raccolta.

Approcci di implementazione

Implementazione SDK

Per applicazioni desktop e server che richiedono un’integrazione più profonda, il nostro SDK fornisce la stessa funzionalità di suddivisione con l’overhead di rete minimo, ideale per l’elaborazione di grandi volumi di documenti.

Integrazione API RESTful

Integra la funzionalità di suddivisione PDF direttamente nelle tue applicazioni tramite la nostra API REST. La struttura degli endpoint e il formato multipart/form‑data rendono l’integrazione compatibile con qualsiasi linguaggio o framework che supporti le richieste HTTP.

Sample Python Implementation:

import requests

url = "https://api.example.com/pdf-split/v1"
files = {"file": open("document.pdf", "rb")}
data = {"pages": "1-5,10,15-20", "labelStart": 1}

response = requests.post(url, files=files, data=data)
operation = response.json()

# Check operation status
status_url = "https://api.example.com/operation/v1/{operation['id']}/status"
status_response = requests.get(status_url)

Come funziona

Il processo di suddivisione PDF si svolge in tre semplici passaggi:

Selezione del documento per l’elaborazione: Carica un PDF dal tuo computer, trascinalo nella finestra o recuperalo da uno storage cloud. L’API accetta file fino a 10 MB e ne convalida il formato prima dell’elaborazione.

Definizione dei parametri di estrazione: Specifica le pagine da estrarre utilizzando numeri singoli, intervalli o la suddivisione automatica pagina per pagina. Le pagine possono essere selezionate in qualsiasi ordine, permettendoti di riarrangiare i contenuti durante l’estrazione.

Elaborazione e recupero dei risultati: Dopo l’invio della richiesta, l’API elabora il documento in base alle tue specifiche e rende disponibili i file risultanti per il download. Il controllo dello stato consente alla tua applicazione di monitorare l’avanzamento e recuperare i risultati al termine.

Vantaggi tecnici

Riduzione dell’overhead di gestione documentale

Estraendo solo le pagine necessarie, l’API Split PDF riduce i requisiti di archiviazione e semplifica la gestione dei documenti, particolarmente utile per applicazioni che trattano grandi volumi di documenti standardizzati.

Estrazione di contenuti precisa

La sintassi di selezione delle pagine permette di estrarre esattamente il contenuto necessario ai processi aziendali, eliminando l’editing manuale e riducendo il rischio di inclusione di informazioni sensibili.

Automazione dei flussi di lavoro

Il design dell’API la rende ideale per l’integrazione in flussi documentali automatizzati. Che si tratti di processare documenti in ingresso, preparare pacchetti personalizzati o archiviare sezioni specifiche, la funzionalità di suddivisione può essere incorporata in pipeline CI/CD e ambienti serverless.

Coerenza cross‑platform

La stessa funzionalità di suddivisione è disponibile sia tramite API sia tramite SDK, garantendo risultati uniformi indipendentemente dall’ambiente di elaborazione. Questa uniformità semplifica sviluppo e test su piattaforme diverse.

Funzionalità PDF complementari

Ricombinazione dei documenti

Completa le operazioni di suddivisione con la nostra funzionalità di fusione PDF per ricombinare i documenti quando necessario. Questo flusso bidirezionale consente scenari avanzati di composizione documentale in cui il contenuto viene prima separato e poi selettivamente ricombinato in nuovi documenti.

Opzioni di compressione

Per le applicazioni in cui la dimensione del file è critica, le nostre funzionalità di compressione PDF possono essere applicate prima o dopo le operazioni di suddivisione. Opzioni avanzate di compressione sono disponibili sia nell’API sia nell’SDK, dandoti il pieno controllo sull’equilibrio tra dimensioni e qualità.

FAQ Tecnica

Qual è la dimensione massima dei file supportata?

L’API supporta attualmente PDF fino a 10 MB. Per file più grandi, valuta l’uso dell’SDK o la suddivisione del processo in più operazioni.

Come vengono gestiti i file protetti da password?

I file protetti richiedono l’inclusione del parametro password nella richiesta. La password serve solo per l’accesso al documento e non viene memorizzata.

Posso estrarre pagine specifiche dal mio PDF?

Sì, il parametro pages accetta numeri di pagina e intervalli in qualsiasi ordine, consentendo un’estrazione precisa dei contenuti desiderati.

La qualità delle pagine PDF verrà alterata dopo l’estrazione?

No, la nostra tecnologia di preservazione del formato mantiene la qualità, il layout e gli elementi interattivi originali delle pagine estratte.

Come posso monitorare lo stato delle operazioni di suddivisione?

Ogni operazione restituisce un ID che può essere utilizzato con l’endpoint di stato operazione per verificarne l’avanzamento e recuperare i risultati al completamento.