Fonctionnalité API & SDK de fractionnement de PDF

API et SDK de fractionnement de PDF

Divisez vos documents avec un contrôle précis

Transformez vos flux de documents grâce au fractionnement précis de PDF

L’API et le SDK de fractionnement de PDF offrent aux développeurs des fonctionnalités puissantes pour diviser des documents PDF en plusieurs fichiers plus petits, selon des pages ou des plages de pages spécifiques. Cette technologie permet l’extraction précise de sections de documents, que vous ayez besoin de séparer des chapitres, de retirer du contenu confidentiel ou de créer des fichiers plus faciles à distribuer.

Conçue pour être intégrée dans des applications de bureau, des services Web et des flux de documents automatisés, notre solution de fractionnement de PDF maintient l’intégrité des documents tout en vous laissant un contrôle total sur la sélection et l’organisation des pages. Le modèle de traitement asynchrone de l’API gère efficacement des documents jusqu’à 10 Mo, ce qui la rend adaptée au traitement de documents individuels comme aux opérations par lot à fort volume.

Contrairement aux bibliothèques PDF génériques qui offrent une fonctionnalité de fractionnement limitée, notre API et notre SDK dédiés fournissent un contrôle granulaire sur le processus avec une complexité d’implémentation minimale, vous permettant de vous concentrer sur votre logique applicative plutôt que sur la manipulation de PDF.

Caractéristiques techniques clés

Moteur flexible de sélection de pages

Le moteur de sélection de pages de l’API accepte des numéros de pages séparés par des virgules ainsi que des plages hyphénées (ex. « 1,3,5-8,10 »), vous offrant un contrôle précis sur les pages à extraire. Les pages peuvent être spécifiées dans n’importe quel ordre et apparaîtront dans cet ordre dans les documents traités. Lorsqu’aucune sélection n’est fournie, le moteur génère automatiquement un fichier PDF distinct pour chaque page.

POST/pdf-split/v1
Content-Type:multipart/form-data
...
file: [binaryPDFdata]
pages:"1,3,5-8,10"

Architecture de traitement asynchrone

Notre API implémente un modèle de traitement asynchrone, renvoyant immédiatement un ID d’opération tandis que le traitement se poursuit en arrière-plan. Cette architecture évite les timeouts sur les documents volumineux et permet à votre application de gérer plusieurs opérations de fractionnement simultanément sans bloquer l’interaction utilisateur.

{
"id":"3fa85f64-5717-4562-b3fc-2c963f66afa6"
}

Status checking is handled through a separate endpoint:

GET/operation/v1/{operationId}/status

Technologie de préservation du format

Le moteur de fractionnement préserve la mise en page, l’orientation et la structure originales dans les fichiers extraits. Les polices, images, éléments interactifs et la mise en forme du texte restent intacts, garantissant une fidélité documentaire quel que soit le niveau de complexité du contenu.

Étiquetage personnalisé des sorties

Contrôlez la convention de nommage de vos documents fractionnés grâce au paramètre labelStart. Le format de nommage suit '{nomDuDocumentOriginal}.pdf - numéroDeLabel ', où numéroDeLabel démarre à la valeur spécifiée (par défaut 0) et s’incrémente de 1 pour chaque document suivant. Cette fonctionnalité simplifie l’organisation et le suivi dans les flux multi‑fichiers.

POST /pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
pages: "1-5,10-15,20-25"
labelStart: 100

Prise en charge des documents protégés par mot de passe

L’API gère les PDF protégés en acceptant un paramètre password dans la requête. Votre application peut ainsi traiter des documents sécurisés sans que les utilisateurs aient à retirer la protection en amont, garantissant ainsi la sécurité tout au long du flux.

POST/pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
password: "document_password"
pages: "1-10"

Extraction automatique page par page

Pour les flux nécessitant chaque page dans un fichier distinct, l’API peut automatiquement créer un document PDF par page. Cette capacité élimine le besoin d’appels API multiples lorsque le document doit être entièrement séparé, par exemple lors de l’extraction de formulaires ou de certificats.

Approches de mise en œuvre

Implémentation SDK

Pour les applications desktop et serveur nécessitant une intégration plus poussée, notre SDK fournit les mêmes capacités de fractionnement avec un minimum de surcharge réseau, idéal pour les scénarios de traitement de documents à gros volume.

Intégration API REST

Intégrez directement la fonctionnalité de fractionnement de PDF dans vos applications via notre API RESTful. La structure d’endpoint simple et le format multipart/form-data rendent l’intégration compatible avec tout langage ou framework prenant en charge les requêtes HTTP.

Sample Python Implementation:

import requests

url = "https://api.example.com/pdf-split/v1"
files = {"file": open("document.pdf", "rb")}
data = {"pages": "1-5,10,15-20", "labelStart": 1}

response = requests.post(url, files=files, data=data)
operation = response.json()

# Check operation status
status_url = "https://api.example.com/operation/v1/{operation['id']}/status"
status_response = requests.get(status_url)

Comment ça fonctionne

Le processus de fractionnement PDF se déroule en trois étapes simples :

Sélectionner le document à traiter : Téléversez un PDF depuis votre ordinateur, utilisez le glisser‑déposer ou récupérez-le depuis un stockage cloud. L’API accepte les fichiers jusqu’à 10 Mo et vérifie le format.

Définir les paramètres d’extraction des pages : Spécifiez les pages à extraire à l’aide de numéros seuls, de plages ou via le mode page par page automatique. Les pages peuvent être sélectionnées dans n’importe quel ordre.

Traiter et récupérer les résultats : Une fois la requête soumise, l’API traite le document selon vos spécifications et met les fichiers résultants à disposition. Vous pouvez suivre la progression via l’endpoint de statut et récupérer les fichiers dès que l’opération est terminée.

Avantages techniques

Réduction de la charge de gestion documentaire

En extrayant uniquement les pages nécessaires, l’API réduit les besoins de stockage et simplifie la gestion documentaire, particulièrement utile pour les applications qui traitent de grands volumes de documents standardisés.

Extraction de contenu précise

La syntaxe de sélection de pages permet d’extraire exactement le contenu nécessaire, éliminant l’édition manuelle tout en réduisant le risque de divulguer des informations sensibles.

Activation de l’automatisation des flux de travail

La conception de l’API la rend idéale pour une intégration dans des workflows automatisés, que ce soit pour traiter des documents entrants, préparer des packages personnalisés ou archiver des sections spécifiques.

Cohérence multiplateforme

Les mêmes capacités de fractionnement sont disponibles via l’API et le SDK, garantissant des résultats cohérents quel que soit l’environnement de déploiement.

Capacités PDF complémentaires

Recombinaison de documents

Combinez les opérations de fractionnement avec notre fonctionnalité de fusion pour recomposer des documents selon vos besoins. Ce flux bidirectionnel permet des scénarios avancés où le contenu est d’abord séparé puis recombiné de façon sélective.

Options de compression

Pour les applications où la taille de fichier est critique, nos capacités de compression PDF peuvent être appliquées avant ou après le fractionnement, vous donnant un contrôle total sur l’équilibre entre taille et qualité.

FAQ technique

Quelle est la taille maximale de fichier prise en charge ?

L’API prend actuellement en charge les fichiers PDF jusqu’à 10 Mo. Pour les fichiers plus volumineux, utilisez le SDK ou divisez le traitement en plusieurs opérations.

Comment sont gérés les fichiers protégés par mot de passe ?

Vous devez fournir le paramètre password dans la requête. Le mot de passe est utilisé uniquement pour ouvrir le document et n’est pas stocké.

Puis‑je extraire des pages spécifiques ?

Oui. Le paramètre pages accepte des numéros et des plages dans n’importe quel ordre, offrant une extraction précise.

La qualité des pages sera‑t‑elle affectée après extraction ?

Non. La technologie de préservation du format conserve la qualité, la mise en page et les éléments interactifs d’origine.

Comment suivre le statut des opérations ?

Chaque opération renvoie un ID à utiliser avec l’endpoint de statut pour surveiller la progression et récupérer les résultats.