Funcionalidade de Divisão de PDF

API e SDK para Dividir PDFs

Separe Documentos com Controlo de Precisão

Transforme os Seus Fluxos de Trabalho de Documentos com Divisão de PDF de Precisão

A API e o SDK de Divisão de PDF oferecem aos programadores capacidades robustas para dividir documentos PDF em vários ficheiros mais pequenos com base em páginas ou intervalos de páginas específicos. Esta tecnologia permite extrair secções do documento com precisão, seja para separar capítulos, remover conteúdo confidencial ou criar ficheiros mais fáceis de distribuir.

Concebida para integração em aplicações de desktop, serviços web e fluxos de trabalho de documentos automatizados, a nossa solução de Divisão de PDF mantém a integridade do documento enquanto lhe dá controlo total sobre a seleção e organização das páginas. O modelo de processamento assíncrono da API processa documentos até 10 MB de forma eficiente, sendo adequado tanto para processamento de documentos individuais como para operações em lote de alto volume.

Ao contrário de bibliotecas PDF genéricas que oferecem funcionalidades de divisão limitadas, a nossa API e SDK dedicados proporcionam controlo granular sobre o processo de divisão com complexidade de implementação mínima, permitindo‑lhe concentrar‑se na lógica principal da sua aplicação em vez dos pormenores de manipulação de PDFs.

Principais Características Técnicas

Motor de Seleção de Páginas Flexível

O motor de seleção de páginas da API aceita números de página separados por vírgulas e intervalos com hífen (ex.: “1,3,5-8,10”), oferecendo-lhe controlo preciso sobre as páginas a extrair. As páginas podem ser indicadas em qualquer ordem e surgirão nessa ordem nos documentos processados. Quando não é fornecida seleção, o motor cria automaticamente ficheiros PDF separados para cada página do documento original.

POST/pdf-split/v1
Content-Type:multipart/form-data
...
file: [binaryPDFdata]
pages:"1,3,5-8,10"

Arquitetura de Processamento Assíncrono

A nossa API implementa um modelo de processamento assíncrono, devolvendo imediatamente um ID de operação enquanto o processamento continua em segundo plano. Esta arquitetura evita tempos limite em documentos maiores e permite à sua aplicação executar várias operações de divisão em simultâneo, sem bloquear a interação do utilizador.

{
"id":"3fa85f64-5717-4562-b3fc-2c963f66afa6"
}

Status checking is handled through a separate endpoint:

GET/operation/v1/{operationId}/status

Tecnologia de Preservação de Formato

O motor de Divisão de PDF preserva o esquema, orientação e estrutura originais do documento nos ficheiros extraídos. Isto garante que a formatação do texto, imagens, tipos de letra e elementos interativos permanecem intactos nos documentos resultantes. A nossa tecnologia de preservação de formato mantém a fidelidade do documento independentemente da complexidade do conteúdo.

Rotulagem Personalizada de Saída

Controle a convenção de nomenclatura dos seus documentos divididos com o parâmetro labelStart. O formato de nome segue '{nomeDoDocumentoOriginal}.pdf - númeroDeRótulo', onde númeroDeRótulo começa no valor especificado (por defeito 0) e incrementa 1 para cada documento subsequente. Esta funcionalidade simplifica a organização e o rastreio de documentos em fluxos de trabalho com vários ficheiros.

POST /pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
pages: "1-5,10-15,20-25"
labelStart: 100

Suporte a Documentos Protegidos por Palavra-passe

A API lida com PDFs protegidos por palavra‑passe aceitando um parâmetro password no pedido. Isto permite que a sua aplicação processe documentos protegidos sem exigir que os utilizadores removam a proteção antecipadamente, mantendo a segurança do documento em todo o fluxo de trabalho.

POST/pdf-split/v1
Content-Type: multipart/form-data

file: [binaryPDFdata]
password: "document_password"
pages: "1-10"

Extração Automática de Página Única

Para fluxos de trabalho que requerem páginas individuais como ficheiros separados, a API pode dividir automaticamente cada página num documento PDF próprio. Esta capacidade elimina a necessidade de múltiplos pedidos API ao processar documentos que necessitam de ser completamente separados, como ao extrair formulários ou certificados de uma compilação.

Abordagens de Implementação

Implementação do SDK

Para aplicações de desktop e servidor que requerem integração mais profunda, o nosso SDK fornece funcionalidade nativa de divisão de PDF com as mesmas capacidades da API. O SDK minimiza a sobrecarga de rede e permite acesso direto ao sistema de ficheiros, sendo ideal para cenários de processamento de documentos em grande volume.

Integração da API RESTful

Integre a funcionalidade de divisão de PDF diretamente nas suas aplicações com a nossa API RESTful. A estrutura simples de endpoints e o formato de pedido multipart/form-data tornam‑na compatível com qualquer linguagem ou framework que suporte pedidos HTTP.

Sample Python Implementation:

import requests

url = "https://api.example.com/pdf-split/v1"
files = {"file": open("document.pdf", "rb")}
data = {"pages": "1-5,10,15-20", "labelStart": 1}

response = requests.post(url, files=files, data=data)
operation = response.json()

# Check operation status
status_url = "https://api.example.com/operation/v1/{operation['id']}/status"
status_response = requests.get(status_url)

Como Funciona

O processo de Divisão de PDF segue três passos simples:

Selecionar o Documento para Processamento – Carregue um PDF a partir do seu computador, utilize a funcionalidade de arrastar e largar ou recupere a partir de armazenamento na nuvem. A API aceita ficheiros até 10 MB e valida o formato do documento antes do processamento.

Definir Parâmetros de Extração de Páginas – Especifique quais as páginas a extrair usando números individuais, intervalos ou divisão página a página automática. As páginas podem ser selecionadas por qualquer ordem, permitindo reorganizar o conteúdo durante a extração.

Processar e Obter Resultados – Após submeter o pedido, a API processa o documento de acordo com as suas especificações e disponibiliza os ficheiros resultantes para download. A verificação de estado permite que a sua aplicação monitorize o progresso e recupere os resultados quando o processamento estiver concluído.

Vantagens Técnicas

Redução da Sobrecarga de Gestão de Documentos

Ao extrair apenas as páginas necessárias de documentos maiores, a API de Divisão de PDF reduz os requisitos de armazenamento e simplifica a gestão de documentos. Isto é particularmente valioso para aplicações que lidam com grandes volumes de documentos padronizados em que apenas certas secções são relevantes para diferentes fluxos de trabalho.

Extração de Conteúdo Precisa

A sintaxe de seleção de páginas permite extrair exatamente o conteúdo necessário para processos de negócio específicos. Esta precisão elimina a edição manual de documentos e reduz o risco de incluir informação sensível em documentos partilhados.

Capacitação de Automação de Fluxos de Trabalho

O design da API torna‑a ideal para integração em fluxos de trabalho de documentos automatizados. Quer esteja a processar documentos recebidos, preparar pacotes de documentos personalizados ou arquivar secções específicas, a funcionalidade de Divisão de PDF pode ser incorporada em pipelines CI/CD e ambientes serverless.

Consistência entre Plataformas

A mesma funcionalidade de divisão está disponível tanto nas implementações via API como SDK, garantindo resultados consistentes independentemente do local onde o processamento ocorre. Esta uniformidade simplifica o desenvolvimento e os testes em diferentes ambientes de implementação.

Capacidades de PDF Complementares

Recombinação de Documentos

Complete as operações de divisão com a nossa funcionalidade de Fusão de PDF para recombinar documentos conforme necessário. Este fluxo de trabalho bidirecional permite cenários avançados de composição de documentos, nos quais o conteúdo é primeiro separado e depois recombinado seletivamente em novos documentos.

Opções de Compressão

Para aplicações em que o tamanho do ficheiro é crítico, as nossas capacidades de compressão de PDF podem ser aplicadas antes ou depois das operações de divisão. Estão disponíveis opções avançadas de compressão tanto via API como SDK, oferecendo controlo total sobre o equilíbrio entre tamanho de ficheiro e qualidade do documento.

FAQ Técnica

Qual é o tamanho máximo de ficheiro suportado?

A API suporta atualmente ficheiros PDF até 10 MB. Para ficheiros maiores, considere usar a implementação com SDK ou dividir o processo em várias operações.

Como são tratados os ficheiros protegidos por palavra‑passe?

Os ficheiros protegidos por palavra‑passe requerem que o parâmetro password seja incluído no pedido da API. A palavra‑passe é usada apenas para aceder ao documento e não é armazenada.

Posso extrair páginas específicas do meu PDF?

Sim, o parâmetro pages aceita números de página individuais e intervalos em qualquer ordem, permitindo a extração precisa do conteúdo que precisar.

A qualidade das páginas do meu PDF será afetada após a extração?

Não. A nossa tecnologia de preservação de formato mantém a qualidade, o layout e os elementos interativos originais das páginas extraídas.

Como posso monitorizar o estado das operações de divisão?

Cada operação devolve um ID que pode ser usado com o endpoint de estado da operação para verificar o progresso e obter os resultados quando o processamento estiver concluído.