PDF OCR API & SDK
Gescannte Dokumente in durchsuchbare, editierbare PDFs verwandelnStatische Dokumente in dynamische, recherchierbare Assets verwandeln
Unsere PDF OCR API und das SDK geben Entwicklern leistungsfähige optische Zeichenerkennung (OCR) an die Hand, um gescannte Dokumente und Bilder in vollständig durchsuchbare und editierbare PDFs zu konvertieren. Die Technologie erkennt automatisch Text in PDF‑Bildern und fügt eine durchsuchbare Textebene hinzu, sodass die Dokumente indexierbar, auswählbar und barrierefrei werden.
Für technische Teams, die sowohl hohe Performance als auch Präzision verlangen, verarbeitet unsere OCR‑Lösung große PDF‑Volumina mit außergewöhnlicher Genauigkeit und bewahrt zugleich Layout und Formatierung. Ob Desktop‑Applikationen, automatisierte Dokument‑Workflows oder Enterprise‑DMS – API und SDK liefern konsistente Ergebnisse auf allen Plattformen bei minimalem Integrationsaufwand.
Anders als generische Dokumenten‑Tools ist unsere OCR‑Technologie speziell auf PDF ausgerichtet. Sie beherrscht komplexe Layouts, unterstützt mehrere Sprachen und bietet Batch‑Verarbeitung – all das reduziert Entwicklungsaufwand und verbessert das Nutzererlebnis.
Flexible Bereitstellungsoptionen
Unsere Lösung bietet sowohl cloudbasierten API-Zugriff als auch eine lokale SDK-Implementierung. Verarbeiten Sie Dokumente über unsere leistungsstarke Cloud-Infrastruktur mit RESTful-API-Aufrufen oder integrieren Sie das SDK direkt in Ihre Anwendung zur Offline-Verarbeitung. Dieses Dual-Deployment-Modell stellt sicher, dass Sie die OCR-Funktionalität unabhängig von Ihren Netzwerkbeschränkungen oder Sicherheitsanforderungen implementieren können.
curl -X POST https://v2.convertapi.com/convert/pdf/to/ocr \
-H "Authorization: Bearer api_token" \
-F "File=@/path/to/my_file.pdf" \
-F "OcrLanguage=en"
Technische Implementierungsoptionen
Unsere REST-API bietet eine einfache Möglichkeit, jeder Anwendung, die HTTP-Anfragen stellen kann, OCR-Funktionen hinzuzufügen. Der Implementierungsprozess folgt drei einfachen Schritten:
Authentifizierung: Melden Sie sich für ein Konto an und authentifizieren Sie sich mit Ihrem geheimen Schlüssel oder API-Token
Anforderungskonfiguration: Senden Sie eine POST-Anfrage an https://v2.convertapi.com/convert/pdf/to/ocr mit Ihrer Datei und Ihren Parametern
Prozessergebnisse: Empfangen Sie das verarbeitete Dokument mit hinzugefügter durchsuchbarer Textebene
-
-
-
-
-
Die API unterstützt die synchrone Verarbeitung für sofortige Ergebnisse und die asynchrone Verarbeitung für größere Dokumente und gibt Entwicklern die vollständige Kontrolle über die Implementierung basierend auf ihren spezifischen Anforderungen.
Für Anwendungen, die eine Offline-Verarbeitung oder eine tiefere Integration erfordern, bietet unser SDK native Bibliotheken für alle wichtigen Programmiersprachen:
.NET C#: Vollständiges Framework und.NET Core-Unterstützung
PHP: Kompatibel mit PHP 5.6+ und allen wichtigen Frameworks
Java: Funktioniert mit Java 8+ auf allen Plattformen
Python: Python 2.7+ und 3.x kompatibel
Node.js: Serverseitige JavaScript-Implementierung
JavaScript: Browserbasierte Implementierung
Ruby: Ruby 2.0+-Unterstützung
Go: Moderne Go-Implementierung
Jedes SDK folgt sprachspezifischen Best Practices und behält gleichzeitig eine konsistente Funktionalität bei, was die Implementierung von OCR über heterogene Technologie-Stacks hinweg erleichtert.
Erste Schritte mit PDF OCR
Konto erstellen: Melden Sie sich an, um auf die Dokumentenverarbeitungsvorgänge zuzugreifen
Integrationsmethode wählen: API für Cloud-Verarbeitung oder SDK für lokale Implementierung auswählen
Abhängigkeiten installieren: Fügen Sie die entsprechende Bibliothek für Ihre Entwicklungsumgebung hinzu
Authentifizierung implementieren: Konfigurieren Sie Ihre Anwendung mit Ihren API-Anmeldeinformationen
Dokumente verarbeiten: Beginnen Sie mit der Konvertierung gescannter Dokumente in durchsuchbare PDFs