Delen via


Voedingsstof - PDF OCR

Transformeer gescande documenten en afbeeldingen in doorzoekbare, bewerkbare PDF-bestanden met OCR-acties van het Voedingsdocumentconversieprogramma. U kunt tekst naadloos extraheren uit PDF's met behulp van geavanceerde OCR-technologie (Optical Character Recognition) voor indexering, automatisering en inhoudsanalyse.

Deze connector is beschikbaar in de volgende producten en regio's:

Dienst Class Regions
Copilot Studio Premium Alle Power Automate-regio's , met uitzondering van het volgende:
     - Amerikaanse overheid (GCC)
     - Amerikaanse overheid (GCC High)
     - China Cloud beheerd door 21Vianet
     - Us Department of Defense (DoD)
Logic-apps Standaard Alle Logic Apps-regio's , met uitzondering van het volgende:
     - Azure Government-regio's
     - Azure China-regio's
     - Us Department of Defense (DoD)
Power Apps Premium Alle Power Apps-regio's , met uitzondering van het volgende:
     - Amerikaanse overheid (GCC)
     - Amerikaanse overheid (GCC High)
     - China Cloud beheerd door 21Vianet
     - Us Department of Defense (DoD)
Power Automate Premium Alle Power Automate-regio's , met uitzondering van het volgende:
     - Amerikaanse overheid (GCC)
     - Amerikaanse overheid (GCC High)
     - China Cloud beheerd door 21Vianet
     - Us Department of Defense (DoD)
Contactpersoon
Naam Ondersteuning voor voedingsstoffen (voorheen Muhimbi)
URL https://support.nutrient.io/hc/en-us/requests/new
E-mailen support+low-code@nutrient.io
Connector-metagegevens
Uitgever Muhimbi handel als voedingsstof
Webpagina https://www.nutrient.io/low-code/
Privacybeleid https://www.nutrient.io/legal/privacy/
Categorieën Samenwerking; Inhoud en bestanden

OCR uitvoeren op afbeeldingen en gescande documenten

Gebruik Voedingsdocumentconversieprogramma om OCR (Optical Character Recognition) uit te voeren op afbeeldingen en gescande bestanden via een REST API of een zelf-hostende serverbibliotheek.

OCR-mogelijkheden

  • Converteer afbeeldingen, scans en faxen naar doorzoekbare PDF-bestanden.
  • Bouw geautomatiseerde documentwerkstromen voor tekstextractie en PDF-doorzoekbaarheid.

Integratieopties

OCR-functionaliteit integreren met codevoorbeelden in uw voorkeurstaal:

Vereiste voorwaarden

U hebt een gratis account of proefaccount nodig om Het Conversieprogramma voor voedingsdocument te gebruiken. Raadpleeg de vergelijkingshandleiding om inzicht te hebben in de verschillen tussen deze accounttypen.

Aan de slag

Volg de onderstaande stappen om te beginnen met het gebruik van de Connector voor het Voedingsdocumentconversieprogramma:

Bekende problemen en beperkingen

Documenten die zijn beveiligd met IRM-, DRM-, RMS- of AIP-oplossingen kunnen niet worden verwerkt vanwege beveiligingsbeperkingen.

Neem voor vragen of hulp contact op met ons ondersteuningsteam.

Beperkingslimieten

Name Aanroepen Verlengingsperiode
API-aanroepen per verbinding 100 60 seconden

Acties

Converteren naar OCRed PDF

OCR uitvoeren op een bestaand PDF-document of een afbeelding om een doorzoekbare PDF te maken

Tekst extraheren met OCR

Tekst extraheren uit een PDF-bestand met OCR

Converteren naar OCRed PDF

OCR uitvoeren op een bestaand PDF-document of een afbeelding om een doorzoekbare PDF te maken

Parameters

Name Sleutel Vereist Type Description
Naam van bronbestand
source_file_name True string

Naam van het bronbestand inclusief extensie

Inhoud van bronbestand
source_file_content True byte

Inhoud van het bestand naar OCR

Language
language enum

Language

Performance
performance enum

Performance

Zwarte lijst/whitelist
characters_option enum

Optie Tekens

Karakters
characters string

Tekens voor zwarte lijst of whitelist

Paginering gebruiken
paginate boolean

Paginate

Regions
regions string

Het gebied beperken tot OCR tot een of meer specifieke gebieden

Fout bij mislukt
fail_on_error boolean

Fout bij mislukt

Retouren

Antwoordgegevens voor alle bewerkingen

Tekst extraheren met OCR

Tekst extraheren uit een PDF-bestand met OCR

Parameters

Name Sleutel Vereist Type Description
Naam van bronbestand
source_file_name True string

Naam van het bronbestand inclusief extensie

Inhoud van bronbestand
source_file_content True byte

Inhoud van het bestand naar OCR

Language
language enum

Language

X-coördinaat
x string

X-coördinaat (in Pts, 1/72 van een inch)

Y-coördinaat
y string

Y-coördinaat (in Pts, 1/72 van een inch)

Breedte
width string

Breedte van het OCR-gebied (in Pts, 1/72 van een inch)

Hoogte
height string

Hoogte van het OCR-gebied (in Pts, 1/72 van een inch)

Paginanummer
page_number string

Paginanummer (leeg laten voor OCR alle pagina's)

Performance
performance enum

Prestaties ()

Zwarte lijst/whitelist
characters_option enum

Optie Tekens

Karakters
characters string

Tekens voor zwarte lijst of whitelist

Paginering gebruiken
paginate boolean

Paginate

Fout bij mislukt
fail_on_error boolean

Fout bij mislukt

Retouren

Antwoordgegevens voor OCRText-bewerking

Definities

ocr_operation_response

Antwoordgegevens voor OCRText-bewerking

Name Pad Type Description
Tekst uit
out_text string

Geëxtraheerde OCRed-tekst in tekst zonder opmaak.

Basisbestandsnaam
base_file_name string

Naam van het invoerbestand zonder de extensie.

Resultaatcode
result_code enum

Resultaatcode van bewerking.

Resultaatdetails
result_details string

Details van bewerkingsresultaat.

operation_response

Antwoordgegevens voor alle bewerkingen

Name Pad Type Description
Verwerkte bestandsinhoud
processed_file_content byte

Bestand gegenereerd door het Muhimbi-conversieprogramma.

Basisbestandsnaam
base_file_name string

Naam van het invoerbestand zonder de extensie.

Resultaatcode
result_code enum

Resultaatcode van bewerking.

Resultaatdetails
result_details string

Details van bewerkingsresultaat.