Dela via


Näringsämne – PDF OCR

Omvandla skannade dokument och bilder till sökbara, redigerbara PDF-filer med OCR-åtgärder för näringsdokumentkonverterare. Extrahera text från PDF-filer sömlöst med hjälp av avancerad OCR-teknik (Optisk teckenigenkänning) för indexering, automatisering och innehållsanalys.

Den här anslutningsappen är tillgänglig i följande produkter och regioner:

Tjänster Class Regioner
Copilot Studio Premie Alla Power Automate-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Logiska appar Norm Alla Logic Apps-regioner utom följande:
     – Azure Government-regioner
     – Regioner i Azure Kina
     - US Department of Defense (DoD)
Power Apps Premie Alla Power Apps-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Power Automate Premie Alla Power Automate-regioner utom följande:
     - Amerikanska myndigheter (GCC)
     - Amerikanska myndigheter (GCC High)
     – China Cloud drivs av 21Vianet
     - US Department of Defense (DoD)
Kontakt
Namn Stöd för näringsämne (tidigare Muhimbi)
URL https://support.nutrient.io/hc/en-us/requests/new
E-postmeddelande support+low-code@nutrient.io
Metadata för anslutningsprogram
Utgivare Muhimbi handel som näringsämne
Webbplats https://www.nutrient.io/low-code/
Sekretesspolicy https://www.nutrient.io/legal/privacy/
Kategorier Samarbete; Innehåll och filer

Utföra OCR på bilder och skannade dokument

Använd Näringsdokumentkonverterare för att köra optisk teckenigenkänning (OCR) på bilder och skannade filer via ett REST-API eller ett lokalt serverbibliotek.

OCR-funktioner

  • Konvertera bilder, genomsökningar och fax till sökbara PDF-filer.
  • Skapa automatiserade dokumentarbetsflöden för textextrahering och PDF-sökbarhet.

Integreringsalternativ

Integrera OCR-funktioner med kodexempel på önskat språk:

Förutsättningar

Om du vill använda Näringsdokumentkonverterare behöver du ett kostnadsfritt konto eller utvärderingskonto . Se jämförelseguiden för att förstå skillnaderna mellan dessa kontotyper.

Komma igång

Följ stegen nedan för att börja använda anslutningsappen För näringsdokumentkonverterare:

Kända problem och begränsningar

Dokument som skyddas med IRM-, DRM-, RMS- eller AIP-lösningar kan inte bearbetas på grund av säkerhetsbegränsningar.

Kontakta vårt supportteam om du vill ha frågor eller hjälp.

Begränsningsgränser

Name Anrop Förnyelseperiod
API-anrop per anslutning 100 60 sekunder

Åtgärder

Extrahera text med OCR

Extrahera text från en PDF-fil med OCR

Konvertera till OCRed PDF

Utför OCR på ett befintligt PDF-dokument eller en bild för att skapa en sökbar PDF

Extrahera text med OCR

Extrahera text från en PDF-fil med OCR

Parametrar

Name Nyckel Obligatorisk Typ Description
Källfilnamn
source_file_name True string

Namnet på källfilen inklusive filnamnstillägget

Källfilinnehåll
source_file_content True byte

Innehållet i filen till OCR

Language
language enum

Language

X-koordinat
x string

X-koordinat (i Pts, 1/72 tum)

Y-koordinat
y string

Y-koordinat (i Pts, 1/72 tum)

Width
width string

Bredd på OCR-området (i Pts, 1/72 tum)

Höjd
height string

Höjden på OCR-området (i Pts, 1/72 tum)

Sidans nummer
page_number string

Sidnummer (lämna tomt till OCR alla sidor)

Performance
performance enum

Prestanda ()

Svartlista/vitlista
characters_option enum

Teckenalternativ

Tecken
characters string

Tecken som ska svartlistas eller vitlistas

Använda sidnumrering
paginate boolean

Paginera

Fel vid fel
fail_on_error boolean

Fel vid fel

Returer

Svarsdata för OCRText-åtgärd

Konvertera till OCRed PDF

Utför OCR på ett befintligt PDF-dokument eller en bild för att skapa en sökbar PDF

Parametrar

Name Nyckel Obligatorisk Typ Description
Källfilnamn
source_file_name True string

Namnet på källfilen inklusive filnamnstillägget

Källfilinnehåll
source_file_content True byte

Innehållet i filen till OCR

Language
language enum

Language

Performance
performance enum

Performance

Svartlista/vitlista
characters_option enum

Teckenalternativ

Tecken
characters string

Tecken som ska svartlistas eller vitlistas

Använda sidnumrering
paginate boolean

Paginera

Regioner
regions string

Begränsa området till OCR till ett eller flera specifika områden

Fel vid fel
fail_on_error boolean

Fel vid fel

Returer

Svarsdata för alla åtgärder

Definitioner

ocr_operation_response

Svarsdata för OCRText-åtgärd

Name Sökväg Typ Description
Uttext
out_text string

Extraherad OCRed-text i oformaterad text.

Basfilnamn
base_file_name string

Namnet på indatafilen utan tillägget.

Resultatkod
result_code enum

Åtgärdsresultatkod.

Resultatinformation
result_details string

Information om åtgärdsresultat.

operation_response

Svarsdata för alla åtgärder

Name Sökväg Typ Description
Bearbetat filinnehåll
processed_file_content byte

Fil som genereras av Muhimbi-konverteraren.

Basfilnamn
base_file_name string

Namnet på indatafilen utan tillägget.

Resultatkod
result_code enum

Åtgärdsresultatkod.

Resultatinformation
result_details string

Information om åtgärdsresultat.