Sdílet prostřednictvím


Živiny - PDF OCR

Transformujte naskenované dokumenty a obrázky na prohledávatelné a upravitelné soubory PDF s akcemi OCR převaděče dokumentů živin. Bez problémů extrahujte text z souborů PDF pomocí pokročilé technologie optického rozpoznávání znaků (OCR) pro indexování, automatizaci a analýzu obsahu.

Tento konektor je dostupný v následujících produktech a oblastech:

Service Class Regions
Copilot Studio Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Logic Apps Standard Všechny oblasti Logic Apps s výjimkou následujících:
     – Oblasti Azure Government
     – Oblasti Azure China
     - Ministerstvo obrany USA (DoD)
Power Apps Premium Všechny oblasti Power Apps s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Power Automate Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Kontakt
Název Podpora živin (dříve Muhimbi)
URL https://support.nutrient.io/hc/en-us/requests/new
Email support+low-code@nutrient.io
Metadata konektoru
Vydavatel Muhimbi obchod jako živiny
Internetová stránka https://www.nutrient.io/low-code/
Zásady ochrany osobních údajů https://www.nutrient.io/legal/privacy/
Kategorie Spolupráce; Obsah a soubory

Provádění OCR na obrázcích a naskenovaných dokumentech

Pomocí převaděče dokumentů živin spusťte optické rozpoznávání znaků (OCR) na obrázcích a naskenovaných souborech prostřednictvím rozhraní REST API nebo knihovny serveru v místním prostředí.

Možnosti OCR

  • Převeďte obrázky, skenování a faxy na prohledávatelné soubory PDF.
  • Vytvářejte automatizované pracovní postupy dokumentů pro extrakci textu a prohledávatelnost PDF.

Možnosti integrace

Integrace funkcí OCR s ukázkami kódu ve vašem upřednostňovaném jazyce:

Požadavky

Chcete-li používat převaděč dokumentů živin, potřebujete bezplatný nebo zkušební účet. Informace o rozdílech mezi těmito typy účtů najdete v průvodci porovnáním .

Začínáme

Postupujte podle následujících kroků a začněte používat konektor Pro převod živin:

Známé problémy a omezení

Dokumenty chráněné řešením IRM, DRM, RMS nebo AIP nelze zpracovat kvůli omezením zabezpečení.

Pokud potřebujete dotazy nebo pomoc, obraťte se na náš tým podpory.

Limity omezování

Name Volání Období obnovení
Volání rozhraní API na připojení 100 60 sekund

Akce

Extrahování textu pomocí OCR

Extrahování textu ze souboru PDF pomocí OCR

Převést na OCRed PDF

Provedení OCR u existujícího dokumentu PDF nebo obrázku pro vytvoření prohledávatelného PDF

Extrahování textu pomocí OCR

Extrahování textu ze souboru PDF pomocí OCR

Parametry

Name Klíč Vyžadováno Typ Description
Název zdrojového souboru
source_file_name True string

Název zdrojového souboru včetně přípony

Obsah zdrojového souboru
source_file_content True byte

Obsah souboru do OCR

Jazyk
language enum

Jazyk

Souřadnice X
x string

Souřadnice X (v bodech, 1/72 palce)

Souřadnice Y
y string

Souřadnice Y (v bodech, 1/72 palce)

Šířka
width string

Šířka oblasti OCR (v pts, 1/72 palce)

Výška
height string

Výška oblasti OCR (v pts, 1/72 palce)

Číslo stránky
page_number string

Číslo stránky (ponechte prázdné na všech stránkách OCR)

Performance
performance enum

Výkon ()

Blacklist /whitelist
characters_option enum

Možnost Znaky

Znaky
characters string

Znaky, které mají být na seznamu zakázaných nebo povolených

Použití stránkování
paginate boolean

Stránkovat

Selhání při chybě
fail_on_error boolean

Selhání při chybě

Návraty

Data odpovědi pro operaci OCRText

Převést na OCRed PDF

Provedení OCR u existujícího dokumentu PDF nebo obrázku pro vytvoření prohledávatelného PDF

Parametry

Name Klíč Vyžadováno Typ Description
Název zdrojového souboru
source_file_name True string

Název zdrojového souboru včetně přípony

Obsah zdrojového souboru
source_file_content True byte

Obsah souboru do OCR

Jazyk
language enum

Jazyk

Performance
performance enum

Performance

Blacklist /whitelist
characters_option enum

Možnost Znaky

Znaky
characters string

Znaky, které mají být na seznamu zakázaných nebo povolených

Použití stránkování
paginate boolean

Stránkovat

Regions
regions string

Omezení oblasti na OCR na jednu nebo více konkrétních oblastí

Selhání při chybě
fail_on_error boolean

Selhání při chybě

Návraty

Data odpovědi pro všechny operace

Definice

ocr_operation_response

Data odpovědi pro operaci OCRText

Name Cesta Typ Description
Out text
out_text string

Extrahovaný text OCRed ve formátu prostého textu

Název základního souboru
base_file_name string

Název vstupního souboru bez přípony

Kód výsledku
result_code enum

Kód výsledku operace.

Podrobnosti o výsledku
result_details string

Podrobnosti výsledku operace

operation_response

Data odpovědi pro všechny operace

Name Cesta Typ Description
Zpracovaný obsah souboru
processed_file_content byte

Soubor vygenerovaný převaděčem Muhimbi.

Název základního souboru
base_file_name string

Název vstupního souboru bez přípony

Kód výsledku
result_code enum

Kód výsledku operace.

Podrobnosti o výsledku
result_details string

Podrobnosti výsledku operace