Sdílet prostřednictvím


Document AI (Preview)

Extrahujte strukturovaná data včetně pojmenovaných polí, tabulek, čárových kódů, klasifikací a souhrnů z běžných formátů dokumentů, naskenovaných dokumentů a fotek dokumentů pomocí AI. Podporuje také rukopis a fotky a skenování s nízkou kvalitou a také vstup digitálního dokumentu. Podporuje širokou škálu jazyků a dokáže analyzovat a odvozovat sémantickou strukturu z vizuálního rozložení dokumentů.

Tento konektor je dostupný v následujících produktech a oblastech:

Service Class Regions
Copilot Studio Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Logic Apps Standard Všechny oblasti Logic Apps s výjimkou následujících:
     – Oblasti Azure Government
     – Oblasti Azure China
     - Ministerstvo obrany USA (DoD)
Power Apps Premium Všechny oblasti Power Apps s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Power Automate Premium Všechny oblasti Power Automate s výjimkou následujících:
     – státní správa USA (GCC)
     – státní správa USA (GCC High)
     - China Cloud provozovaný společností 21Vianet
     - Ministerstvo obrany USA (DoD)
Kontakt
Název Cloudmersive
URL https://www.cloudmersive.com
Email support@cloudmersive.com
Metadata konektoru
Vydavatel Cloudmersive, LLC
Internetová stránka https://www.cloudmersive.com
Zásady ochrany osobních údajů https://www.cloudmersive.com/privacy-policy
Kategorie Umělá inteligence; Obsah a soubory

Cloudmersive Document AI Connector

Cloudmersive Document AI API umožňuje extrahovat data, pole, přehledy a text z dokumentů pomocí umělé inteligence nové generace.

Požadavky

Abyste mohli pokračovat, budete potřebovat následující:

  • Microsoft Power Apps, Power Automate nebo Azure Logic Apps s podporou konektoru Premium
  • Klíč rozhraní API Cloudmersive

Jak získat přihlašovací údaje

Pokud chcete tento konektor použít, potřebujete účet Cloudmersive. Můžete se zaregistrovat pomocí účtu Microsoft nebo vytvořit účet Cloudmersive. Klíč rozhraní API získáte pomocí následujícího postupu.

Získání klíče a tajného klíče rozhraní API

  • Registrace účtu Cloudmersive
  • Klikněte na klíče rozhraní API.

Tady můžete vytvořit a zobrazit klíče rozhraní API uvedené na stránce Klíče rozhraní API. Jednoduše zkopírujte a vložte tento klíč rozhraní API do konektoru Cloudmersive Document AI.

Teď jste připraveni začít používat cloudmersive CDR Connector.

Podporované operace

Konektor podporuje následující operace:

  • Enforce Policies to a Document to allow or block it using Advanced AI: Vynucujte zásady v dokumentu, abyste ho povolili nebo blokovali pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.
  • Answer Questions about a Document in a structured way using Advanced AI: Odpovězte na logické hodnoty (ano/ne), vícenásobnou volbu a otázky týkající se obsahu dokumentu pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.
  • Extract Text from a Document using AI: Extrahujte nezpracovaný text z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Podporuje širokou škálu jazyků. Využívá 100 volání rozhraní API na stránku.
  • Extract Field Values from a Document using AI: Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Field Values from a Document using Advanced AI: Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Tables of Data from a Document using AI: Extrahujte tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Barcodes of from a Document using AI: Extrahujte všechny čárové kódy z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract All Fields and Tables of Data from a Document using AI: Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Classification or Category from a Document using AI: Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Classification or Category from a Document using Advanced AI: Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí rozšířené AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Summary from a Document using AI: Vytvoří souhrn 1 odstavce vstupního dokumentu pomocí umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.
  • Extract Text from a Document using AI as a Batch Job: Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Podporuje širokou škálu jazyků. Vyžaduje nasazení spravované instance nebo privátního cloudu.
  • Extract Field Values from a Document using Advanced AI as a Batch Job: Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.
  • Extract All Fields and Tables of Data from a Document using AI as a Batch Job: Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.
  • Extract Classification or Category from a Document using AI as a Batch Job: Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.
  • Get the status and result of an Extract Document Batch Job: Vrátí výsledek asynchronní úlohy – možné stavy mohou být SPUŠTĚNy nebo DOKONČENY. Toto rozhraní API je k dispozici pouze pro nasazení spravované instance Cloudmersive a privátního cloudu.

Vytvoření připojení

Konektor podporuje následující typy ověřování:

výchozí Parametry pro vytvoření připojení Všechny oblasti Nesdílitelné

Výchozí

Použitelné: Všechny oblasti

Parametry pro vytvoření připojení

Toto připojení není možné sdílet. Pokud se power app sdílí s jiným uživatelem, zobrazí se výzva k explicitní vytvoření nového připojení.

Název Typ Description Povinné
Klíč rozhraní API securestring Klíč rozhraní API pro toto rozhraní API Pravdivé

Limity omezování

Name Volání Období obnovení
Volání rozhraní API na připojení 100 60 sekund

Akce

Extrahování hodnot polí z dokumentu pomocí AI

Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování hodnot polí z dokumentu pomocí rozšířené AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Extrahování hodnot polí z dokumentu pomocí rozšířené umělé inteligence

Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování klasifikace nebo kategorie z dokumentu pomocí AI

Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování klasifikace nebo kategorie z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Extrahování klasifikace nebo kategorie z dokumentu pomocí rozšířené umělé inteligence

Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí rozšířené AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování souhrnu z dokumentu pomocí AI

Vytvoří souhrn vstupního dokumentu o 1 odstavci pomocí umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování tabulek dat z dokumentu pomocí AI

Extrahujte tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Spotřebuje 100 volání rozhraní API na stránku.

Extrahování textu z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Podporuje širokou škálu jazyků. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Extrahování všech polí a tabulek dat z dokumentu pomocí AI

Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Extrahování všech polí a tabulek dat z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Extrakce textu z dokumentu pomocí AI

Extrahujte nezpracovaný text z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Podporuje širokou škálu jazyků. Využívá 100 volání rozhraní API na stránku.

Extrakce čárových kódů z dokumentu pomocí AI

Extrahujte všechny čárové kódy z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC a WEBP. Využívá 100 volání rozhraní API na stránku.

Odpovědi na otázky týkající se dokumentu strukturovaným způsobem pomocí pokročilé umělé inteligence

Logická hodnota odpovědi (ano/ne), vícenásobná volba a otázky týkající se obsahu dokumentu pomocí rozšířené umělé inteligence Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.

Vynucení zásad pro dokument, které ho povolí nebo zablokuje pomocí rozšířené umělé inteligence

Vynucujte zásady dokumentu, abyste ho povolili nebo zablokovali pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.

Získání stavu a výsledku dávkové úlohy extrakce dokumentu

Vrátí výsledek asynchronní úlohy – možné stavy mohou být SPUŠTĚNy nebo DOKONČENY. Toto rozhraní API je k dispozici pouze pro nasazení spravované instance Cloudmersive a privátního cloudu.

Extrahování hodnot polí z dokumentu pomocí AI

Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Požadovaná pole k extrakci, oddělení čárkami
FieldNames string

Požadovaná pole k extrakci, oddělení čárkami

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek extrahování polí z dokumentu

Extrahování hodnot polí z dokumentu pomocí rozšířené AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

InputFile
InputFile byte

Vstupní soubor dokumentu pro provedení operace jako pole bajtů

FieldName
FieldName string

Název pole, které se má extrahovat

PoleOptional
FieldOptional boolean

Volitelné: Hodnota True, pokud je pole volitelné, nepravda v případě potřeby (výchozí)

Popis polí
FieldDescription string

Volitelné, ale doporučené: Popis pole – použijte ho k popisu toho, co je pole, jak je formátované, co je v něm jedinečné atd.

FieldExample
FieldExample string

Volitelné: Příklad popisku nebo hodnoty pole

MaximumPagesProcessed
MaximumPagesProcessed integer

Volitelné: Omezení počtu zpracovaných stránek

Předzpracování
Preprocessing string

Volitelné: Nastavte úroveň předběžného zpracování obrázku, aby se zlepšila přesnost. Možné hodnoty jsou Auto, SmoothEdges, SmoothEdgesPlus, ContrastEdges, ContrastEdgesPlus, ContrastEdgesPlus, Invert, Binarize, Compatability a None. Výchozí hodnota je Automatická. Nastavte na SmoothEdges, aby se v vstupním obrázku vyhledaly drsné hrany, aby se zlepšila přesnost rozpoznávání. Nastavte na SmoothEdgesPlus tak, aby vyhlazovaly drsné hrany na vyšší stupeň. Nastavte na ContrastEdges a ContrastEdgesPlus, abyste vylepšili kontrast a čitelnost pro černobílé obrázky nebo obrázky ve stupních šedé s nízkou kvalitou. Pokud chcete invertovat vstupní obrázek, nastavte invertovat. Nastavte na Binarize, aby se vstupní obrázek binarizoval. Nastavte možnost Compatability pro maximální kompatibilitu funkcí PDF.

ResultCrossCheck
ResultCrossCheck string

Volitelné: Nastavte úroveň přesnosti výstupu křížové kontroly pro vstup. Možné hodnoty jsou None( Žádné), Advanced (Upřesnit) a Ultra (Ultra). Výchozí hodnota není Žádná. Ultra vytvoří nejvyšší přesnost, ale za cenu delší doby zpracování.

RotateImageDegrees
RotateImageDegrees double

Volitelné: Otočení vstupního obrázku před rozpoznáváním podle zadaného počtu stupňů; platné hodnoty jsou v rozsahu od -360 do +360.

Návraty

Výsledek provedení dávkové úlohy rozděleného dokumentu

Extrahování hodnot polí z dokumentu pomocí rozšířené umělé inteligence

Extrahujte hodnoty polí (např. číslo faktury, datum faktury, telefonní číslo vizitky atd.) z dokumentu pomocí rozšířené umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

InputFile
InputFile byte

Vstupní soubor dokumentu pro provedení operace jako pole bajtů

FieldName
FieldName string

Název pole, které se má extrahovat

PoleOptional
FieldOptional boolean

Volitelné: Hodnota True, pokud je pole volitelné, nepravda v případě potřeby (výchozí)

Popis polí
FieldDescription string

Volitelné, ale doporučené: Popis pole – použijte ho k popisu toho, co je pole, jak je formátované, co je v něm jedinečné atd.

FieldExample
FieldExample string

Volitelné: Příklad popisku nebo hodnoty pole

MaximumPagesProcessed
MaximumPagesProcessed integer

Volitelné: Omezení počtu zpracovaných stránek

Předzpracování
Preprocessing string

Volitelné: Nastavte úroveň předběžného zpracování obrázku, aby se zlepšila přesnost. Možné hodnoty jsou Auto, SmoothEdges, SmoothEdgesPlus, ContrastEdges, ContrastEdgesPlus, ContrastEdgesPlus, Invert, Binarize, Compatability a None. Výchozí hodnota je Automatická. Nastavte na SmoothEdges, aby se v vstupním obrázku vyhledaly drsné hrany, aby se zlepšila přesnost rozpoznávání. Nastavte na SmoothEdgesPlus tak, aby vyhlazovaly drsné hrany na vyšší stupeň. Nastavte na ContrastEdges a ContrastEdgesPlus, abyste vylepšili kontrast a čitelnost pro černobílé obrázky nebo obrázky ve stupních šedé s nízkou kvalitou. Pokud chcete invertovat vstupní obrázek, nastavte invertovat. Nastavte na Binarize, aby se vstupní obrázek binarizoval. Nastavte možnost Compatability pro maximální kompatibilitu funkcí PDF.

ResultCrossCheck
ResultCrossCheck string

Volitelné: Nastavte úroveň přesnosti výstupu křížové kontroly pro vstup. Možné hodnoty jsou None( Žádné), Advanced (Upřesnit) a Ultra (Ultra). Výchozí hodnota není Žádná. Ultra vytvoří nejvyšší přesnost, ale za cenu delší doby zpracování.

RotateImageDegrees
RotateImageDegrees double

Volitelné: Otočení vstupního obrázku před rozpoznáváním podle zadaného počtu stupňů; platné hodnoty jsou v rozsahu od -360 do +360.

Návraty

Výsledek extrahování polí z dokumentu

Extrahování klasifikace nebo kategorie z dokumentu pomocí AI

Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Desired classification to extract
Categories string

Desired classification to extract

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek klasifikace dokumentu pomocí AI

Extrahování klasifikace nebo kategorie z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Parametry

Name Klíč Vyžadováno Typ Description
Desired classification to extract
Categories string

Desired classification to extract

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek provedení dávkové úlohy rozděleného dokumentu

Extrahování klasifikace nebo kategorie z dokumentu pomocí rozšířené umělé inteligence

Extrahujte klasifikaci nebo kategorii (např. fakturu, potvrzení, daňový formulář nebo formulář 1040, formulář 1040 EZ atd.) z dokumentu pomocí rozšířené AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

InputFile
InputFile byte

Vstupní soubor dokumentu pro provedení operace jako pole bajtů

Název kategorie
CategoryName string

Název klasifikace

Popis categoryDescription
CategoryDescription string

Volitelné, ale doporučené: Popis klasifikace v přirozeném langugage

Předzpracování
Preprocessing string

Volitelné: Nastavte úroveň předběžného zpracování obrázku, aby se zlepšila přesnost. Možné hodnoty jsou Auto, SmoothEdges, SmoothEdgesPlus, Compatability a None. Výchozí hodnota je Automatická. Nastavte na SmoothEdges, aby se v vstupním obrázku vyhledaly drsné hrany, aby se zlepšila přesnost rozpoznávání. Nastavte na SmoothEdgesPlus tak, aby vyhlazovaly drsné hrany na vyšší stupeň. Nastavte možnost Compatability pro maximální kompatibilitu funkcí PDF.

ResultCrossCheck
ResultCrossCheck string

Volitelné: Nastavte úroveň přesnosti výstupu křížové kontroly pro vstup. Možné hodnoty jsou None( Žádné), Advanced (Upřesnit), Ultra (Ultra) a Hyper (Hyper). Výchozí hodnota není Žádná. Ultra a Hyper vytvoří nejvyšší přesnost, ale za cenu delší doby zpracování.

MaximumPagesProcessed
MaximumPagesProcessed integer

Volitelné: Omezení počtu zpracovaných stránek

RotateImageDegrees
RotateImageDegrees double

Volitelné: Otočení vstupního obrázku před rozpoznáváním podle zadaného počtu stupňů; platné hodnoty jsou v rozsahu od -360 do +360.

Návraty

Výsledek klasifikace dokumentu pomocí AI

Extrahování souhrnu z dokumentu pomocí AI

Vytvoří souhrn vstupního dokumentu o 1 odstavci pomocí umělé inteligence. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek shrnutí dokumentu

Extrahování tabulek dat z dokumentu pomocí AI

Extrahujte tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Spotřebuje 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek extrahování tabulek z dokumentu

Extrahování textu z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Podporuje širokou škálu jazyků. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek provedení dávkové úlohy rozděleného dokumentu

Extrahování všech polí a tabulek dat z dokumentu pomocí AI

Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Volitelné: Nastavte úroveň předběžného zpracování obrázku, aby se zlepšila přesnost. ...
preprocessing string

Volitelné: Nastavte úroveň předběžného zpracování obrázku, aby se zlepšila přesnost. ...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek extrahování polí z dokumentu

Extrahování všech polí a tabulek dat z dokumentu pomocí AI jako dávkové úlohy

Vytvoří asynchronní dávkovou úlohu pro zpracování velkého dokumentu jako dávkové úlohy AI. Extrahujte všechna pole a tabulky, které se skládají z řádků a sloupců dat, z dokumentu pomocí AI. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Vyžaduje nasazení spravované instance nebo privátního cloudu.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek provedení dávkové úlohy rozděleného dokumentu

Extrakce textu z dokumentu pomocí AI

Extrahujte nezpracovaný text z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG a WEBP. Podporuje širokou škálu jazyků. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek extrahování textu z dokumentu

Extrakce čárových kódů z dokumentu pomocí AI

Extrahujte všechny čárové kódy z dokumentu pomocí AI. Mezi podporované formáty vstupních dokumentů patří DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC a WEBP. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...
recognitionMode string

Volitelné; Režim rozpoznávání – Rozšířené (výchozí) poskytuje nejvyšší hodnotu...

Vstupní dokument nebo fotky dokumentu pro extrakci dat z
InputFile file

Vstupní dokument nebo fotky dokumentu pro extrakci dat z

Návraty

Výsledek extrakce čárových kódů z dokumentu

Odpovědi na otázky týkající se dokumentu strukturovaným způsobem pomocí pokročilé umělé inteligence

Logická hodnota odpovědi (ano/ne), vícenásobná volba a otázky týkající se obsahu dokumentu pomocí rozšířené umělé inteligence Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
InputFile
InputFile byte

Vstupní soubor jako pole bajtů

QuestionId
QuestionId string

Jedinečné ID otázky, např. 1 nebo 2A

QuestionText
QuestionText string

Otázka v přirozeném jazyce k položení dokumentu, kde se odpověď přeloží na ANO nebo NE, např. "Je tento dokument podepsaný a podepsaný oběma stranami?".

QuestionId
QuestionId string

Jedinečné ID otázky, např. 1 nebo 2A

QuestionText
QuestionText string

Otázka v přirozeném jazyce, kde se odpověď přeloží na jeden z pevně zadaných voleb, např. "Co je rozhodné právo této dohody?".

ChoiceId
ChoiceId string

Jedinečné ID volby odpovědi, např. 3C

ChoiceText
ChoiceText string

Popis textu této volby, např. "Delaware"

QuestionId
QuestionId string

Jedinečné ID otázky, např. 7 nebo 5A

QuestionText
QuestionText string

Otázka v přirozeném jazyce k položení dokumentu, kde se odpověď vyřeší na bezplatnou odpověď, např. "Kdo je protistranou v této smlouvě?".

RecognitionMode
RecognitionMode string

Volitelné; Režim rozpoznávání – Normální (výchozí) poskytuje nejvyšší přesnost, ale pomalejší rychlost, zatímco Normal poskytuje rychlejší odezvu, ale nižší přesnost obrázků s nízkou kvalitou.

Návraty

Výsledek provedení operace odpovědi na otázky dokumentu

Vynucení zásad pro dokument, které ho povolí nebo zablokuje pomocí rozšířené umělé inteligence

Vynucujte zásady dokumentu, abyste ho povolili nebo zablokovali pomocí rozšířené umělé inteligence. Podporované formáty vstupních dokumentů zahrnují DOCX, PDF, PNG a JPG. Využívá 100 volání rozhraní API na stránku.

Parametry

Name Klíč Vyžadováno Typ Description
InputFile
InputFile byte

Vstupní soubor jako pole bajtů

Identifikátor pravidla
RuleId string
TypPravidla
RuleType string

Možné hodnoty jsou ALLOW a DENY

RuleDescription
RuleDescription string

Popis pravidla v přirozeném jazyce, například nepovolovat dokumenty, které obsahují urážlivý jazyk

RecognitionMode
RecognitionMode string

Volitelné; Režim rozpoznávání – Normální (výchozí) poskytuje nejvyšší přesnost, ale pomalejší rychlost, zatímco Normal poskytuje rychlejší odezvu, ale nižší přesnost obrázků s nízkou kvalitou.

Návraty

Výsledek provádění operace vynucení zásad dokumentu

Získání stavu a výsledku dávkové úlohy extrakce dokumentu

Vrátí výsledek asynchronní úlohy – možné stavy mohou být SPUŠTĚNy nebo DOKONČENY. Toto rozhraní API je k dispozici pouze pro nasazení spravované instance Cloudmersive a privátního cloudu.

Parametry

Name Klíč Vyžadováno Typ Description
ID úlohy pro dávkovou úlohu pro získání stavu
AsyncJobID string

ID úlohy pro dávkovou úlohu pro získání stavu

Návraty

Výsledek provedení dávkové úlohy

Definice

DocumentAdvancedClassificationResult

Výsledek klasifikace dokumentu pomocí AI

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

DocumentCategoryResult
DocumentCategoryResult string

Kategorie použitá na dokument; pokud kategorii nebylo možné identifikovat, použije se "jiné". Mezery se nahradí podtržítky.

Skóre Důvěry
ConfidenceScore double

Skóre spolehlivosti mezi 0,0 a 1,0, kde hodnoty > 0,8 označují vysokou spolehlivost

DocumentClassificationResult

Výsledek klasifikace dokumentu pomocí AI

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

DocumentCategoryResult
DocumentCategoryResult string

Kategorie použitá na dokument; pokud kategorii nebylo možné identifikovat, použije se "jiné". Mezery se nahradí podtržítky.

DocumentPolicyResult

Výsledek provádění operace vynucení zásad dokumentu

Name Cesta Typ Description
CleanResult
CleanResult boolean

Pravda, pokud dokument splňuje všechny zásady, a nepravda, pokud ne

RiskScore
RiskScore double

Rizikové skóre mezi 0,0 a 1,0, kde hodnoty nad 0,5 zvyšují úroveň rizika

RuleViolations
RuleViolations array of PolicyRuleViolation

porušení zásad,

DocumentQuestionAnswerItem

Odpověď na vstupní otázku

Name Cesta Typ Description
QuestionId
QuestionId string

ID vstupní otázky

AnswerValue
AnswerValue string

Odpověď na hodnotu odpovědi, formátovaná jako řetězec, pro tuto otázku Logické otázky vrátí ano nebo NE.

AnswerRationale
AnswerRationale string

Odůvodnění vysvětlující, proč byla tato odpověď udělena

Skóre Důvěry
ConfidenceScore double

Skóre spolehlivosti mezi 0,0 a 1,0, kde hodnoty nad 0,8 označují vysokou spolehlivost

DocumentQuestionAnswersResult

Výsledek provedení operace odpovědi na otázky dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

Hodnota True, pokud byla operace úspěšně dokončena, nebo nepravda jinak

Skóre Důvěry
ConfidenceScore double

Skóre spolehlivosti mezi 0,0 a 1,0, kde hodnoty nad 0,8 označují vysokou spolehlivost

AnswerResults
AnswerResults array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

Výsledek extrakce čárových kódů z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

BarcodeResults
BarcodeResults array of ExtractedBarcodeItem

Výsledky hodnoty tabulky z operace extrakce

ExtractDocumentBatchJobResult

Výsledek provedení dávkové úlohy rozděleného dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

AsyncJobID
AsyncJobID string

Při vytváření úlohy se vrátí ID asynchronní úlohy. Pomocí rozhraní GetAsyncJobStatus API zkontrolujte stav této úlohy pomocí AsyncJobID a získejte výsledek po dokončení úlohy.

ExtractDocumentJobStatusResult

Výsledek provedení dávkové úlohy

Name Cesta Typ Description
Úspěch
Successful boolean

Hodnota True, pokud operace pro kontrolu stavu úlohy proběhla úspěšně, v opačném případě je false.

AsyncJobStatus
AsyncJobStatus string

Vrátí stav úlohy asynchronní úlohy(pokud je k dispozici). Možné stavy jsou STARTED a COMPLETED

AsyncJobID
AsyncJobID string

ID úlohy

ExtractTextResult
ExtractTextResult ExtractTextResponse

Výsledek extrahování textu z dokumentu

ExtractFieldsAndTablesResult
ExtractFieldsAndTablesResult ExtractFieldsAndTablesResponse

Výsledek extrahování polí z dokumentu

ExtractFieldsResult
ExtractFieldsResult ExtractFieldsResponse

Výsledek extrahování polí z dokumentu

ExtractClassificationResult
ExtractClassificationResult DocumentClassificationResult

Výsledek klasifikace dokumentu pomocí AI

Chybová zpráva
ErrorMessage string

Chybová zpráva (pokud existuje)

ExtractFieldsAdvancedResponse

Výsledek extrahování polí z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

Results
Results array of FieldAdvancedValue

Výsledky hodnoty pole z operace extrakce

Skóre Důvěry
ConfidenceScore double

Skóre spolehlivosti mezi 0,0 a 1,0, kde hodnoty > 0,8 označují vysokou spolehlivost

ExtractFieldsAndTablesResponse

Výsledek extrahování polí z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

FieldResults
FieldResults array of FieldValue

Výsledky hodnoty pole z operace extrakce

TableResults
TableResults array of TableResult

Výsledky hodnoty tabulky z operace extrakce

ExtractFieldsResponse

Výsledek extrahování polí z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

Results
Results array of FieldValue

Výsledky hodnoty pole z operace extrakce

ExtractTablesResponse

Výsledek extrahování tabulek z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

TableResults
TableResults array of TableResult

Výsledky hodnoty tabulky z operace extrakce

ExtractTextResponse

Výsledek extrahování textu z dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

PageResults
PageResults array of ExtractedTextPage

Výsledky stránky z operace extrakce

ExtractedBarcodeItem

Extrahovaný výsledek čárového kódu

Name Cesta Typ Description
BarcodeType
BarcodeType string

Typ identifikovaného čárového kódu, možné hodnoty jsou: AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN

BarcodeValue
BarcodeValue string

Hodnota čárového kódu jako řetězce

ExtractedTextPage

Extrahovaná stránka ze vstupního dokumentu

Name Cesta Typ Description
Číslo stránky
PageNumber integer

Index čísel stránek, založený na 1

TextResult
TextResult string

Textový obsah stránky

FieldAdvancedValue

Výsledek hodnoty pole extrahování polí z dokumentu

Name Cesta Typ Description
FieldName
FieldName string

Název pole (všimněte si, že mezery budou nahrazeny podtržítkem)

FieldStringValue
FieldStringValue string

Řetězcová hodnota pole extrahovaného z dokumentu

FieldValue

Výsledek hodnoty pole extrahování polí z dokumentu

Name Cesta Typ Description
FieldName
FieldName string

Název pole (všimněte si, že mezery budou nahrazeny podtržítkem)

FieldStringValue
FieldStringValue string

Primární nebo první řetězcová hodnota pole extrahovaného z dokumentu

AdditionalFieldStringValues
AdditionalFieldStringValues array of string

Další hodnoty pro toto pole, pokud je stejné pole přítomno s více hodnotami, například pokud ve stejném dokumentu dojde ke dvěma instancím stejného formuláře

PolicyRuleViolation

Instance porušení pravidla zásad

Name Cesta Typ Description
Identifikátor pravidla
RuleId string

ID pravidla; pokud nebylo zadáno žádné ID, je ID indexem založeném na 1 pravidle.

RuleViolationRiskScore
RuleViolationRiskScore double

Rizikové skóre mezi 0,0 a 1,0, kde hodnoty nad 0,5 zvyšují úroveň rizika

RuleViolationRationale
RuleViolationRationale string

Odůvodnění přirozeného jazyka AI z důvodu porušení této zásady

SummarizeDocumentResponse

Výsledek shrnutí dokumentu

Name Cesta Typ Description
Úspěch
Successful boolean

True v případě úspěchu, jinak nepravda

DocumentSummaryText
DocumentSummaryText string

Souhrn dokumentu

TableResult

Tabulka extrahovaná z dokumentu

Name Cesta Typ Description
Title
Title string

Název tabulky (volitelné)

Řádky
Rows array of TableResultRow

Řádky tabulky

TableResultCell

Buňka řádku tabulky extrahované z dokumentu

Name Cesta Typ Description
CellHeader
CellHeader string

Záhlaví sloupce buňky

CellValue
CellValue string

Hodnota buňky jako řetězec

TableResultRow

Řádek tabulky extrahované z dokumentu

Name Cesta Typ Description
Buňky
Cells array of TableResultCell

Buňky v řádku