Sdílet prostřednictvím


Funkce Document Intelligence složené z vlastních modelů

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
  • Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
    • USA – východ
    • USA – západ 2
    • Západní Evropa
    • USA – středosever

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.1 (GA) v3.0 (GA) modrá značka zaškrtnutí modrá značka zaškrtnutí v2.1 (GA)

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.0modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na:Zaškrtnutí v3.0 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) nachová značka zaškrtnutív3.1 | Předchozí verze: modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na: Zaškrtnutí v2.1 | Nejnovější verze: modrá značka zaškrtnutí v4.0 (Preview)

Důležité

Chování model compose operace se mění z api-version=2024-07-31-preview. Operace model compose v4.0 a novější přidá explicitně natrénovaný klasifikátor místo implicitního klasifikátoru pro analýzu. Předchozí složená verze modelu najdete v tématu Složené vlastní modely verze 3.1. Pokud aktuálně používáte složené modely, zvažte upgrade na nejnovější implementaci.

Co je složený model?

S složenými modely můžete seskupit několik vlastních modelů do složeného modelu volaným s jedním ID modelu. Složený model může například zahrnovat vlastní modely natrénované k analýze dodávek, vybavení a nákupních objednávek nábytku. Místo ručního výběru vhodného modelu můžete použít složený model k určení vhodného vlastního modelu pro každou analýzu a extrakci.

Některé scénáře vyžadují nejprve klasifikaci dokumentu a následnou analýzu dokumentu s modelem, který nejlépe vyhovuje extrakci polí z modelu. Takové scénáře můžou zahrnovat ty, ve kterých uživatel nahraje dokument, ale typ dokumentu není explicitně známý. Dalším scénářem může být situace, kdy se naskenuje více dokumentů do jednoho souboru a soubor se odešle ke zpracování. Vaše aplikace pak potřebuje identifikovat dokumenty komponent a vybrat nejlepší model pro každý dokument.

V předchozích verzích operace prováděla implicitní klasifikaci, aby se rozhodla, model compose který vlastní model nejlépe představuje odeslaný dokument. Implementace 2024-07-31-preview model compose operace nahradí implicitní klasifikaci z předchozích verzí explicitním krokem klasifikace a přidá podmíněné směrování.

Výhody nové operace vytváření modelů

Nová model compose operace vyžaduje, abyste vytrénovat explicitní klasifikátor a poskytoval několik výhod.

  • Průběžné přírůstkové vylepšování. Konzistentně můžete zlepšit kvalitu klasifikátoru přidáním dalších vzorků a přírůstkovým zlepšením klasifikace. Toto vyladění zajistí, že vaše dokumenty budou vždy směrovány na správný model pro extrakci.

  • Dokončete kontrolu nad směrováním. Přidáním směrování založeného na spolehlivosti poskytnete prahovou hodnotu spolehlivosti pro typ dokumentu a odpověď klasifikace.

  • Během operace ignorujte konkrétní typy dokumentů. Dřívější implementace model compose operace vybrali nejlepší analytický model pro extrakci na základě skóre spolehlivosti, i když nejvyšší skóre spolehlivosti bylo relativně nízké. Poskytnutím prahové hodnoty spolehlivosti nebo explicitně nemapováním známého typu dokumentu z klasifikace na model extrakce můžete určité typy dokumentů ignorovat.

  • Analyzujte více instancí stejného typu dokumentu. Při spárování s splitMode možností klasifikátoru model compose může operace rozpoznat více instancí stejného dokumentu v souboru a rozdělit soubor tak, aby zpracovával každý dokument nezávisle. Použití splitMode umožňuje zpracování více instancí dokumentu v jednom požadavku.

  • Podpora pro přidání funkcí Funkce, jako jsou pole dotazu nebo čárové kódy, lze také zadat jako součást parametrů modelu analýzy.

  • Přiřazený vlastní model je maximálně rozšířen na 500. Nová implementace model compose operace umožňuje přiřadit až 500 vytrénovaných vlastních modelů k jednomu složeného modelu.

Jak používat vytváření modelů

  • Začněte shromažďováním vzorků všech potřebných dokumentů včetně ukázek s informacemi, které by se měly extrahovat nebo ignorovat.

  • Vytrénujte klasifikátor uspořádáním dokumentů do složek, ve kterých jsou názvy složek typ dokumentu, který chcete použít v definici složeného modelu.

  • Nakonec vytrénujte model extrakce pro každý typ dokumentu, který chcete použít.

  • Po trénování modelů klasifikace a extrakce použijte sadu Document Intelligence Studio, klientské knihovny nebo rozhraní REST API k vytvoření klasifikačních a extrahovacích modelů do složeného modelu.

Pomocí parametru splitMode můžete řídit chování rozdělení souboru:

  • Nezaokrouhlovat. Celý soubor se považuje za jeden dokument.
  • perPage. Každá stránka v souboru se považuje za samostatný dokument.
  • auto. Soubor se automaticky rozdělí do dokumentů.

Fakturace a ceny

Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu stránek analyzovaných modelem podřízené analýzy. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. S přidáním explicitních poplatků za klasifikaci jsou účtovány pro klasifikaci všech stránek ve vstupním souboru. Další informace najdete na stránce s cenami funkce Document Intelligence.

Použití operace vytváření modelu

  • Začněte vytvořením seznamu všech ID modelů, které chcete vytvořit do jednoho modelu.

  • Vytvořte modely do jednoho ID modelu pomocí sady Studio, rozhraní REST API nebo klientských knihoven.

  • K analýze dokumentů použijte složené ID modelu.

Fakturace

Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu analyzovaných stránek. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. Další informace najdete na stránce s cenami funkce Document Intelligence.

  • Při analýze dokumentu pomocí individuálního vlastního modelu nebo složeného vlastního modelu nedošlo ke změně cen.

Složené funkce modelů

  • Custom template a custom neural modely se dají skládat do jednoho složeného modelu napříč několika verzemi rozhraní API.

  • Odpověď obsahuje vlastnost, docType která označuje, které složené modely byly použity k analýze dokumentu.

  • U custom template modelů lze složený model vytvořit pomocí variant vlastní šablony nebo různých typů formulářů. Tato operace je užitečná, když příchozí formuláře patří do některé z několika šablon.

  • Pro custom neural modely je osvědčeným postupem přidat všechny různé varianty jednoho typu dokumentu do jedné trénovací datové sady a trénovat na vlastním neurálním modelu. Operace model compose je nejvhodnější pro scénáře, kdy máte dokumenty různých typů odesílaných k analýze.

Vytváření limitů modelu

  • model compose Pomocí této operace můžete přiřadit až 500 modelů k jednomu ID modelu. Pokud počet modelů, které chci vytvořit, překročí horní mez složeného modelu, můžete použít jednu z těchto alternativ:

    • Klasifikujte dokumenty před voláním vlastního modelu. Model pro čtení můžete použít a sestavit klasifikaci založenou na extrahovaném textu z dokumentů a určitých frází pomocí zdrojů, jako jsou kód, regulární výrazy nebo hledání.

    • Pokud chcete extrahovat stejná pole z různých strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů, zvažte použití vlastního neurálního modelu hlubokého učení. Přečtěte si další informace o rozdílech mezi vlastním modelem šablony a vlastním neurálním modelem.

  • Analýza dokumentu pomocí složených modelů je shodná s analýzou dokumentu pomocí jednoho modelu. Výsledek Analyze Document vrátí docType vlastnost, která označuje, které z modelů komponent, které jste vybrali pro analýzu dokumentu.

  • Operace model compose je aktuálně dostupná jenom pro vlastní modely natrénované pomocí popisků.

Kompatibilita složeného modelu

Vlastní typ modelu Modely natrénované pomocí v2.1 a v2.0 Vlastní šablony a neurální modely v3.1 a v3.0 Vlastní šablony a neurální modely verze 4.0 Preview Vlastní modely generování verze 4.0 Preview
Modely natrénované s verzí 2.1 a v2.0 Nepodporuje se Nepodporuje se Nepodporuje se Nepodporuje se
Vlastní šablony a neurální modely v3.0 a v3.1 Nepodporuje se Podporováno Podporováno Nepodporuje se
Vlastní šablony a neurální modely verze 4.0 Preview Nepodporuje se Podporováno Podporováno Nepodporuje se
Vlastní modely generování verze 4.0 Preview Nepodporuje se Nepodporuje se Nepodporuje se Nepodporuje se
  • Pokud chcete vytvořit model natrénovaný pomocí předchozí verze rozhraní API (verze 2.1 nebo starší), vytrénujte model pomocí rozhraní API verze 3.0 pomocí stejné datové sady s popiskem. Tím se zajistí, že model verze 2.1 se dá skládat s jinými modely.

  • U modelů, které se skládají pomocí verze 2.1 rozhraní API, se nadále podporují a nevyžadují žádné aktualizace.

Možnosti vývoje

Document Intelligence verze 4.0:2024-07-31-preview podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Vlastní model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK
Složený model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK

Funkce Document Intelligence v3.1:2023-07-31 (GA) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Vlastní model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK
Složený model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK

Funkce Document Intelligence v3.0:2022-08-31 (GA) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Vlastní model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK
Složený model Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK• Python SDK• Python SDK

Document Intelligence v2.1 podporuje následující zdroje informací:

Funkce Zdroje informací
Vlastní model Nástroj pro
popisování document intelligence• ROZHRANÍ REST API
Sada SDK
klientské knihovny• Kontejner Document Intelligence Dockeru
Složený model Nástroj popisování
dokumentace• REST API
Sada C# SDK
Java SDK• JavaScript SDK
• Python SDK• Python SDK

Další kroky

Naučte se vytvářet a vytvářet vlastní modely: