Funkce Document Intelligence složené z vlastních modelů

Článek
09/01/2024

Důležité

Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
- USA – východ
- USA – západ 2
- Západní Evropa
- USA – středosever

Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1

Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1

Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)

Důležité

Chování model compose operace se mění z api-version=2024-07-31-preview. Operace model compose v4.0 a novější přidá explicitně natrénovaný klasifikátor místo implicitního klasifikátoru pro analýzu. Předchozí složená verze modelu najdete v tématu Složené vlastní modely verze 3.1. Pokud aktuálně používáte složené modely, zvažte upgrade na nejnovější implementaci.

Co je složený model?

S složenými modely můžete seskupit několik vlastních modelů do složeného modelu volaným s jedním ID modelu. Složený model může například zahrnovat vlastní modely natrénované k analýze dodávek, vybavení a nákupních objednávek nábytku. Místo ručního výběru vhodného modelu můžete použít složený model k určení vhodného vlastního modelu pro každou analýzu a extrakci.

Některé scénáře vyžadují nejprve klasifikaci dokumentu a následnou analýzu dokumentu s modelem, který nejlépe vyhovuje extrakci polí z modelu. Takové scénáře můžou zahrnovat ty, ve kterých uživatel nahraje dokument, ale typ dokumentu není explicitně známý. Dalším scénářem může být situace, kdy se naskenuje více dokumentů do jednoho souboru a soubor se odešle ke zpracování. Vaše aplikace pak potřebuje identifikovat dokumenty komponent a vybrat nejlepší model pro každý dokument.

V předchozích verzích operace prováděla implicitní klasifikaci, aby se rozhodla, model compose který vlastní model nejlépe představuje odeslaný dokument. Implementace 2024-07-31-preview model compose operace nahradí implicitní klasifikaci z předchozích verzí explicitním krokem klasifikace a přidá podmíněné směrování.

Výhody nové operace vytváření modelů

Nová model compose operace vyžaduje, abyste vytrénovat explicitní klasifikátor a poskytoval několik výhod.

Průběžné přírůstkové vylepšování. Konzistentně můžete zlepšit kvalitu klasifikátoru přidáním dalších vzorků a přírůstkovým zlepšením klasifikace. Toto vyladění zajistí, že vaše dokumenty budou vždy směrovány na správný model pro extrakci.
Dokončete kontrolu nad směrováním. Přidáním směrování založeného na spolehlivosti poskytnete prahovou hodnotu spolehlivosti pro typ dokumentu a odpověď klasifikace.
Během operace ignorujte konkrétní typy dokumentů. Dřívější implementace model compose operace vybrali nejlepší analytický model pro extrakci na základě skóre spolehlivosti, i když nejvyšší skóre spolehlivosti bylo relativně nízké. Poskytnutím prahové hodnoty spolehlivosti nebo explicitně nemapováním známého typu dokumentu z klasifikace na model extrakce můžete určité typy dokumentů ignorovat.
Analyzujte více instancí stejného typu dokumentu. Při spárování s splitMode možností klasifikátoru model compose může operace rozpoznat více instancí stejného dokumentu v souboru a rozdělit soubor tak, aby zpracovával každý dokument nezávisle. Použití splitMode umožňuje zpracování více instancí dokumentu v jednom požadavku.
Podpora pro přidání funkcí Funkce, jako jsou pole dotazu nebo čárové kódy, lze také zadat jako součást parametrů modelu analýzy.
Přiřazený vlastní model je maximálně rozšířen na 500. Nová implementace model compose operace umožňuje přiřadit až 500 vytrénovaných vlastních modelů k jednomu složeného modelu.

Jak používat vytváření modelů

Začněte shromažďováním vzorků všech potřebných dokumentů včetně ukázek s informacemi, které by se měly extrahovat nebo ignorovat.
Vytrénujte klasifikátor uspořádáním dokumentů do složek, ve kterých jsou názvy složek typ dokumentu, který chcete použít v definici složeného modelu.
Nakonec vytrénujte model extrakce pro každý typ dokumentu, který chcete použít.
Po trénování modelů klasifikace a extrakce použijte sadu Document Intelligence Studio, klientské knihovny nebo rozhraní REST API k vytvoření klasifikačních a extrahovacích modelů do složeného modelu.

Pomocí parametru splitMode můžete řídit chování rozdělení souboru:

Nezaokrouhlovat. Celý soubor se považuje za jeden dokument.
perPage. Každá stránka v souboru se považuje za samostatný dokument.
auto. Soubor se automaticky rozdělí do dokumentů.

Fakturace a ceny

Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu stránek analyzovaných modelem podřízené analýzy. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. S přidáním explicitních poplatků za klasifikaci jsou účtovány pro klasifikaci všech stránek ve vstupním souboru. Další informace najdete na stránce s cenami funkce Document Intelligence.

Použití vytváření modelů

Začněte vytvořením seznamu všech ID modelů, které chcete vytvořit do jednoho modelu.
Vytvořte modely do jednoho ID modelu pomocí sady Studio, rozhraní REST API nebo klientských knihoven.
K analýze dokumentů použijte složené ID modelu.

Fakturace

Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu analyzovaných stránek. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. Další informace najdete na stránce s cenami funkce Document Intelligence.

Při analýze dokumentu pomocí individuálního vlastního modelu nebo složeného vlastního modelu nedošlo ke změně cen.

Složené funkce modelů

Custom template a custom neural modely se dají skládat do jednoho složeného modelu napříč několika verzemi rozhraní API.
Odpověď obsahuje vlastnost, docType která označuje, které složené modely byly použity k analýze dokumentu.
U custom template modelů lze složený model vytvořit pomocí variant vlastní šablony nebo různých typů formulářů. Tato operace je užitečná, když příchozí formuláře patří do některé z několika šablon.
Pro custom neural modely je osvědčeným postupem přidat všechny různé varianty jednoho typu dokumentu do jedné trénovací datové sady a trénovat na vlastním neurálním modelu. Operace model compose je nejvhodnější pro scénáře, kdy máte dokumenty různých typů odesílaných k analýze.

Vytváření limitů modelu

model compose Pomocí této operace můžete přiřadit až 500 modelů k jednomu ID modelu. Pokud počet modelů, které chci vytvořit, překročí horní mez složeného modelu, můžete použít jednu z těchto alternativ:
- Klasifikujte dokumenty před voláním vlastního modelu. Model pro čtení můžete použít a sestavit klasifikaci založenou na extrahovaném textu z dokumentů a určitých frází pomocí zdrojů, jako jsou kód, regulární výrazy nebo hledání.
- Pokud chcete extrahovat stejná pole z různých strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů, zvažte použití vlastního neurálního modelu hlubokého učení. Přečtěte si další informace o rozdílech mezi vlastním modelem šablony a vlastním neurálním modelem.
Analýza dokumentu pomocí složených modelů je shodná s analýzou dokumentu pomocí jednoho modelu. Výsledek Analyze Document vrátí docType vlastnost, která označuje, které z modelů komponent, které jste vybrali pro analýzu dokumentu.
Operace model compose je aktuálně dostupná jenom pro vlastní modely natrénované pomocí popisků.

Kompatibilita složeného modelu

Vlastní typ modelu	Modely natrénované pomocí v2.1 a v2.0	Vlastní šablony a neurální modely v3.1 a v3.0	Vlastní šablony a neurální modely verze 4.0 Preview	Vlastní modely generování verze 4.0 Preview
Modely natrénované s verzí 2.1 a v2.0	Nepodporuje se	Nepodporuje se	Nepodporuje se	Nepodporuje se
Vlastní šablony a neurální modely v3.0 a v3.1	Nepodporuje se	Podporováno	Podporováno	Nepodporuje se
Vlastní šablony a neurální modely verze 4.0 Preview	Nepodporuje se	Podporováno	Podporováno	Nepodporuje se
Vlastní modely generování verze 4.0 Preview	Nepodporuje se	Nepodporuje se	Nepodporuje se	Nepodporuje se

Pokud chcete vytvořit model natrénovaný pomocí předchozí verze rozhraní API (verze 2.1 nebo starší), vytrénujte model pomocí rozhraní API verze 3.0 pomocí stejné datové sady s popiskem. Tím se zajistí, že model verze 2.1 se dá skládat s jinými modely.
U modelů, které se skládají pomocí verze 2.1 rozhraní API, se nadále podporují a nevyžadují žádné aktualizace.

Možnosti vývoje

Document Intelligence verze 4.0:2024-07-31-preview podporuje následující nástroje, aplikace a knihovny:

Funkce	Zdroje informací
Vlastní model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK
Složený model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK

Funkce Document Intelligence v3.1:2023-07-31 (GA) podporuje následující nástroje, aplikace a knihovny:

Funkce	Zdroje informací
Vlastní model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK
Složený model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK

Funkce Document Intelligence v3.0:2022-08-31 (GA) podporuje následující nástroje, aplikace a knihovny:

Funkce	Zdroje informací
Vlastní model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK
Složený model	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK

Document Intelligence v2.1 podporuje následující zdroje informací:

Funkce	Zdroje informací
Vlastní model	• Nástroj pro popisování document intelligence• ROZHRANÍ REST API • Sada SDK klientské knihovny• Kontejner Document Intelligence Dockeru
Složený model	• Nástroj popisování dokumentace• REST API • Sada C# SDK • Java SDK• JavaScript SDK • Python SDK• Python SDK

Další kroky

Naučte se vytvářet a vytvářet vlastní modely:

Vytvoření vlastního modeluPro vytváření vlastních modelů

Sdílet prostřednictvím