Funkce Document Intelligence složené z vlastních modelů
Důležité
- Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
- Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
- Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
- USA – východ
- USA – západ 2
- Západní Evropa
- USA – středosever
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1
Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)
Důležité
Chování model compose
operace se mění z api-version=2024-07-31-preview. Operace model compose
v4.0 a novější přidá explicitně natrénovaný klasifikátor místo implicitního klasifikátoru pro analýzu. Předchozí složená verze modelu najdete v tématu Složené vlastní modely verze 3.1. Pokud aktuálně používáte složené modely, zvažte upgrade na nejnovější implementaci.
Co je složený model?
S složenými modely můžete seskupit několik vlastních modelů do složeného modelu volaným s jedním ID modelu. Složený model může například zahrnovat vlastní modely natrénované k analýze dodávek, vybavení a nákupních objednávek nábytku. Místo ručního výběru vhodného modelu můžete použít složený model k určení vhodného vlastního modelu pro každou analýzu a extrakci.
Některé scénáře vyžadují nejprve klasifikaci dokumentu a následnou analýzu dokumentu s modelem, který nejlépe vyhovuje extrakci polí z modelu. Takové scénáře můžou zahrnovat ty, ve kterých uživatel nahraje dokument, ale typ dokumentu není explicitně známý. Dalším scénářem může být situace, kdy se naskenuje více dokumentů do jednoho souboru a soubor se odešle ke zpracování. Vaše aplikace pak potřebuje identifikovat dokumenty komponent a vybrat nejlepší model pro každý dokument.
V předchozích verzích operace prováděla implicitní klasifikaci, aby se rozhodla, model compose
který vlastní model nejlépe představuje odeslaný dokument. Implementace 2024-07-31-preview
model compose
operace nahradí implicitní klasifikaci z předchozích verzí explicitním krokem klasifikace a přidá podmíněné směrování.
Výhody nové operace vytváření modelů
Nová model compose
operace vyžaduje, abyste vytrénovat explicitní klasifikátor a poskytoval několik výhod.
Průběžné přírůstkové vylepšování. Konzistentně můžete zlepšit kvalitu klasifikátoru přidáním dalších vzorků a přírůstkovým zlepšením klasifikace. Toto vyladění zajistí, že vaše dokumenty budou vždy směrovány na správný model pro extrakci.
Dokončete kontrolu nad směrováním. Přidáním směrování založeného na spolehlivosti poskytnete prahovou hodnotu spolehlivosti pro typ dokumentu a odpověď klasifikace.
Během operace ignorujte konkrétní typy dokumentů. Dřívější implementace
model compose
operace vybrali nejlepší analytický model pro extrakci na základě skóre spolehlivosti, i když nejvyšší skóre spolehlivosti bylo relativně nízké. Poskytnutím prahové hodnoty spolehlivosti nebo explicitně nemapováním známého typu dokumentu z klasifikace na model extrakce můžete určité typy dokumentů ignorovat.Analyzujte více instancí stejného typu dokumentu. Při spárování s
splitMode
možností klasifikátorumodel compose
může operace rozpoznat více instancí stejného dokumentu v souboru a rozdělit soubor tak, aby zpracovával každý dokument nezávisle. PoužitísplitMode
umožňuje zpracování více instancí dokumentu v jednom požadavku.Podpora pro přidání funkcí Funkce, jako jsou pole dotazu nebo čárové kódy, lze také zadat jako součást parametrů modelu analýzy.
Přiřazený vlastní model je maximálně rozšířen na 500. Nová implementace
model compose
operace umožňuje přiřadit až 500 vytrénovaných vlastních modelů k jednomu složeného modelu.
Jak používat vytváření modelů
Začněte shromažďováním vzorků všech potřebných dokumentů včetně ukázek s informacemi, které by se měly extrahovat nebo ignorovat.
Vytrénujte klasifikátor uspořádáním dokumentů do složek, ve kterých jsou názvy složek typ dokumentu, který chcete použít v definici složeného modelu.
Nakonec vytrénujte model extrakce pro každý typ dokumentu, který chcete použít.
Po trénování modelů klasifikace a extrakce použijte sadu Document Intelligence Studio, klientské knihovny nebo rozhraní REST API k vytvoření klasifikačních a extrahovacích modelů do složeného modelu.
Pomocí parametru splitMode
můžete řídit chování rozdělení souboru:
- Nezaokrouhlovat. Celý soubor se považuje za jeden dokument.
- perPage. Každá stránka v souboru se považuje za samostatný dokument.
- auto. Soubor se automaticky rozdělí do dokumentů.
Fakturace a ceny
Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu stránek analyzovaných modelem podřízené analýzy. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. S přidáním explicitních poplatků za klasifikaci jsou účtovány pro klasifikaci všech stránek ve vstupním souboru. Další informace najdete na stránce s cenami funkce Document Intelligence.
Použití operace vytváření modelu
Začněte vytvořením seznamu všech ID modelů, které chcete vytvořit do jednoho modelu.
Vytvořte modely do jednoho ID modelu pomocí sady Studio, rozhraní REST API nebo klientských knihoven.
K analýze dokumentů použijte složené ID modelu.
Fakturace
Složené modely se účtují stejně jako jednotlivé vlastní modely. Ceny vycházejí z počtu analyzovaných stránek. Fakturace vychází z ceny extrakce stránek směrovaných do modelu extrakce. Další informace najdete na stránce s cenami funkce Document Intelligence.
- Při analýze dokumentu pomocí individuálního vlastního modelu nebo složeného vlastního modelu nedošlo ke změně cen.
Složené funkce modelů
Custom template
acustom neural
modely se dají skládat do jednoho složeného modelu napříč několika verzemi rozhraní API.Odpověď obsahuje vlastnost,
docType
která označuje, které složené modely byly použity k analýze dokumentu.U
custom template
modelů lze složený model vytvořit pomocí variant vlastní šablony nebo různých typů formulářů. Tato operace je užitečná, když příchozí formuláře patří do některé z několika šablon.Pro
custom neural
modely je osvědčeným postupem přidat všechny různé varianty jednoho typu dokumentu do jedné trénovací datové sady a trénovat na vlastním neurálním modelu. Operacemodel compose
je nejvhodnější pro scénáře, kdy máte dokumenty různých typů odesílaných k analýze.
Vytváření limitů modelu
model compose
Pomocí této operace můžete přiřadit až 500 modelů k jednomu ID modelu. Pokud počet modelů, které chci vytvořit, překročí horní mez složeného modelu, můžete použít jednu z těchto alternativ:Klasifikujte dokumenty před voláním vlastního modelu. Model pro čtení můžete použít a sestavit klasifikaci založenou na extrahovaném textu z dokumentů a určitých frází pomocí zdrojů, jako jsou kód, regulární výrazy nebo hledání.
Pokud chcete extrahovat stejná pole z různých strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů, zvažte použití vlastního neurálního modelu hlubokého učení. Přečtěte si další informace o rozdílech mezi vlastním modelem šablony a vlastním neurálním modelem.
Analýza dokumentu pomocí složených modelů je shodná s analýzou dokumentu pomocí jednoho modelu. Výsledek
Analyze Document
vrátídocType
vlastnost, která označuje, které z modelů komponent, které jste vybrali pro analýzu dokumentu.Operace
model compose
je aktuálně dostupná jenom pro vlastní modely natrénované pomocí popisků.
Kompatibilita složeného modelu
Vlastní typ modelu | Modely natrénované pomocí v2.1 a v2.0 | Vlastní šablony a neurální modely v3.1 a v3.0 | Vlastní šablony a neurální modely verze 4.0 Preview | Vlastní modely generování verze 4.0 Preview |
---|---|---|---|---|
Modely natrénované s verzí 2.1 a v2.0 | Nepodporuje se | Nepodporuje se | Nepodporuje se | Nepodporuje se |
Vlastní šablony a neurální modely v3.0 a v3.1 | Nepodporuje se | Podporováno | Podporováno | Nepodporuje se |
Vlastní šablony a neurální modely verze 4.0 Preview | Nepodporuje se | Podporováno | Podporováno | Nepodporuje se |
Vlastní modely generování verze 4.0 Preview | Nepodporuje se | Nepodporuje se | Nepodporuje se | Nepodporuje se |
Pokud chcete vytvořit model natrénovaný pomocí předchozí verze rozhraní API (verze 2.1 nebo starší), vytrénujte model pomocí rozhraní API verze 3.0 pomocí stejné datové sady s popiskem. Tím se zajistí, že model verze 2.1 se dá skládat s jinými modely.
U modelů, které se skládají pomocí verze 2.1 rozhraní API, se nadále podporují a nevyžadují žádné aktualizace.
Možnosti vývoje
Document Intelligence verze 4.0:2024-07-31-preview podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Vlastní model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Složený model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Funkce Document Intelligence v3.1:2023-07-31 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Vlastní model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Složený model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Funkce Document Intelligence v3.0:2022-08-31 (GA) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Vlastní model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Složený model | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK• Python SDK• Python SDK |
Document Intelligence v2.1 podporuje následující zdroje informací:
Funkce | Zdroje informací |
---|---|
Vlastní model | • Nástroj pro popisování document intelligence• ROZHRANÍ REST API • Sada SDK klientské knihovny• Kontejner Document Intelligence Dockeru |
Složený model | • Nástroj popisování dokumentace• REST API • Sada C# SDK • Java SDK• JavaScript SDK • Python SDK• Python SDK |
Další kroky
Naučte se vytvářet a vytvářet vlastní modely: