Document Intelligence Studio

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.0

Tento obsah se vztahuje na:Zaškrtnutív3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)nachová značka zaškrtnutív3.1

Document Intelligence Studio je online nástroj pro vizuální zkoumání, porozumění a integraci funkcí ze služby Document Intelligence do vašich aplikací. Použití nástroje Document Intelligence Studio k:

  • Přečtěte si další informace o různých možnostech funkce Document Intelligence.
  • Použijte prostředek Document Intelligence k testování modelů na ukázkových dokumentech nebo nahrání vlastních dokumentů.
  • Experimentujte s různými funkcemi doplňku a verze Preview, abyste přizpůsobili výstup vašim potřebám.
  • Trénujte vlastní klasifikační modely pro klasifikaci dokumentů.
  • Trénujte vlastní modely extrakce pro extrakci polí z dokumentů.
  • Získejte vzorový kód pro jazyk specifický SDKs pro integraci do vašich aplikací.

Rychlý start k analýze dokumentů pomocí analýzy dokumentů nebo předem připravených modelů vám umožní rychlý start sady Document Intelligence Studio. Vytvářejte vlastní modely a odkazujte na modely ve svých aplikacích pomocí jednoho z konkrétních SDKs jazyků a dalších rychlých startů.

Začínáme

Pokud studio navštěvujete poprvé, postupujte podle úvodní příručky a nastavte Si Studio pro použití.

Možnosti analýzy

  • Funkce Document Intelligence podporuje sofistikované možnosti analýzy. Studio umožňuje snadno konfigurovat možnosti doplňku jedním vstupním bodem (tlačítko Analyzovat možnosti).

  • V závislosti na scénáři extrakce dokumentů nakonfigurujte rozsah analýzy, rozsah stránek dokumentu, volitelnou detekci a prémiové funkce detekce.

    Snímek obrazovky s dialogovým oknem analyzovat možnosti

    Poznámka:

    Extrakce písem není vizualizována v nástroji Document Intelligence Studio. Můžete ale zkontrolovat část stylů výstupu JSON pro výsledky detekce písem.

✔️ Automatické označování dokumentů pomocí předem připravených modelů nebo jednoho z vašich vlastních modelů

  • Na stránce popisování vlastního modelu extrakce teď můžete dokumenty automaticky označovat pomocí některého z předem připravených modelů služby Document Intelligent Service nebo trénovaných modelů.

    Animovaný snímek obrazovky s automatickým popiskem v sadě Studio

  • U některých dokumentů je možné po spuštění automatického popisku duplikovat popisky. Nezapomeňte popisky upravit tak, aby na stránce popisků nebyly žádné duplicitní popisky.

    Snímek obrazovky zobrazující upozornění duplicitního popisku po automatickém popisování

✔️ Automatické popisování tabulek

  • Na stránce popisování vlastního modelu extrakce teď můžete tabulky v dokumentu automaticky označovat, aniž byste museli tabulky označovat ručně.

    Animovaný snímek obrazovky s automatickým popiskem tabulky v sadě Studio

✔️ Přidání testovacích souborů přímo do trénovací datové sady

  • Jakmile vytrénujete vlastní model extrakce, využijte testovací stránku ke zlepšení kvality modelu tak, že v případě potřeby nahrajete testovací dokumenty do trénovací datové sady.

  • Pokud se u některých popisků vrátí skóre nízké spolehlivosti, ujistěte se, že jsou správně označené. Pokud ne, přidejte je do trénovací datové sady a znovu oznamte, aby se zlepšila kvalita modelu.

Animovaný snímek obrazovky znázorňující, jak přidat testovací soubory do trénovací datové sady

✔️ Použití možností a filtrů seznamu dokumentů ve vlastních projektech

  • Pomocí stránky popisků vlastního modelu extrakce můžete snadno procházet trénovací dokumenty pomocí vyhledávání, filtrování a řazení podle funkce.

  • Zobrazení mřížky můžete využít k zobrazení náhledu dokumentů nebo k snadnějšímu procházení dokumentů pomocí zobrazení seznamu.

    Snímek obrazovky s možnostmi a filtry zobrazení seznamu dokumentů

✔️ Sdílení projektů

Podpora modelu Document Intelligence

  • Čtení: Vyzkoušejte funkci čtení funkce Funkce Document Intelligence k extrakci textových řádků, slov, rozpoznaných jazyků a rukou psaného stylu v případě zjištění. Začněte funkcí Čtení v sadě Studio. Prozkoumejte ukázkové dokumenty a dokumenty. Pomocí interaktivní vizualizace a výstupu JSON můžete pochopit, jak tato funkce funguje. Další informace a začínáme s rychlým startem sady Python SDK pro rozložení najdete v přehledučtení.

  • Rozložení: Vyzkoušejte funkci Rozložení funkce Document Intelligence k extrakci textu, tabulek, značek výběru a informací o struktuře. Začněte funkcí Rozložení sady Studio. Prozkoumejte ukázkové dokumenty a dokumenty. Pomocí interaktivní vizualizace a výstupu JSON můžete pochopit, jak tato funkce funguje. Další informace a začínáme s rychlým startem sady Python SDK pro rozložení najdete v přehledu rozložení.

  • Předem připravené modely: Předem připravené modely funkce Document Intelligence umožňují přidat do aplikací a toků inteligentní zpracování dokumentů, aniž byste museli trénovat a vytvářet vlastní modely. Začněte například funkcí Faktura za studio. Prozkoumejte ukázkové dokumenty a dokumenty. Pomocí interaktivní vizualizace, seznamu extrahovaných polí a výstupu JSON zjistěte, jak tato funkce funguje. Další informace a začínáme s rychlým startem sady Python SDK pro předem připravenou fakturu najdete v přehledumodelů.

  • Vlastní modely extrakce: Vlastní modely funkce Document Intelligence umožňují extrahovat pole a hodnoty z modelů trénovaných s vašimi daty, které jsou přizpůsobené vašim formulářům a dokumentům. Pokud chcete extrahovat data z více typů formulářů, vytvořte samostatné vlastní modely nebo zkombinujte dva nebo více vlastních modelů a vytvořte složený model. Začněte funkcí Vlastních modelů sady Studio. Pomocí průvodce nápovědy, rozhraní popisků, kroků trénování a vizualizací zjistěte, jak tato funkce funguje. Otestujte vlastní model pomocí ukázkových dokumentů a iterujte ho a vylepšete ho. Další informace najdete v přehledu vlastních modelů, kde najdete další informace.

  • Vlastní klasifikační modely: Klasifikace dokumentů je nový scénář podporovaný funkcí Document Intelligence. rozhraní API klasifikátoru dokumentů podporuje scénáře klasifikace a rozdělení. Trénování klasifikačního modelu pro identifikaci různých typů dokumentů, které vaše aplikace podporuje. Vstupní soubor klasifikačního modelu může obsahovat více dokumentů a klasifikuje každý dokument v přidruženém rozsahu stránek. Další informace najdete v modelech vlastní klasifikace.

  • Možnosti doplňku: Funkce Document Intelligence teď podporují sofistikovanější možnosti analýzy. Tyto volitelné funkce je možné povolit a zakázat v sadě Studio pomocí Analze Options tlačítka na každé stránce modelu. K dispozici jsou čtyři možnosti doplňku: highResolution, vzorec, písmo a možnosti extrakce čárových kódů. Další informace najdete v tématuMožnosti doplňku.

Další kroky