Nejčastější dotazy ke službě Azure AI Document Intelligence

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview)Zaškrtnutív3.1 (GA)Zaškrtnutív3.0 (GA)Zaškrtnutív2.1 (GA)

Obecné koncepty

Co je Azure AI Document Intelligence a co se stalo s Azure AI Rozpoznávání formulářů?

Azure AI Document Intelligence je cloudová služba, která pomocí modelů strojového učení extrahuje páry klíč/hodnota, text a tabulky z dokumentů. Vrácený výsledek je strukturovaný výstup JSON. Případy použití funkce Document Intelligence zahrnují automatizované zpracování dat, vylepšené strategie řízené daty a rozšířené možnosti vyhledávání dokumentů.

Document Intelligence je součástí služeb Azure AI. Služby Azure AI zahrnují všechny služby, které se dříve označovaly jako Azure Cognitive Services a Aplikace Azure lied AI Services.

Předchozí název funkce Document Intelligence byl Rozpoznávání formulářů Azure AI. Rozpoznávání formulářů se oficiálně stal dokumentovou inteligencí v červenci 2023.

Ceny se nemění. Názvy služeb Cognitive Services a použité služby AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníkech a cenových rozhraních API.

Neexistují žádné zásadní změny rozhraní API nebo klientských knihoven (SDK). Rozhraní REST API a sada SDK verze 2024-02-29-preview, 2023-10-31-preview a novější se přejmenují document intelligence.

Některé platformy stále čekají na aktualizaci přejmenování. V dokumentaci Microsoftu všechny zmínky o Rozpoznávání formulářů a funkci Document Intelligence odkazují na stejnou službu Azure.

Jak souvisí funkce Document Intelligence s dokumentem generující umělou inteligenci?

K chatování s dokumenty, generování poutavého obsahu z těchto dokumentů a přístupu k modelům služby Azure OpenAI na vašich datech můžete použít řešení generování dokumentů AI. Díky kombinaci funkcí Document Intelligence a Azure OpenAI v Azure AI můžete vytvořit podnikovou aplikaci pro bezproblémovou interakci s dokumenty pomocí přirozených jazyků, snadno najít odpovědi a získat cenné přehledy a vygenerovat nový a poutavý obsah z existujících dokumentů. Další podrobnosti najdete v blogu technické komunity.

Jak souvisí funkce Document Intelligence s generováním rozšířeného načítání?

Sémantické vytváření bloků dat je klíčovým krokem při načítání rozšířené generace (RAG) k zajištění efektivního úložiště a načítání. Model rozložení Document Intelligence nabízí komplexní řešení pro možnosti pokročilé extrakce obsahu a analýzy struktury dokumentů.

S modelem rozložení můžete snadno extrahovat text a strukturální prvky a rozdělit velká těla textu na menší, smysluplné bloky založené na sémantickém obsahu, nikoli na libovolné rozdělení. Extrahované informace pak můžete pohodlně vyextrahovat do formátu Markdownu, abyste mohli definovat sémantickou strategii vytváření bloků dat na základě poskytnutých stavebních bloků. Další podrobnosti najdete v přehledu rag ve funkci Document Intelligence.

Které případy použití funkce Document Intelligence vyžadují zvláštní pozornost?

Pečlivě zvažte projekty zpracování dokumentů, které zahrnují finanční data, chráněná zdravotní data, osobní údaje nebo vysoce citlivá data.

Ujistěte se, že splňuje všechny požadavky specifické pro národní/regionální a průmyslové odvětví.

Jaké jazyky funkce Document Intelligence podporuje?

Univerzální modely založené na hlubokém učení ve funkci Document Intelligence podporují mnoho jazyků, které můžou extrahovat vícejazyčný text z obrázků a dokumentů, včetně textových čar se smíšenými jazyky.

Podpora jazyků se liší podle funkcí služby Document Intelligence. Úplný seznam rukou psaného a tištěného textu, který funkce Document Intelligence podporuje, najdete v tématu Podpora jazyků.

Je funkce Document Intelligence dostupná v oblasti Azure?

Funkce Document Intelligence je obecně dostupná v mnoha oblastech globální infrastruktury Azure 60 a více.

Zvolte oblast , která je pro vás a vaše zákazníky nejvhodnější.

Integruje se funkce Document Intelligence s jinými služby Microsoft?

Ano, funkce Document Intelligence se integruje s následujícími službami:

Jak souvisí funkce Document Intelligence s optického rozpoznávání znaků?

Document Intelligence je cloudová služba, která zahrnuje optické rozpoznávání znaků (OCR), analýzu textu a vlastní klasifikaci textu ze služeb Azure AI.

Funkce Document Intelligence používá technologii OCR k detekci a extrahování informací z typeface a ručně psaných textových dokumentů podporovaných umělou inteligencí k poskytování větší struktury a informací pro extrakci textu.

Jak dlouho je můj vlastní model k dispozici pro použití?

Model má stejný životní cyklus jako verze rozhraní API, kterou používáte k jeho trénování. Vlastní modely natrénované s obecnou dostupností (GA) rozhraní API mají stejný životní cyklus jako verze rozhraní API. Pokud je verze rozhraní API zastaralá, model už není k dispozici pro odvozování. Modely natrénované pomocí verze Preview rozhraní API mají také stejný životní cyklus jako rozhraní API verze Preview.

Počítejte s vyřazením rozhraní API verze Preview do tří měsíců od aktualizované verze rozhraní API verze Preview nebo novější verze rozhraní API ga.

Jaké je skóre přesnosti a jak se počítá?

Výstup operace build vlastního modelu (verze 3.0 a novější) nebo train (v2.1) zahrnuje odhadované skóre přesnosti. Toto skóre představuje schopnost modelu přesně předpovědět popisovanou hodnotu ve vizuálně podobném dokumentu.

Přesnost se měří v rozsahu procentuální hodnoty od 0 % (nízká) do 100 % (vysoká).

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Jak můžu zlepšit skóre přesnosti?

Odchylky ve vizuální struktuře dokumentů můžou ovlivnit přesnost modelu. Tady je několik tipů:

  • Do trénovací datové sady zahrňte všechny varianty dokumentu. Varianty zahrnují různé formáty; Například digitální a naskenované soubory PDF.

  • Oddělte vizuálně odlišné typy dokumentů a trénujte různé modely.

  • Ujistěte se, že nemáte nadbytečné popisky.

  • U popisků podpisů a oblastí nezahrnujte okolní text.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Jaké je skóre spolehlivosti a jak se počítá?

Skóre spolehlivosti označuje pravděpodobnost měřením stupně statistické jistoty, že se extrahovaný výsledek zjistí správně.

Rozsah hodnot spolehlivosti je procento od 0 % (nízké) do 100 % (vysoké). Nejlepší je cílit na skóre 80 % nebo vyšší. V případě citlivějších případů, jako jsou finanční nebo lékařské záznamy, doporučujeme skóre téměř 100 %. Můžete také vyžadovat lidskou kontrolu.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Jak můžu zlepšit skóre spolehlivosti?

Po operaci analýzy zkontrolujte výstup JSON. confidence Prozkoumejte hodnoty pro každý výsledek klíče a hodnoty v pageResults uzlu. Měli byste se také podívat na skóre spolehlivosti v readResults uzlu, které odpovídá operaci čtení textu. Spolehlivost výsledků čtení nemá vliv na spolehlivost výsledků extrakce klíč/hodnota, takže byste měli zkontrolovat obojí. Tady je několik tipů:

  • Pokud je skóre spolehlivosti objektu readResults nízké, zvyšte kvalitu vstupních dokumentů.

  • Pokud je skóre spolehlivosti objektu pageResults nízké, ujistěte se, že dokumenty, které analyzujete, mají stejný typ.

  • Zvažte začlenění lidské kontroly do pracovních postupů.

  • Používejte formuláře, které mají v každém poli různé hodnoty.

  • Pro vlastní modely použijte větší sadu trénovacích dokumentů. Označování dalších dokumentů učí váš model rozpoznávat pole s větší přesností.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Co je ohraničující rámeček?

Ohraničující rámeček (polygon ve verzi 3.0 a novějších verzích) je abstraktní obdélník, který obklopuje textové prvky v dokumentu nebo formuláři. Používá se jako referenční bod pro detekci objektů.

Ohraničující rámeček určuje pozici pomocí souřadnicové roviny x a y zobrazené v matici čtyř číselných párů. Každý pár představuje roh pole v následujícím pořadí: vlevo nahoře, vpravo nahoře, vpravo dole, vlevo dole.

Pro obrázek jsou souřadnice v pixelech. V případě PDF jsou souřadnice v palcích.

Může funkce Document Intelligence pomoct klasifikovat dokumenty?

Funkce Document Intelligence poskytuje vlastní klasifikační modely, které můžou analyzovat dokumenty s jedním souborem nebo více soubory a identifikovat, jestli vstupní soubor obsahuje některý z trénovaných typů dokumentů. Služba podporuje následující scénáře:

  • Jeden soubor, který obsahuje jeden typ dokumentu, například formulář žádosti o půjčku.

  • Jeden soubor, který obsahuje více dokumentů. Příkladem je balíček žádosti o půjčku, který obsahuje formulář žádosti o půjčku, výplatu a bankovní výpis.

  • Jeden soubor, který obsahuje více instancí stejného dokumentu. Příkladem je kolekce naskenovaných faktur.

Další informace najdete v přehledu vlastních klasifikačních modelů.

Vývoj aplikací

Jaké jsou možnosti vývoje pro funkci Document Intelligence?

Funkce Document Intelligence nabízí nejnovější možnosti vývoje na následujících platformách:

Kde najdu podporovanou verzi rozhraní API pro nejnovější sady SDK programovacího jazyka?

Tato tabulka obsahuje odkazy na nejnovější verze sady SDK a ukazuje vztah mezi podporovanou sadou Document Intelligence SDK a verzemi rozhraní API:

Referenční informace k sadě Azure SDK podporovaného jazyka Podporované verze rozhraní API
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0 v2.1
v2.0

Další informace naleznete v tématu Podporované klienty pro v4.0 a podporované klienty pro v3.1.

Jaký je rozdíl mezi funkcí Document Intelligence v3.0 a v2.1 a jak migrovat na nejnovější verzi?

Kvůli lepší použitelnosti přináší funkce Document Intelligence v3.0 plně přepracovanou klientskou knihovnu. Abyste mohli úspěšně používat nejnovější funkce rozhraní DOCUMENT Intelligence API, potřebujete nejnovější sadu SDK a kód aplikace se musí aktualizovat tak, aby používal nové klienty.

Tato tabulka obsahuje odkazy na podrobné pokyny pro migraci na nejnovější verzi funkce Document Intelligence:

Jazyk nebo rozhraní API Průvodce migrací
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Které formáty souborů funkce Document Intelligence podporují? Existují omezení velikosti vstupních dokumentů?

Pokud chcete získat nejlepší výsledky, podívejte se na požadavky na vstup.

Jak můžu zadat rozsah stránek, které se mají analyzovat v dokumentu?

Pomocí parametru pages (podporovaného v 2.1, v3.0 a novějších verzích rozhraní REST API) můžete zadat stránky pro vícestránkové dokumenty PDF a TIFF. Akceptované vstupy zahrnují následující rozsahy:

  • Jednotlivé stránky. Pokud zadáte 1, 2například , stránky 1 a 2 se zpracovávají.
  • Konečné rozsahy. Pokud zadáte 2-5například , stránky 2 až 5 se zpracovávají.
  • Rozsahy s otevřeným koncem Pokud například zadáte 5-, všechny stránky ze stránky 5 se zpracovávají. Pokud zadáte -10, stránky 1 až 10 se zpracovávají.

Tyto parametry můžete kombinovat a rozsahy se můžou překrývat. Pokud zadáte -5, 1, 3, 5-10například , stránky 1 až 10 se zpracovávají.

Služba přijme požadavek, pokud může zpracovat aspoň jednu stránku dokumentu. Například použití 5-100 v pětistráně dokumentu je platný vstup, což znamená, že se zpracuje stránka 5.

Pokud nezadáte rozsah stránek, zpracuje se celý dokument.

K dispozici jsou jak Document Intelligence Studio, tak i nástroj FOTT Sample Labeling. Který z nich mám použít?

Ve většině případů doporučujeme Nástroj Document Intelligence Studio , protože může zkrátit dobu konfigurace prostředků Document Intelligence a služeb úložiště.

Zvažte použití nástroje pro testování formátu OCR (FOTT) pro následující scénáře:

Limity a ceny služeb

Jak Azure vypočítá cenu za použití funkce Document Intelligence?

Fakturace funkce Document Intelligence se počítá měsíčně na základě typu modelu a počtu analyzovaných stránek. Tady jsou některé podrobnosti:

  • Když odešlete dokument k analýze, služba analyzuje všechny stránky, pokud nezadáte rozsah stránek pomocí parametru pages v požadavku. Když služba analyzuje dokumenty Microsoft Excelu a PowerPointu prostřednictvím modelu čtení, OCR nebo rozložení, počítá každý excelový list a powerpointový snímek jako jednu stránku.

  • Když služba analyzuje soubory PDF a TIFF, spočítá každou stránku v souboru PDF nebo každý obrázek v souboru TIFF jako jednu stránku bez maximálního omezení znaků.

  • Když služba analyzuje soubory Microsoft Wordu a HTML, které modely čtení a rozložení podporují, počítá stránky v blocích 3 000 znaků. Pokud například dokument obsahuje 7 000 znaků, budou dvě stránky se 3 000 znaky a jedna stránka s 1 000 znaky sečtou až do celkového počtu tří stránek.

  • Pokud k analýze souborů Microsoft Wordu, Excelu, PowerPointu a HTML, vložených nebo propojených obrázků používáte model čtení nebo rozložení, nejsou podporované. Služba je proto nezapočítává jako přidané obrázky.

  • Trénování vlastního modelu je vždy zdarma pomocí funkce Document Intelligence. Účtují se vám poplatky jenom v případech, kdy služba k analýze dokumentu používá model.

  • Ceny kontejnerů jsou stejné jako ceny cloudových služeb.

  • Funkce Document Intelligence nabízí bezplatnou úroveň (F0), kde můžete otestovat všechny funkce Funkce Document Intelligence.

  • Funkce Document Intelligence má cenový model založený na závazku pro velké úlohy.

Přečtěte si další informace o cenových možnostech služby Azure AI Document Intelligence.

Jak můžu zkontrolovat využití funkce Document Intelligence a odhadnout cenu?

Metriky využití najdete na řídicím panelu metrik na webu Azure Portal. Na řídicím panelu se zobrazí počet stránek, které Azure AI Document Intelligence zpracuje. Odhadované náklady na prostředek můžete zkontrolovat pomocí cenové kalkulačky Azure. Podrobné pokyny najdete v tématu Kontrola využití a odhadu nákladů.

Jaké jsou osvědčené postupy pro zmírnění omezování?

Funkce Document Intelligence využívá automatické škálování k poskytování požadovaných výpočetních prostředků na vyžádání a zároveň nízké náklady zákazníků. Pokud chcete omezit omezování během automatického škálování, doporučujeme následující přístup:

  • Implementujte do své aplikace logiku opakování pokusů.

  • Pokud zjistíte, že dochází k omezování počtu POST požadavků, zvažte přidání zpoždění mezi požadavky.

  • Zvyšujte zatížení postupně. Vyhněte se ostrým změnám.

  • Vytvořte žádost o podporu pro zvýšení limitu transakcí za sekundu (TPS).

Přečtěte si další informace o kvótách a omezeních služby Document Intelligence.

Jak dlouho trvá analýza dokumentu?

Doba analýzy dokumentu závisí na velikosti (například počtu stránek) a přidruženém obsahu na každé stránce.

Funkce Document Intelligence je víceklientská služba, kde latence podobných dokumentů je srovnatelná, ale ne vždy identická. Latence je doba, kterou vyžaduje, aby server rozhraní API zpracovával a zpracovával příchozí požadavek a doručil odchozí odpověď klientovi. Občasná proměnlivost latence a výkonu je nedílnou součástí jakékoli bezstavové asynchronní služby založené na mikroslužbách, která zpracovává obrázky a velké dokumenty ve velkém měřítku.

I když nepřetržitě vertikálně navyšujeme kapacitu hardwaru a kapacitu a možnosti škálování, můžete stále mít problémy s latencí za běhu.

Vlastní modely

Návody sestavit nejlepší trénovací data?

Při použití vlastního modelu Document Intelligence poskytujete vlastní trénovací data. Tady je několik tipů, které vám pomůžou efektivně trénovat modely:

  • Pokud je to možné, používejte místo souborů PDF založených na obrázku text. Jedním ze způsobů, jak identifikovat soubor PDF založený na obrázku, je vyzkoušet výběr konkrétního textu v dokumentu. Pokud můžete vybrat jenom celý obrázek textu, dokument je založený na obrázku, nikoli na textu.

  • Uspořádejte trénovací dokumenty pomocí podsložky pro každý formát (JPEG/JPG, PNG, BMP, PDF nebo TIFF).

  • Použijte formuláře, které mají dokončená všechna dostupná pole.

  • V každém poli používejte formuláře s odlišnými hodnotami.

  • Pokud jsou vaše obrázky nízké kvality, použijte větší datovou sadu (více než pět trénovacích dokumentů).

Přečtěte si další informace o vytváření trénovací datové sady.

Jaké jsou osvědčené postupy pro trénování vysoce přesného vlastního modelu?

Úroveň přesnosti modelu závisí na kvalitě trénovacích materiálů. Tady je několik tipů:

  • Určete, jestli potřebujete použít jeden nebo více modelů složených do jednoho modelu.

  • Přesnost modelu se může snížit, pokud máte různé formáty analyzované pomocí jednoho modelu. Naplánujte segmentování datové sady do složek, kde každá složka představuje jedinečnou šablonu. Vytrénujte jeden model na složku a vytvořte výsledné modely do jednoho koncového bodu.

  • Vlastní formuláře spoléhají na konzistentní šablonu vizuálu. Pokud má formulář varianty formátů a konců stránek, zvažte segmentaci datové sady pro trénování více modelů.

  • Ujistěte se, že máte vyváženou datovou sadu díky tomu, že se započítávání formátů, typů dokumentů a struktury.

Přečtěte si další informace o složených modelech.

Můžu přetrénovat vlastní model?

Funkce Document Intelligence nemá explicitní operaci opětovného trénování. Každá operace trénování vygeneruje nový model.

Pokud zjistíte, že váš model potřebuje přetrénování, přidejte do trénovací datové sady další ukázky a vytrénujte nový model.

Kolik vlastních modelů můžu vytvořit do jednoho vlastního modelu?

Pomocí operace Vytvoření modelu můžete přiřadit až 200 modelů k jednomu ID modelu. Když vytvoříte Analyze Document požadavek s složeným ID modelu, funkce Document Intelligence klasifikuje odeslaný formulář, zvolí nejlepší model a vrátí výsledky. Vytváření modelů je aktuálně k dispozici pouze pro vlastní modely natrénované pomocí popisků.

Analýza dokumentu pomocí složených modelů je shodná s analýzou dokumentu pomocí jednoho modelu. Výsledek Analyze Document vrátí docType vlastnost, která označuje, které z modelů komponent, které jste vybrali pro analýzu dokumentu. Při analýze dokumentu pomocí individuálního vlastního modelu nebo složeného vlastního modelu nedošlo ke změně cen.

Přečtěte si další informace o složených modelech.

Pokud počet modelů, které chci vytvořit, překročí horní limit složeného modelu, jaké jsou alternativy?

Můžete použít jednu z těchto alternativ:

  • Klasifikujte dokumenty před voláním vlastního modelu. Model pro čtení můžete použít a sestavit klasifikaci na základě extrahovaného textu z dokumentů a určitých frází pomocí zdrojů, jako jsou kód, regulární výrazy nebo hledání.

  • Pokud chcete extrahovat stejná pole z různých strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů, zvažte použití vlastního neurálního modelu hlubokého učení. Přečtěte si další informace o rozdílech mezi vlastním modelem šablony a vlastním neurálním modelem.

Návody upřesnit model nad rámec počátečního trénování?

Každá trénovací operace vygeneruje nový model.

  1. Vytvořte datovou sadu pro novou šablonu.

  2. Označení a trénování nového modelu

  3. Ověřte, že nový model funguje dobře pro vaše konkrétní typy dokumentů.

  4. Vytvořte nový model s existujícím modelem do jednoho koncového bodu. Funkce Document Intelligence pak může určit nejlepší model pro každý dokument, který se má analyzovat.

Přečtěte si další informace o složených modelech.

Vytvářím vlastní model. Co vrátí popisek detekce podpisu?

Detekce podpisu hledá přítomnost podpisu, nikoli identitu osoby, která dokument podepíše.

Pokud model vrátí nepodepsaný podpis pro detekci podpisu, v definovaném poli nebyl nalezen podpis.

Co mám zvážit a jaké jsou osvědčené postupy pro extrakci tabulek z dokumentů?

S modelem rozložení Document Intelligence můžete začít extrahovat texty, tabulky, značky výběru a strukturovat informace z dokumentů a obrázků. Můžete také zvážit následující faktory:

  • Jsou data, která chcete extrahovat jako tabulku, a je struktura tabulky smysluplná?

  • Pokud data nejsou ve formátu tabulky, můžou se data vejít do dvojrozměrné mřížky?

  • Pokrývají vaše tabulky více stránek? Pokud ano, abyste nemuseli všechny stránky označovat, rozdělte soubor PDF na stránky před odesláním do funkce Document Intelligence. Po analýze po zpracování stránek do jedné tabulky.

  • Pokud vytváříte vlastní modely, projděte si popisky jako tabulky. Dynamické tabulky mají pro každý sloupec proměnlivý počet řádků. Pevné tabulky mají konstantní počet řádků pro každý sloupec.

Jak můžu přesunout vytrénované modely z jednoho prostředí (například beta verze) do jiného (například produkčního prostředí)?

Pomocí rozhraní API pro kopírování můžete kopírovat vlastní modely z jednoho účtu Document Intelligence do jiných, které existují v jakékoli podporované geografické oblasti. Podrobné pokyny najdete v tématu Zotavení po havárii.

Operace kopírování je omezená na kopírování modelů v konkrétním cloudovém prostředí, ve kterém jste model natrénovali. Kopírování modelů z veřejného cloudu do cloudu Azure Government se například nepodporuje.

Proč se mi při spouštění vlastního trénování účtovalo rozložení?

K vygenerování popisků datové sady se vyžaduje rozložení. Pokud datová sada, kterou používáte pro vlastní trénování, nemá k dispozici soubory popisků, služba je vygeneruje za vás.

Účet úložiště

Před několika dny jsem měl přístup ke svému účtu úložiště. Proč mám potíže s opětovným připojením?

Při vytváření sdíleného přístupového podpisu je výchozí doba trvání 48 hodin. Po 48 hodinách musíte vytvořit nový token.

Zvažte nastavení delší doby trvání pro dobu, po kterou používáte účet úložiště s funkcí Document Intelligence.

Pokud je můj účet úložiště za virtuální sítí nebo bránou firewall, jak k datům udělím přístup funkce Document Intelligence?

Pokud máte účet úložiště Azure chráněný virtuální sítí nebo bránou firewall, funkce Document Intelligence nemá přímý přístup k vašemu účtu úložiště. Přístup k privátnímu účtu úložiště Azure a ověřování ale podporují spravované identity pro prostředky Azure. Když používáte spravovanou identitu, může služba Document Intelligence přistupovat k vašemu účtu úložiště pomocí přiřazených přihlašovacích údajů.

Pokud máte v úmyslu analyzovat data účtu privátního úložiště pomocí FUNKCE FOTT, musíte nástroj nasadit za virtuální sítí nebo bránou firewall.

Naučte se vytvářet a používat spravovanou identitu pro prostředek Document Intelligence.

Document Intelligence Studio

Jaká oprávnění potřebuji pro přístup k sadě Document Intelligence Studio?

Pro přístup k sadě Document Intelligence Studio potřebujete aktivní účet Azure a předplatné s alespoň rolí čtenáře.

Pro analýzu dokumentů a předem připravené modely jsou zde požadavky na role pro uživatelské scénáře:

  • Basic

  • Rozšířený

    • Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků nebo prostředku Document Intelligence. Role Přispěvatel neumožňuje vypisovat klíče pro Cognitive Services. Pokud chcete používat Document Intelligence Studio, stále potřebujete roli uživatele služeb Cognitive Services.

Pro projekty vlastního modelu jsou zde požadavky na role pro scénáře uživatelů:

  • Basic

    • Uživatel služeb Cognitive Services: Tuto roli potřebujete pro prostředek více služeb Document Intelligence nebo Cognitive Services k trénování vlastního modelu nebo analýze pomocí natrénovaných modelů.

    • Přispěvatel dat objektů blob úložiště: Pro účet úložiště potřebujete tuto roli k vytvoření dat projektu a popisku dat.

  • Rozšířený

    • Přispěvatel účtu úložiště: Tuto roli potřebujete pro účet úložiště k nastavení sdílení prostředků mezi zdroji (CORS). Jednorázovým úsilím je použít stejný účet úložiště.

      Role Přispěvatel neumožňuje přístup k datům v objektu blob. Pokud chcete používat Document Intelligence Studio, stále potřebujete roli Přispěvatel dat v objektech blob úložiště.

    • Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků a prostředků. Role Přispěvatel vám neuděluje přístup k používání vytvořených prostředků nebo úložiště. Pokud chcete používat Document Intelligence Studio, stále potřebujete základní role.

Další informace najdete v tématu Předdefinované role Microsoft Entra a části týkající se přiřazení rolí Azure v rychlém startu k sadě Document Intelligence Studio.

V dokumentu mám více stránek. Proč se v nástroji Document Intelligence Studio analyzují jenom dvě stránky?

U prostředků úrovně Free (F0) se analyzují pouze první dvě stránky bez ohledu na to, jestli používáte Document Intelligence Studio, rozhraní REST API nebo sady SDK.

V Nástroji Document Intelligence Studio vyberte tlačítko Nastavení (ozubené kolo), vyberte kartu Prostředky a zkontrolujte cenovou úroveň, kterou používáte k analýze dokumentů. Pokud chcete analyzovat všechny stránky v dokumentu, přejděte na placený prostředek (S0).

Jak můžu změnit adresáře nebo předplatná v nástroji Document Intelligence Studio?

Pokud chcete změnit adresář v nástroji Document Intelligence Studio, vyberte tlačítko Nastavení (ozubené kolo). V části Adresář vyberte adresář ze seznamu a pak vyberte Přepnout adresář. Po přepnutí adresáře se zobrazí výzva k opětovnému přihlášení.

Pokud chcete změnit předplatné nebo prostředek, přejděte na kartu Prostředek v části Nastavení.

Proč dochází k chybě úložiště u sdílení projektu, automatického popisování nebo operace upgradu OCR při konfiguraci prostředku účtu úložiště s bránou firewall nebo virtuální sítí?

Informace o nastavení prostředků Azure najdete ve spravovaných identitách pro funkci Document Intelligence .

Proč se mi při konfiguraci prostředku Document Intelligence s bránou firewall nebo bránou firewall zobrazuje chyba Odepření přístupu kvůli pravidlům virtuální sítě nebo brány firewall při automatickém označování nebo upgradu OCR?

Musíte přidat vyhrazenou IP adresu 20.3.165.95 do seznamu povolených pro váš prostředek Document Intelligence.

Můžu znovu použít nebo přizpůsobit prostředí popisování z Document Intelligence Studia a sestavit ho do vlastní aplikace?

Ano. Prostředí pro označování z Document Intelligence Studia je opensourcové v úložišti Toolkit.

Proč se při otevírání vlastního projektu zobrazuje chyba "Rozpoznávání formulářů Nenalezena"?

Zdroj document Intelligence svázaný s tímto vlastním projektem byl odstraněn nebo přesunut do jiné skupiny prostředků. Tento problém můžete vyřešit dvěma způsoby:

  • Znovu vytvořte prostředek Document Intelligence ve stejném předplatném a skupině prostředků se stejným názvem.

  • Znovu vytvořte vlastní projekt s migrovaným prostředkem Document Intelligence a zadejte stejný účet úložiště.

Kontejnery

Potřebuji připojení k internetu pro používání kontejnerů Document Intelligence?

Ano. Kontejnery Document Intelligence vyžadují připojení k internetu k odesílání fakturačních údajů do Azure. Přečtěte si další informace o zabezpečení kontejnerů Azure.

Jaký je rozdíl mezi odpojenými a připojenými kontejnery?

Připojení kontejnery odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. U připojených kontejnerů se k odesílání fakturačních údajů do Azure vyžaduje připojení k internetu.

Odpojené kontejnery umožňují používat rozhraní API, která jsou odpojená od internetu. Fakturační údaje se neposílají přes internet. Místo toho se vám budou účtovat poplatky na základě zakoupené úrovně závazku. V současné době je využití odpojeného kontejneru k dispozici pro vlastní modely Document Intelligence a faktury.

Funkce modelu poskytované v připojených a odpojených kontejnerech jsou stejné a podporují je funkce Document Intelligence v2.1.

Jaká data odesílají připojené kontejnery do cloudu?

Připojené kontejnery Document Intelligence odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. Připojení kontejnery neodesílají do Microsoftu zákaznická data, například obrázek nebo text analyzovaný.

Příklad informací, které připojené kontejnery odesílají Do Microsoftu za účelem fakturace, najdete v nejčastějších dotazech ke kontejnerům Azure AI.

Proč se mi zobrazuje chyba Kontejner není v platném stavu. Ověření předplatného selhalo se stavem OutOfQuota, klíč rozhraní API je mimo kvótu?

Připojené kontejnery Document Intelligence odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. Tuto zprávu můžete získat, pokud kontejnery nemůžou komunikovat s koncovým bodem fakturace.

Můžu použít místní úložiště pro kontejner s popisky ukázky funkce Document Intelligence (FOTT)?

FOTT má verzi, která používá místní úložiště. Na počítači s Windows musí být nainstalovaná verze. Můžete ho nainstalovat z tohoto umístění.

Na stránce projektu zadejte identifikátor URI složky popisku jako /shared nebo /shared/sub-dir, pokud jsou soubory popisků v podadresáři. Všechny ostatní chování nástroje popisování v ukázce document intelligence jsou stejné jako hostovaná služba.

Jaký je osvědčený postup vertikálního navýšení kapacity?

Pro asynchronní volání můžete spustit více kontejnerů se sdíleným úložištěm. Kontejner, který zpracovává POST volání analýzy, ukládá výstup do úložiště. Pak může jakýkoli jiný kontejner načíst výsledky z úložiště a obsluhovat GET volání. ID požadavku není svázané s kontejnerem.

Pro synchronní volání můžete spustit více kontejnerů, ale pouze jeden kontejner obsluhuje požadavek. Vzhledem k tomu, že se jedná o blokující volání, může jakýkoli kontejner z fondu odeslat požadavek a odeslat odpověď. V této části je na žádost vázán pouze jeden kontejner a nevyžaduje se žádné dotazování.

Jak nastavím kontejnery se sdíleným úložištěm?

Kontejnery používají Mounts:Shared vlastnost při spouštění pro zadání sdíleného úložiště pro ukládání souborů zpracování. Informace o použití této vlastnosti najdete v dokumentaci ke kontejnerům.

Ochrana osobních údajů a zabezpečení

Jaké jsou metody a požadavky na ověřování požadavků na služby Azure AI?

Každý požadavek na službu Azure musí obsahovat hlavičku ověřování. Požadavek můžete ověřit pomocí několika metod:

Ukládá funkce Document Intelligence moje data?

U všech funkcí funkce Document Intelligence dočasně ukládá data a výsledky ve službě Azure Storage ve stejné oblasti jako požadavek. Data se pak odstraní do 24 hodin od odeslání žádosti o analýzu.

Přečtěte si další informace o datech, ochraně osobních údajů a zabezpečení pro funkci Document Intelligence.

Jak jsou moje vytrénované vlastní modely uložené a používané ve funkci Document Intelligence?

Dočasné výstupy po analýze a označování se ukládají do stejného umístění Azure Storage, kam ukládáte trénovací data. Vytrénované vlastní modely se ukládají ve službě Azure Storage ve stejné oblasti a logicky jsou izolované pomocí vašich přihlašovacích údajů k předplatnému Azure a rozhraní API.

Další nápověda a podpora

Kde najdu další řešení pro své otázky k funkcím Document Intelligence v Azure AI?

Microsoft Q&A je domovská stránka technických otázek a odpovědí v Microsoftu. Dotazy specifické pro funkci Document Intelligence můžete filtrovat.

Co mám dělat, když služba nerozpozná konkrétní text nebo ho rozpozná nesprávně, když označím dokumenty?

Model OCR funkce Document Intelligence průběžně aktualizujeme a vylepšujeme. Tým document intelligence můžete poslat e-mailem. Pokud je to možné, nasdílejte ukázkový dokument se zvýrazněným problémem.