Q: Jaké je skóre přesnosti a jak se počítá?

Výstup operace build vlastního modelu (verze 3.0 a novější) nebo train (v2.1) zahrnuje odhadované skóre přesnosti. Toto skóre představuje schopnost modelu přesně předpovědět popisovanou hodnotu ve vizuálně podobném dokumentu. Přesnost se měří v rozsahu procentuální hodnoty od 0 % (nízká) do 100 % (vysoká). Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Question 1

Co je Azure AI Document Intelligence a co se stalo s Azure AI Rozpoznávání formulářů?

Accepted Answer

Azure AI Document Intelligence je cloudová služba, která pomocí modelů strojového učení extrahuje páry klíč/hodnota, text a tabulky z dokumentů. Vrácený výsledek je strukturovaný výstup JSON. Případy použití funkce Document Intelligence zahrnují automatizované zpracování dat, vylepšené strategie řízené daty a rozšířené možnosti vyhledávání dokumentů.

Document Intelligence je součástí služeb Azure AI. Služby Azure AI zahrnují všechny služby, které se dříve označovaly jako Azure Cognitive Services a Aplikace Azure lied AI Services.

Předchozí název funkce Document Intelligence byl Rozpoznávání formulářů Azure AI. Rozpoznávání formulářů se oficiálně stal dokumentovou inteligencí v červenci 2023.

Ceny se nemění. Názvy služeb Cognitive Services a použité služby AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníkech a cenových rozhraních API.

Neexistují žádné zásadní změny rozhraní API nebo klientských knihoven (SDK). Rozhraní REST API a sada SDK verze 2024-02-29-preview, 2023-10-31-preview a novější se přejmenují document intelligence.

Některé platformy stále čekají na aktualizaci přejmenování. V dokumentaci Microsoftu všechny zmínky o Rozpoznávání formulářů a funkci Document Intelligence odkazují na stejnou službu Azure.

Question 2

Jak souvisí funkce Document Intelligence s dokumentem generující umělou inteligenci?

Accepted Answer

K chatování s dokumenty, generování poutavého obsahu z těchto dokumentů a přístupu k modelům služby Azure OpenAI na vašich datech můžete použít řešení generování dokumentů AI. Díky kombinaci funkcí Document Intelligence a Azure OpenAI v Azure AI můžete vytvořit podnikovou aplikaci pro bezproblémovou interakci s dokumenty pomocí přirozených jazyků, snadno najít odpovědi a získat cenné přehledy a vygenerovat nový a poutavý obsah z existujících dokumentů. Další podrobnosti najdete v blogu technické komunity.

Question 3

Jak souvisí funkce Document Intelligence s generováním rozšířeného načítání?

Accepted Answer

Sémantické vytváření bloků dat je klíčovým krokem při načítání rozšířené generace (RAG) k zajištění efektivního úložiště a načítání. Model rozložení Document Intelligence nabízí komplexní řešení pro možnosti pokročilé extrakce obsahu a analýzy struktury dokumentů.

S modelem rozložení můžete snadno extrahovat text a strukturální prvky a rozdělit velká těla textu na menší, smysluplné bloky založené na sémantickém obsahu, nikoli na libovolné rozdělení. Extrahované informace pak můžete pohodlně vyextrahovat do formátu Markdownu, abyste mohli definovat sémantickou strategii vytváření bloků dat na základě poskytnutých stavebních bloků. Další podrobnosti najdete v přehledu rag ve funkci Document Intelligence.

Question 4

Které případy použití funkce Document Intelligence vyžadují zvláštní pozornost?

Accepted Answer

Pečlivě zvažte projekty zpracování dokumentů, které zahrnují finanční data, chráněná zdravotní data, osobní údaje nebo vysoce citlivá data.

Ujistěte se, že splňuje všechny požadavky specifické pro národní/regionální a průmyslové odvětví.

Question 5

Jaké jazyky funkce Document Intelligence podporuje?

Accepted Answer

Univerzální modely založené na hlubokém učení ve funkci Document Intelligence podporují mnoho jazyků, které můžou extrahovat vícejazyčný text z obrázků a dokumentů, včetně textových čar se smíšenými jazyky.

Podpora jazyků se liší podle funkcí služby Document Intelligence. Úplný seznam rukou psaného a tištěného textu, který funkce Document Intelligence podporuje, najdete v tématu Podpora jazyků.

Question 6

Je funkce Document Intelligence dostupná v oblasti Azure?

Accepted Answer

Funkce Document Intelligence je obecně dostupná v mnoha oblastech globální infrastruktury Azure 60 a více.

Zvolte oblast , která je pro vás a vaše zákazníky nejvhodnější.

Question 7

Integruje se funkce Document Intelligence s jinými služby Microsoft?

Accepted Answer

Ano, funkce Document Intelligence se integruje s následujícími službami:

Pracovní postupy AI Builderu
Azure AI Search
Azure Functions
Azure Logic Apps

Question 8

Jak souvisí funkce Document Intelligence s optického rozpoznávání znaků?

Accepted Answer

Document Intelligence je cloudová služba, která zahrnuje optické rozpoznávání znaků (OCR), analýzu textu a vlastní klasifikaci textu ze služeb Azure AI.

Funkce Document Intelligence používá technologii OCR k detekci a extrahování informací z typeface a ručně psaných textových dokumentů podporovaných umělou inteligencí k poskytování větší struktury a informací pro extrakci textu.

Question 9

Jak dlouho je můj vlastní model k dispozici pro použití?

Accepted Answer

Model má stejný životní cyklus jako verze rozhraní API, kterou používáte k jeho trénování. Vlastní modely natrénované s obecnou dostupností (GA) rozhraní API mají stejný životní cyklus jako verze rozhraní API. Pokud je verze rozhraní API zastaralá, model už není k dispozici pro odvozování. Modely natrénované pomocí verze Preview rozhraní API mají také stejný životní cyklus jako rozhraní API verze Preview.

Počítejte s vyřazením rozhraní API verze Preview do tří měsíců od aktualizované verze rozhraní API verze Preview nebo novější verze rozhraní API ga.

Question 10

Jaké je skóre přesnosti a jak se počítá?

Accepted Answer

Výstup operace build vlastního modelu (verze 3.0 a novější) nebo train (v2.1) zahrnuje odhadované skóre přesnosti. Toto skóre představuje schopnost modelu přesně předpovědět popisovanou hodnotu ve vizuálně podobném dokumentu.

Přesnost se měří v rozsahu procentuální hodnoty od 0 % (nízká) do 100 % (vysoká).

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Question 11

Jak můžu zlepšit skóre přesnosti?

Accepted Answer

Odchylky ve vizuální struktuře dokumentů můžou ovlivnit přesnost modelu. Tady je několik tipů:

Do trénovací datové sady zahrňte všechny varianty dokumentu. Varianty zahrnují různé formáty; Například digitální a naskenované soubory PDF.
Oddělte vizuálně odlišné typy dokumentů a trénujte různé modely.
Ujistěte se, že nemáte nadbytečné popisky.
U popisků podpisů a oblastí nezahrnujte okolní text.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Question 12

Jaké je skóre spolehlivosti a jak se počítá?

Accepted Answer

Skóre spolehlivosti označuje pravděpodobnost měřením stupně statistické jistoty, že se extrahovaný výsledek zjistí správně.

Rozsah hodnot spolehlivosti je procento od 0 % (nízké) do 100 % (vysoké). Nejlepší je cílit na skóre 80 % nebo vyšší. V případě citlivějších případů, jako jsou finanční nebo lékařské záznamy, doporučujeme skóre téměř 100 %. Můžete také vyžadovat lidskou kontrolu.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Question 13

Jak můžu zlepšit skóre spolehlivosti?

Accepted Answer

Po operaci analýzy zkontrolujte výstup JSON. confidence Prozkoumejte hodnoty pro každý výsledek klíče a hodnoty v pageResults uzlu. Měli byste se také podívat na skóre spolehlivosti v readResults uzlu, které odpovídá operaci čtení textu. Spolehlivost výsledků čtení nemá vliv na spolehlivost výsledků extrakce klíč/hodnota, takže byste měli zkontrolovat obojí. Tady je několik tipů:

Pokud je skóre spolehlivosti objektu readResults nízké, zvyšte kvalitu vstupních dokumentů.
Pokud je skóre spolehlivosti objektu pageResults nízké, ujistěte se, že dokumenty, které analyzujete, mají stejný typ.
Zvažte začlenění lidské kontroly do pracovních postupů.
Používejte formuláře, které mají v každém poli různé hodnoty.
Pro vlastní modely použijte větší sadu trénovacích dokumentů. Označování dalších dokumentů učí váš model rozpoznávat pole s větší přesností.

Další informace najdete v tématu Přesnost a skóre spolehlivosti.

Question 14

Co je ohraničující rámeček?

Accepted Answer

Ohraničující rámeček (polygon ve verzi 3.0 a novějších verzích) je abstraktní obdélník, který obklopuje textové prvky v dokumentu nebo formuláři. Používá se jako referenční bod pro detekci objektů.

Ohraničující rámeček určuje pozici pomocí souřadnicové roviny x a y zobrazené v matici čtyř číselných párů. Každý pár představuje roh pole v následujícím pořadí: vlevo nahoře, vpravo nahoře, vpravo dole, vlevo dole.

Pro obrázek jsou souřadnice v pixelech. V případě PDF jsou souřadnice v palcích.

Question 15

Může funkce Document Intelligence pomoct klasifikovat dokumenty?

Accepted Answer

Funkce Document Intelligence poskytuje vlastní klasifikační modely, které můžou analyzovat dokumenty s jedním souborem nebo více soubory a identifikovat, jestli vstupní soubor obsahuje některý z trénovaných typů dokumentů. Služba podporuje následující scénáře:

Jeden soubor, který obsahuje jeden typ dokumentu, například formulář žádosti o půjčku.
Jeden soubor, který obsahuje více dokumentů. Příkladem je balíček žádosti o půjčku, který obsahuje formulář žádosti o půjčku, výplatu a bankovní výpis.
Jeden soubor, který obsahuje více instancí stejného dokumentu. Příkladem je kolekce naskenovaných faktur.

Další informace najdete v přehledu vlastních klasifikačních modelů.

Question 16

Jaké jsou možnosti vývoje pro funkci Document Intelligence?

Accepted Answer

Funkce Document Intelligence nabízí nejnovější možnosti vývoje na následujících platformách:

REST API
Document Intelligence Studio
C#/.NET
Java
JavaScript/TypeScript
Python

Question 17

Kde najdu podporovanou verzi rozhraní API pro nejnovější sady SDK programovacího jazyka?

Accepted Answer

Tato tabulka obsahuje odkazy na nejnovější verze sady SDK a ukazuje vztah mezi podporovanou sadou Document Intelligence SDK a verzemi rozhraní API:

Referenční informace k sadě Azure SDK podporovaného jazyka	Podporované verze rozhraní API
• C#/.NET: 4.0.0 • Java: 4.0.0 • JavaScript: 4.0.0 • Python 3.2.0	2023-10-31-preview v3.0 v2.1 v2.0

Další informace naleznete v tématu Podporované klienty pro v4.0 a podporované klienty pro v3.1.

Question 18

Jaký je rozdíl mezi funkcí Document Intelligence v3.0 a v2.1 a jak migrovat na nejnovější verzi?

Accepted Answer

Kvůli lepší použitelnosti přináší funkce Document Intelligence v3.0 plně přepracovanou klientskou knihovnu. Abyste mohli úspěšně používat nejnovější funkce rozhraní DOCUMENT Intelligence API, potřebujete nejnovější sadu SDK a kód aplikace se musí aktualizovat tak, aby používal nové klienty.

Tato tabulka obsahuje odkazy na podrobné pokyny pro migraci na nejnovější verzi funkce Document Intelligence:

Jazyk nebo rozhraní API	Průvodce migrací
REST API	v3
C#/.NET	4.0.0
Java	4.0.0
JavaScript	4.0.0
Python	3.2.0

Question 19

Které formáty souborů funkce Document Intelligence podporují? Existují omezení velikosti vstupních dokumentů?

Accepted Answer

Pokud chcete získat nejlepší výsledky, podívejte se na požadavky na vstup.

Question 20

Jak můžu zadat rozsah stránek, které se mají analyzovat v dokumentu?

Accepted Answer

Pomocí parametru pages (podporovaného v 2.1, v3.0 a novějších verzích rozhraní REST API) můžete zadat stránky pro vícestránkové dokumenty PDF a TIFF. Akceptované vstupy zahrnují následující rozsahy:

Jednotlivé stránky. Pokud zadáte 1, 2například , stránky 1 a 2 se zpracovávají.
Konečné rozsahy. Pokud zadáte 2-5například , stránky 2 až 5 se zpracovávají.
Rozsahy s otevřeným koncem Pokud například zadáte 5-, všechny stránky ze stránky 5 se zpracovávají. Pokud zadáte -10, stránky 1 až 10 se zpracovávají.

Tyto parametry můžete kombinovat a rozsahy se můžou překrývat. Pokud zadáte -5, 1, 3, 5-10například , stránky 1 až 10 se zpracovávají.

Služba přijme požadavek, pokud může zpracovat aspoň jednu stránku dokumentu. Například použití 5-100 v pětistráně dokumentu je platný vstup, což znamená, že se zpracuje stránka 5.

Pokud nezadáte rozsah stránek, zpracuje se celý dokument.

Question 21

K dispozici jsou jak Document Intelligence Studio, tak i nástroj FOTT Sample Labeling. Který z nich mám použít?

Accepted Answer

Ve většině případů doporučujeme Nástroj Document Intelligence Studio , protože může zkrátit dobu konfigurace prostředků Document Intelligence a služeb úložiště.

Zvažte použití nástroje pro testování formátu OCR (FOTT) pro následující scénáře:

Vaše data musí zůstat v jednom počítači. Použijte nástroj FOTT Sample Labeling a kontejner Document Intelligence.
Váš projekt je vysoce závislý na funkci Document Intelligence verze 2.1 a chcete dál používat rozhraní API verze 2.1.

Question 22

Jak Azure vypočítá cenu za použití funkce Document Intelligence?

Accepted Answer

Fakturace funkce Document Intelligence se počítá měsíčně na základě typu modelu a počtu analyzovaných stránek. Tady jsou některé podrobnosti:

Když odešlete dokument k analýze, služba analyzuje všechny stránky, pokud nezadáte rozsah stránek pomocí parametru pages v požadavku. Když služba analyzuje dokumenty Microsoft Excelu a PowerPointu prostřednictvím modelu čtení, OCR nebo rozložení, počítá každý excelový list a powerpointový snímek jako jednu stránku.
Když služba analyzuje soubory PDF a TIFF, spočítá každou stránku v souboru PDF nebo každý obrázek v souboru TIFF jako jednu stránku bez maximálního omezení znaků.
Když služba analyzuje soubory Microsoft Wordu a HTML, které modely čtení a rozložení podporují, počítá stránky v blocích 3 000 znaků. Pokud například dokument obsahuje 7 000 znaků, budou dvě stránky se 3 000 znaky a jedna stránka s 1 000 znaky sečtou až do celkového počtu tří stránek.
Pokud k analýze souborů Microsoft Wordu, Excelu, PowerPointu a HTML, vložených nebo propojených obrázků používáte model čtení nebo rozložení, nejsou podporované. Služba je proto nezapočítává jako přidané obrázky.
Trénování vlastního modelu je vždy zdarma pomocí funkce Document Intelligence. Účtují se vám poplatky jenom v případech, kdy služba k analýze dokumentu používá model.
Ceny kontejnerů jsou stejné jako ceny cloudových služeb.
Funkce Document Intelligence nabízí bezplatnou úroveň (F0), kde můžete otestovat všechny funkce Funkce Document Intelligence.
Funkce Document Intelligence má cenový model založený na závazku pro velké úlohy.

Přečtěte si další informace o cenových možnostech služby Azure AI Document Intelligence.

Question 23

Jak můžu zkontrolovat využití funkce Document Intelligence a odhadnout cenu?

Accepted Answer

Metriky využití najdete na řídicím panelu metrik na webu Azure Portal. Na řídicím panelu se zobrazí počet stránek, které Azure AI Document Intelligence zpracuje. Odhadované náklady na prostředek můžete zkontrolovat pomocí cenové kalkulačky Azure. Podrobné pokyny najdete v tématu Kontrola využití a odhadu nákladů.

Question 24

Jaké jsou osvědčené postupy pro zmírnění omezování?

Accepted Answer

Funkce Document Intelligence využívá automatické škálování k poskytování požadovaných výpočetních prostředků na vyžádání a zároveň nízké náklady zákazníků. Pokud chcete omezit omezování během automatického škálování, doporučujeme následující přístup:

Implementujte do své aplikace logiku opakování pokusů.
Pokud zjistíte, že dochází k omezování počtu POST požadavků, zvažte přidání zpoždění mezi požadavky.
Zvyšujte zatížení postupně. Vyhněte se ostrým změnám.
Vytvořte žádost o podporu pro zvýšení limitu transakcí za sekundu (TPS).

Přečtěte si další informace o kvótách a omezeních služby Document Intelligence.

Question 25

Jak dlouho trvá analýza dokumentu?

Accepted Answer

Doba analýzy dokumentu závisí na velikosti (například počtu stránek) a přidruženém obsahu na každé stránce.

Funkce Document Intelligence je víceklientská služba, kde latence podobných dokumentů je srovnatelná, ale ne vždy identická. Latence je doba, kterou vyžaduje, aby server rozhraní API zpracovával a zpracovával příchozí požadavek a doručil odchozí odpověď klientovi. Občasná proměnlivost latence a výkonu je nedílnou součástí jakékoli bezstavové asynchronní služby založené na mikroslužbách, která zpracovává obrázky a velké dokumenty ve velkém měřítku.

I když nepřetržitě vertikálně navyšujeme kapacitu hardwaru a kapacitu a možnosti škálování, můžete stále mít problémy s latencí za běhu.

Question 26

Návody sestavit nejlepší trénovací data?

Accepted Answer

Při použití vlastního modelu Document Intelligence poskytujete vlastní trénovací data. Tady je několik tipů, které vám pomůžou efektivně trénovat modely:

Pokud je to možné, používejte místo souborů PDF založených na obrázku text. Jedním ze způsobů, jak identifikovat soubor PDF založený na obrázku, je vyzkoušet výběr konkrétního textu v dokumentu. Pokud můžete vybrat jenom celý obrázek textu, dokument je založený na obrázku, nikoli na textu.
Uspořádejte trénovací dokumenty pomocí podsložky pro každý formát (JPEG/JPG, PNG, BMP, PDF nebo TIFF).
Použijte formuláře, které mají dokončená všechna dostupná pole.
V každém poli používejte formuláře s odlišnými hodnotami.
Pokud jsou vaše obrázky nízké kvality, použijte větší datovou sadu (více než pět trénovacích dokumentů).

Přečtěte si další informace o vytváření trénovací datové sady.

Question 27

Jaké jsou osvědčené postupy pro trénování vysoce přesného vlastního modelu?

Accepted Answer

Úroveň přesnosti modelu závisí na kvalitě trénovacích materiálů. Tady je několik tipů:

Určete, jestli potřebujete použít jeden nebo více modelů složených do jednoho modelu.
Přesnost modelu se může snížit, pokud máte různé formáty analyzované pomocí jednoho modelu. Naplánujte segmentování datové sady do složek, kde každá složka představuje jedinečnou šablonu. Vytrénujte jeden model na složku a vytvořte výsledné modely do jednoho koncového bodu.
Vlastní formuláře spoléhají na konzistentní šablonu vizuálu. Pokud má formulář varianty formátů a konců stránek, zvažte segmentaci datové sady pro trénování více modelů.
Ujistěte se, že máte vyváženou datovou sadu díky tomu, že se započítávání formátů, typů dokumentů a struktury.

Přečtěte si další informace o složených modelech.

Question 28

Můžu přetrénovat vlastní model?

Accepted Answer

Funkce Document Intelligence nemá explicitní operaci opětovného trénování. Každá operace trénování vygeneruje nový model.

Pokud zjistíte, že váš model potřebuje přetrénování, přidejte do trénovací datové sady další ukázky a vytrénujte nový model.

Question 29

Kolik vlastních modelů můžu vytvořit do jednoho vlastního modelu?

Accepted Answer

Pomocí operace Vytvoření modelu můžete přiřadit až 200 modelů k jednomu ID modelu. Když vytvoříte Analyze Document požadavek s složeným ID modelu, funkce Document Intelligence klasifikuje odeslaný formulář, zvolí nejlepší model a vrátí výsledky. Vytváření modelů je aktuálně k dispozici pouze pro vlastní modely natrénované pomocí popisků.

Analýza dokumentu pomocí složených modelů je shodná s analýzou dokumentu pomocí jednoho modelu. Výsledek Analyze Document vrátí docType vlastnost, která označuje, které z modelů komponent, které jste vybrali pro analýzu dokumentu. Při analýze dokumentu pomocí individuálního vlastního modelu nebo složeného vlastního modelu nedošlo ke změně cen.

Přečtěte si další informace o složených modelech.

Question 30

Pokud počet modelů, které chci vytvořit, překročí horní limit složeného modelu, jaké jsou alternativy?

Accepted Answer

Můžete použít jednu z těchto alternativ:

Klasifikujte dokumenty před voláním vlastního modelu. Model pro čtení můžete použít a sestavit klasifikaci na základě extrahovaného textu z dokumentů a určitých frází pomocí zdrojů, jako jsou kód, regulární výrazy nebo hledání.
Pokud chcete extrahovat stejná pole z různých strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů, zvažte použití vlastního neurálního modelu hlubokého učení. Přečtěte si další informace o rozdílech mezi vlastním modelem šablony a vlastním neurálním modelem.

Question 31

Návody upřesnit model nad rámec počátečního trénování?

Accepted Answer

Každá trénovací operace vygeneruje nový model.

Vytvořte datovou sadu pro novou šablonu.
Označení a trénování nového modelu
Ověřte, že nový model funguje dobře pro vaše konkrétní typy dokumentů.
Vytvořte nový model s existujícím modelem do jednoho koncového bodu. Funkce Document Intelligence pak může určit nejlepší model pro každý dokument, který se má analyzovat.

Přečtěte si další informace o složených modelech.

Question 32

Vytvářím vlastní model. Co vrátí popisek detekce podpisu?

Accepted Answer

Detekce podpisu hledá přítomnost podpisu, nikoli identitu osoby, která dokument podepíše.

Pokud model vrátí nepodepsaný podpis pro detekci podpisu, v definovaném poli nebyl nalezen podpis.

Question 33

Co mám zvážit a jaké jsou osvědčené postupy pro extrakci tabulek z dokumentů?

Accepted Answer

S modelem rozložení Document Intelligence můžete začít extrahovat texty, tabulky, značky výběru a strukturovat informace z dokumentů a obrázků. Můžete také zvážit následující faktory:

Jsou data, která chcete extrahovat jako tabulku, a je struktura tabulky smysluplná?
Pokud data nejsou ve formátu tabulky, můžou se data vejít do dvojrozměrné mřížky?
Pokrývají vaše tabulky více stránek? Pokud ano, abyste nemuseli všechny stránky označovat, rozdělte soubor PDF na stránky před odesláním do funkce Document Intelligence. Po analýze po zpracování stránek do jedné tabulky.
Pokud vytváříte vlastní modely, projděte si popisky jako tabulky. Dynamické tabulky mají pro každý sloupec proměnlivý počet řádků. Pevné tabulky mají konstantní počet řádků pro každý sloupec.

Question 34

Jak můžu přesunout vytrénované modely z jednoho prostředí (například beta verze) do jiného (například produkčního prostředí)?

Accepted Answer

Pomocí rozhraní API pro kopírování můžete kopírovat vlastní modely z jednoho účtu Document Intelligence do jiných, které existují v jakékoli podporované geografické oblasti. Podrobné pokyny najdete v tématu Zotavení po havárii.

Operace kopírování je omezená na kopírování modelů v konkrétním cloudovém prostředí, ve kterém jste model natrénovali. Kopírování modelů z veřejného cloudu do cloudu Azure Government se například nepodporuje.

Question 35

Proč se mi při spouštění vlastního trénování účtovalo rozložení?

Accepted Answer

K vygenerování popisků datové sady se vyžaduje rozložení. Pokud datová sada, kterou používáte pro vlastní trénování, nemá k dispozici soubory popisků, služba je vygeneruje za vás.

Question 36

Před několika dny jsem měl přístup ke svému účtu úložiště. Proč mám potíže s opětovným připojením?

Accepted Answer

Při vytváření sdíleného přístupového podpisu je výchozí doba trvání 48 hodin. Po 48 hodinách musíte vytvořit nový token.

Zvažte nastavení delší doby trvání pro dobu, po kterou používáte účet úložiště s funkcí Document Intelligence.

Question 37

Pokud je můj účet úložiště za virtuální sítí nebo bránou firewall, jak k datům udělím přístup funkce Document Intelligence?

Accepted Answer

Pokud máte účet úložiště Azure chráněný virtuální sítí nebo bránou firewall, funkce Document Intelligence nemá přímý přístup k vašemu účtu úložiště. Přístup k privátnímu účtu úložiště Azure a ověřování ale podporují spravované identity pro prostředky Azure. Když používáte spravovanou identitu, může služba Document Intelligence přistupovat k vašemu účtu úložiště pomocí přiřazených přihlašovacích údajů.

Pokud máte v úmyslu analyzovat data účtu privátního úložiště pomocí FUNKCE FOTT, musíte nástroj nasadit za virtuální sítí nebo bránou firewall.

Naučte se vytvářet a používat spravovanou identitu pro prostředek Document Intelligence.

Pokud máte v úmyslu analyzovat data účtu privátního úložiště pomocí FUNKCE FOTT, musíte nástroj nasadit za virtuální sítí nebo bránou firewall.

Naučte se vytvářet a používat spravovanou identitu pro prostředek Document Intelligence.

Question 38

Jaká oprávnění potřebuji pro přístup k sadě Document Intelligence Studio?

Accepted Answer

Pro přístup k sadě Document Intelligence Studio potřebujete aktivní účet Azure a předplatné s alespoň rolí čtenáře.

Pro analýzu dokumentů a předem připravené modely jsou zde požadavky na role pro uživatelské scénáře:

Basic
- Uživatel služeb Cognitive Services: K používání nástroje Document Intelligence Studio potřebujete tuto roli pro prostředek s více službami Document Intelligence nebo Azure Cognitive Services.
Rozšířený
- Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků nebo prostředku Document Intelligence. Role Přispěvatel neumožňuje vypisovat klíče pro Cognitive Services. Pokud chcete používat Document Intelligence Studio, stále potřebujete roli uživatele služeb Cognitive Services.

Pro projekty vlastního modelu jsou zde požadavky na role pro scénáře uživatelů:

Basic
- Uživatel služeb Cognitive Services: Tuto roli potřebujete pro prostředek více služeb Document Intelligence nebo Cognitive Services k trénování vlastního modelu nebo analýze pomocí natrénovaných modelů.
- Přispěvatel dat objektů blob úložiště: Pro účet úložiště potřebujete tuto roli k vytvoření dat projektu a popisku dat.
Rozšířený
- Přispěvatel účtu úložiště: Tuto roli potřebujete pro účet úložiště k nastavení sdílení prostředků mezi zdroji (CORS). Jednorázovým úsilím je použít stejný účet úložiště.
  
  Role Přispěvatel neumožňuje přístup k datům v objektu blob. Pokud chcete používat Document Intelligence Studio, stále potřebujete roli Přispěvatel dat v objektech blob úložiště.
- Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků a prostředků. Role Přispěvatel vám neuděluje přístup k používání vytvořených prostředků nebo úložiště. Pokud chcete používat Document Intelligence Studio, stále potřebujete základní role.

Další informace najdete v tématu Předdefinované role Microsoft Entra a části týkající se přiřazení rolí Azure v rychlém startu k sadě Document Intelligence Studio.

Question 39

V dokumentu mám více stránek. Proč se v nástroji Document Intelligence Studio analyzují jenom dvě stránky?

Accepted Answer

U prostředků úrovně Free (F0) se analyzují pouze první dvě stránky bez ohledu na to, jestli používáte Document Intelligence Studio, rozhraní REST API nebo sady SDK.

V Nástroji Document Intelligence Studio vyberte tlačítko Nastavení (ozubené kolo), vyberte kartu Prostředky a zkontrolujte cenovou úroveň, kterou používáte k analýze dokumentů. Pokud chcete analyzovat všechny stránky v dokumentu, přejděte na placený prostředek (S0).

Question 40

Jak můžu změnit adresáře nebo předplatná v nástroji Document Intelligence Studio?

Accepted Answer

Pokud chcete změnit adresář v nástroji Document Intelligence Studio, vyberte tlačítko Nastavení (ozubené kolo). V části Adresář vyberte adresář ze seznamu a pak vyberte Přepnout adresář. Po přepnutí adresáře se zobrazí výzva k opětovnému přihlášení.

Pokud chcete změnit předplatné nebo prostředek, přejděte na kartu Prostředek v části Nastavení.

Question 41

Proč dochází k chybě úložiště u sdílení projektu, automatického popisování nebo operace upgradu OCR při konfiguraci prostředku účtu úložiště s bránou firewall nebo virtuální sítí?

Accepted Answer

Informace o nastavení prostředků Azure najdete ve spravovaných identitách pro funkci Document Intelligence .

Question 42

Proč se mi při konfiguraci prostředku Document Intelligence s bránou firewall nebo bránou firewall zobrazuje chyba Odepření přístupu kvůli pravidlům virtuální sítě nebo brány firewall při automatickém označování nebo upgradu OCR?

Accepted Answer

Musíte přidat vyhrazenou IP adresu 20.3.165.95 do seznamu povolených pro váš prostředek Document Intelligence.

Question 43

Můžu znovu použít nebo přizpůsobit prostředí popisování z Document Intelligence Studia a sestavit ho do vlastní aplikace?

Accepted Answer

Ano. Prostředí pro označování z Document Intelligence Studia je opensourcové v úložišti Toolkit.

Question 44

Proč se při otevírání vlastního projektu zobrazuje chyba "Rozpoznávání formulářů Nenalezena"?

Accepted Answer

Zdroj document Intelligence svázaný s tímto vlastním projektem byl odstraněn nebo přesunut do jiné skupiny prostředků. Tento problém můžete vyřešit dvěma způsoby:

Znovu vytvořte prostředek Document Intelligence ve stejném předplatném a skupině prostředků se stejným názvem.
Znovu vytvořte vlastní projekt s migrovaným prostředkem Document Intelligence a zadejte stejný účet úložiště.

Question 45

Potřebuji připojení k internetu pro používání kontejnerů Document Intelligence?

Accepted Answer

Ano. Kontejnery Document Intelligence vyžadují připojení k internetu k odesílání fakturačních údajů do Azure. Přečtěte si další informace o zabezpečení kontejnerů Azure.

Question 46

Jaký je rozdíl mezi odpojenými a připojenými kontejnery?

Accepted Answer

Připojení kontejnery odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. U připojených kontejnerů se k odesílání fakturačních údajů do Azure vyžaduje připojení k internetu.

Odpojené kontejnery umožňují používat rozhraní API, která jsou odpojená od internetu. Fakturační údaje se neposílají přes internet. Místo toho se vám budou účtovat poplatky na základě zakoupené úrovně závazku. V současné době je využití odpojeného kontejneru k dispozici pro vlastní modely Document Intelligence a faktury.

Funkce modelu poskytované v připojených a odpojených kontejnerech jsou stejné a podporují je funkce Document Intelligence v2.1.

Question 47

Jaká data odesílají připojené kontejnery do cloudu?

Accepted Answer

Připojené kontejnery Document Intelligence odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. Připojení kontejnery neodesílají do Microsoftu zákaznická data, například obrázek nebo text analyzovaný.

Příklad informací, které připojené kontejnery odesílají Do Microsoftu za účelem fakturace, najdete v nejčastějších dotazech ke kontejnerům Azure AI.

Question 48

Proč se mi zobrazuje chyba Kontejner není v platném stavu. Ověření předplatného selhalo se stavem OutOfQuota, klíč rozhraní API je mimo kvótu?

Accepted Answer

Připojené kontejnery Document Intelligence odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. Tuto zprávu můžete získat, pokud kontejnery nemůžou komunikovat s koncovým bodem fakturace.

Question 49

Můžu použít místní úložiště pro kontejner s popisky ukázky funkce Document Intelligence (FOTT)?

Accepted Answer

FOTT má verzi, která používá místní úložiště. Na počítači s Windows musí být nainstalovaná verze. Můžete ho nainstalovat z tohoto umístění.

Na stránce projektu zadejte identifikátor URI složky popisku jako /shared nebo /shared/sub-dir, pokud jsou soubory popisků v podadresáři. Všechny ostatní chování nástroje popisování v ukázce document intelligence jsou stejné jako hostovaná služba.

Question 50

Jaký je osvědčený postup vertikálního navýšení kapacity?

Accepted Answer

Pro asynchronní volání můžete spustit více kontejnerů se sdíleným úložištěm. Kontejner, který zpracovává POST volání analýzy, ukládá výstup do úložiště. Pak může jakýkoli jiný kontejner načíst výsledky z úložiště a obsluhovat GET volání. ID požadavku není svázané s kontejnerem.

Pro synchronní volání můžete spustit více kontejnerů, ale pouze jeden kontejner obsluhuje požadavek. Vzhledem k tomu, že se jedná o blokující volání, může jakýkoli kontejner z fondu odeslat požadavek a odeslat odpověď. V této části je na žádost vázán pouze jeden kontejner a nevyžaduje se žádné dotazování.

Question 51

Jak nastavím kontejnery se sdíleným úložištěm?

Accepted Answer

Kontejnery používají Mounts:Shared vlastnost při spouštění pro zadání sdíleného úložiště pro ukládání souborů zpracování. Informace o použití této vlastnosti najdete v dokumentaci ke kontejnerům.

Question 52

Jaké jsou metody a požadavky na ověřování požadavků na služby Azure AI?

Accepted Answer

Každý požadavek na službu Azure musí obsahovat hlavičku ověřování. Požadavek můžete ověřit pomocí několika metod:

Question 53

Ukládá funkce Document Intelligence moje data?

Accepted Answer

U všech funkcí funkce Document Intelligence dočasně ukládá data a výsledky ve službě Azure Storage ve stejné oblasti jako požadavek. Data se pak odstraní do 24 hodin od odeslání žádosti o analýzu.

Přečtěte si další informace o datech, ochraně osobních údajů a zabezpečení pro funkci Document Intelligence.

Question 54

Jak jsou moje vytrénované vlastní modely uložené a používané ve funkci Document Intelligence?

Accepted Answer

Dočasné výstupy po analýze a označování se ukládají do stejného umístění Azure Storage, kam ukládáte trénovací data. Vytrénované vlastní modely se ukládají ve službě Azure Storage ve stejné oblasti a logicky jsou izolované pomocí vašich přihlašovacích údajů k předplatnému Azure a rozhraní API.

Question 55

Kde najdu další řešení pro své otázky k funkcím Document Intelligence v Azure AI?

Accepted Answer

Microsoft Q&A je domovská stránka technických otázek a odpovědí v Microsoftu. Dotazy specifické pro funkci Document Intelligence můžete filtrovat.

Question 56

Co mám dělat, když služba nerozpozná konkrétní text nebo ho rozpozná nesprávně, když označím dokumenty?

Accepted Answer

Model OCR funkce Document Intelligence průběžně aktualizujeme a vylepšujeme. Tým document intelligence můžete poslat e-mailem. Pokud je to možné, nasdílejte ukázkový dokument se zvýrazněným problémem.

Nejčastější dotazy ke službě Azure AI Document Intelligence

Obecné koncepty

Co je Azure AI Document Intelligence a co se stalo s Azure AI Rozpoznávání formulářů?

Jak souvisí funkce Document Intelligence s dokumentem generující umělou inteligenci?

Jak souvisí funkce Document Intelligence s generováním rozšířeného načítání?

Které případy použití funkce Document Intelligence vyžadují zvláštní pozornost?

Jaké jazyky funkce Document Intelligence podporuje?

Je funkce Document Intelligence dostupná v oblasti Azure?

Integruje se funkce Document Intelligence s jinými služby Microsoft?

Jak souvisí funkce Document Intelligence s optického rozpoznávání znaků?

Jak dlouho je můj vlastní model k dispozici pro použití?

Jaké je skóre přesnosti a jak se počítá?

Jak můžu zlepšit skóre přesnosti?

Jaké je skóre spolehlivosti a jak se počítá?

Jak můžu zlepšit skóre spolehlivosti?

Co je ohraničující rámeček?

Může funkce Document Intelligence pomoct klasifikovat dokumenty?

Vývoj aplikací

Jaké jsou možnosti vývoje pro funkci Document Intelligence?

Kde najdu podporovanou verzi rozhraní API pro nejnovější sady SDK programovacího jazyka?

Jaký je rozdíl mezi funkcí Document Intelligence v3.0 a v2.1 a jak migrovat na nejnovější verzi?

Které formáty souborů funkce Document Intelligence podporují? Existují omezení velikosti vstupních dokumentů?

Jak můžu zadat rozsah stránek, které se mají analyzovat v dokumentu?

K dispozici jsou jak Document Intelligence Studio, tak i nástroj FOTT Sample Labeling. Který z nich mám použít?

Limity a ceny služeb

Jak Azure vypočítá cenu za použití funkce Document Intelligence?

Jak můžu zkontrolovat využití funkce Document Intelligence a odhadnout cenu?

Jaké jsou osvědčené postupy pro zmírnění omezování?

Jak dlouho trvá analýza dokumentu?

Vlastní modely

Návody sestavit nejlepší trénovací data?

Jaké jsou osvědčené postupy pro trénování vysoce přesného vlastního modelu?

Můžu přetrénovat vlastní model?

Kolik vlastních modelů můžu vytvořit do jednoho vlastního modelu?

Pokud počet modelů, které chci vytvořit, překročí horní limit složeného modelu, jaké jsou alternativy?

Návody upřesnit model nad rámec počátečního trénování?

Vytvářím vlastní model. Co vrátí popisek detekce podpisu?

Co mám zvážit a jaké jsou osvědčené postupy pro extrakci tabulek z dokumentů?

Jak můžu přesunout vytrénované modely z jednoho prostředí (například beta verze) do jiného (například produkčního prostředí)?

Proč se mi při spouštění vlastního trénování účtovalo rozložení?

Účet úložiště

Před několika dny jsem měl přístup ke svému účtu úložiště. Proč mám potíže s opětovným připojením?

Pokud je můj účet úložiště za virtuální sítí nebo bránou firewall, jak k datům udělím přístup funkce Document Intelligence?

Document Intelligence Studio

Jaká oprávnění potřebuji pro přístup k sadě Document Intelligence Studio?

V dokumentu mám více stránek. Proč se v nástroji Document Intelligence Studio analyzují jenom dvě stránky?

Jak můžu změnit adresáře nebo předplatná v nástroji Document Intelligence Studio?

Proč dochází k chybě úložiště u sdílení projektu, automatického popisování nebo operace upgradu OCR při konfiguraci prostředku účtu úložiště s bránou firewall nebo virtuální sítí?

Proč se mi při konfiguraci prostředku Document Intelligence s bránou firewall nebo bránou firewall zobrazuje chyba Odepření přístupu kvůli pravidlům virtuální sítě nebo brány firewall při automatickém označování nebo upgradu OCR?

Můžu znovu použít nebo přizpůsobit prostředí popisování z Document Intelligence Studia a sestavit ho do vlastní aplikace?

Proč se při otevírání vlastního projektu zobrazuje chyba "Rozpoznávání formulářů Nenalezena"?

Kontejnery

Potřebuji připojení k internetu pro používání kontejnerů Document Intelligence?

Jaký je rozdíl mezi odpojenými a připojenými kontejnery?

Jaká data odesílají připojené kontejnery do cloudu?

Proč se mi zobrazuje chyba Kontejner není v platném stavu. Ověření předplatného selhalo se stavem OutOfQuota, klíč rozhraní API je mimo kvótu?

Můžu použít místní úložiště pro kontejner s popisky ukázky funkce Document Intelligence (FOTT)?

Jaký je osvědčený postup vertikálního navýšení kapacity?

Jak nastavím kontejnery se sdíleným úložištěm?

Ochrana osobních údajů a zabezpečení

Jaké jsou metody a požadavky na ověřování požadavků na služby Azure AI?

Ukládá funkce Document Intelligence moje data?

Jak jsou moje vytrénované vlastní modely uložené a používané ve funkci Document Intelligence?

Další nápověda a podpora

Kde najdu další řešení pro své otázky k funkcím Document Intelligence v Azure AI?

Co mám dělat, když služba nerozpozná konkrétní text nebo ho rozpozná nesprávně, když označím dokumenty?

Váš názor

Další materiály