Tento obsah se vztahuje na: v4.0 (Preview) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Azure AI Document Intelligence je cloudová služba, která pomocí modelů strojového učení extrahuje páry klíč/hodnota, text a tabulky z dokumentů. Vrácený výsledek je strukturovaný výstup JSON. Případy použití funkce Document Intelligence zahrnují automatizované zpracování dat, vylepšené strategie řízené daty a rozšířené možnosti vyhledávání dokumentů.
Přehled
Jsou funkce Document Intelligence a Azure AI Rozpoznávání formulářů stejné služby?
Ano.
Funkce Document Intelligence a Azure AI Rozpoznávání formulářů jsou stejné. Služba byla přejmenována z Azure AI Rozpoznávání formulářů na Azure AI Document Intelligence v červenci 2023. Služba poskytuje stejné funkce a funkce jako před přejmenováním.
Změny cen: Ceny se nemění. Názvy služeb Cognitive Services a použité služby AI se nadále používají ve fakturaci Azure, analýze nákladů, ceníkech a cenových rozhraních API.
Zásadní změny: Neexistují žádné zásadní změny rozhraní API nebo klientských knihoven. Rozhraní REST API a sada SDK verze 2024-02-29-preview, 2023-10-31-preview a novější se přejmenují
document intelligence
.
Integruje se funkce Document Intelligence s jinými služby Microsoft?
Ano.
Funkce Document Intelligence se integruje s následujícími službami:
Schopnosti umělé inteligence
Můžu ke zpracování dokumentů použít funkci Document Intelligence s generováním umělé inteligence?
Ano.
Funkce Document Intelligence teď zahrnuje vlastní generování nového typu modelu extrakce, který k extrakci polí z dokumentů používá generativní umělou inteligenci a velké jazykové modely (LLM). V minulosti jste k extrakci polí použili model RAG (načítání rozšířené generace). Nový model poskytuje vysoce kvalitní výsledky s jedním voláním rozhraní API. K chatování s vašimi dokumenty (RAG), generování obsahu z těchto dokumentů a přístupu k modelům služby Azure OpenAI na vašich datech můžete také použít řešení generování dokumentů AI.
Díky kombinované funkci Document Intelligence a Azure OpenAI v Azure AI můžete vytvořit podnikovou aplikaci pro bezproblémovou interakci s dokumenty pomocí přirozeného jazyka. Můžete snadno najít odpovědi, získat cenné přehledy a vygenerovat nový a poutavý obsah z existujících dokumentů.
Další podrobnosti o modelu rozšířené generace načítání najdete tady.
Může funkce Document Intelligence pomoct s sémantickým vytvářením dat v dokumentech pro generování rozšířeného načítání?
Ano.
Funkce Document Intelligence může poskytnout stavební bloky, které umožňují sémantické bloky dat. Sémantické vytváření bloků dat je klíčovým krokem při načítání rozšířené generace (RAG), aby se zajistilo zlepšení kontextu hustých bloků dat a relevance.
Funkce Document Intelligence poskytuje model rozložení, který poskytuje vizuální rozklad dokumentu na řádky, odstavce, oddíly, záhlaví a zápatí.
Výsledky pak můžete načíst ve formátu markdownu, abyste mohli dokument dále vyprázdnit na hranicích oddílů nebo odstavců.
Další informace najdete v přehledu RAG v části Document Intelligence.
Document Intelligence Studio
Potřebuji pro přístup k nástroji Document Intelligence Studio konkrétní oprávnění?
Ano.
Pro přístup k sadě Document Intelligence Studio potřebujete aktivní účet Azure a předplatné s alespoň rolí čtenáře.
Pro analýzu dokumentů a předem připravené modely jsou zde požadavky na role pro uživatelské scénáře:
Basic
- Uživatel služeb Cognitive Services: K používání nástroje Document Intelligence Studio potřebujete tuto roli pro prostředek s více službami Document Intelligence nebo Azure Cognitive Services.
Rozšířený
- Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků nebo prostředku Document Intelligence.
Pro projekty vlastního modelu jsou zde požadavky na role pro scénáře uživatelů:
Basic
Uživatel služeb Cognitive Services: Tuto roli potřebujete pro prostředek více služeb Document Intelligence nebo Cognitive Services k trénování vlastního modelu nebo analýze pomocí natrénovaných modelů.
Přispěvatel dat objektů blob úložiště: Pro účet úložiště potřebujete tuto roli k vytvoření dat projektu a popisku dat.
Rozšířený
Přispěvatel účtu úložiště: Tuto roli potřebujete pro účet úložiště k nastavení sdílení prostředků mezi zdroji (CORS). Jednorázovým úsilím je použít stejný účet úložiště.
Přispěvatel: Tuto roli potřebujete k vytvoření skupiny prostředků a prostředků. Role přispěvatele nebo přispěvatele účtu úložiště neposkytuje přístup k používání prostředku Document Intelligence nebo účtu úložiště, pokud je zakázané místní ověřování (založené na klíčích). K používání funkcí v nástroji Document Intelligence Studio stále potřebujete základní role (Přispěvatel objektů blob dat služeb Cognitive Services a Přispěvatel dat úložiště).
Další informace najdete v tématu Předdefinované role Microsoft Entra a části týkající se přiřazení rolí Azure v rychlém startu k sadě Document Intelligence Studio.
Můžu zpracovávat dokumenty s více než dvěma stránkami v nástroji Document Intelligence Studio?
Ano, u placených prostředků.
Ne, pro prostředky úrovně Free.
U prostředků úrovně Free (F0) se analyzují pouze první dvě stránky bez ohledu na to, jestli používáte Document Intelligence Studio, rozhraní REST API nebo klientské knihovny.
Pokud chcete analyzovat všechny stránky v dokumentu, přejděte na placený prostředek (S0). V Nástroji Document Intelligence Studio vyberte tlačítko Nastavení (ozubené kolo), vyberte kartu Prostředky a zkontrolujte cenovou úroveň, kterou chcete použít k analýze dokumentů.
Můžu v nástroji Document Intelligence Studio změnit adresáře nebo předplatná?
Ano.
Pokud chcete změnit adresář v sadě Document Intelligence Studio, vyberte tlačítko Nastavení (ozubené kolo). V části Adresář vyberte adresář ze seznamu a pak vyberte Přepnout adresář. Po přepnutí adresáře se znovu přihlaste.
Pokud chcete změnit předplatné nebo prostředek, přejděte na kartu Prostředek v části Nastavení.
Můžu použít Document Intelligence Studio s prostředkem, který je nakonfigurovaný s bránou firewall nebo virtuální sítí?
Ano.
Pokud je váš prostředek Document Intelligence nakonfigurovaný s bránou firewall nebo virtuální sítí, musíte přidat vyhrazenou IP adresu 20.3.165.95 do seznamu povolených pro váš prostředek Document Intelligence. Některé funkce ve vlastních projektech (například autolabel, řízení projektů a člověk ve smyčce) nefungují, pokud je zakázaný přístup k veřejné síti.
Když nahraju soubor v sadě Document Intelligence Studio pomocí funkce Načíst z adresy URL, můžu použít adresu URL ze svého úložiště objektů blob?
Ano.
Pokud vaše adresa URL služby Azure Blob Storage obsahuje token SAS a je přístupná z veřejných sítí. Funkci Fetch nemůžete použít pro účty úložiště, ve kterých je zakázaný přístup ke klíči nebo za bránou firewall nebo virtuální sítí.
Můžu znovu použít nebo přizpůsobit prostředí popisování z Document Intelligence Studia a sestavit ho do vlastní aplikace?
Existují samostatné koncové body adresy URL pro oblasti suverénního cloudu Document Intelligence?
Ano.
Document Intelligence Studio má samostatné koncové body adresy URL pro oblasti suverénního cloudu:
Adresa URL pro cloud Azure US Government (Azure Fairfax): Document Intelligence Studio US Government
Adresa URL Microsoft Azure provozovaná společností 21Vianet (Azure China): Document Intelligence Studio China.
Vývoj aplikací
Můžu vyvíjet aplikace s využitím Azure AI Document Intelligence s využitím nejnovějších možností vývoje?
Ano.
Funkce Document Intelligence nabízí nejnovější možnosti vývoje na následujících platformách:
[REST API](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
Můžu migrovat aplikaci na nejnovější verzi funkce Document Intelligence?
Ano.
Následující tabulka obsahuje odkazy na podrobné pokyny pro migraci na nejnovější verzi funkce Document Intelligence:
Jazyk nebo rozhraní API | Průvodce migrací |
---|---|
REST API | v3 |
C#/.NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
Můžu v dokumentu zadat rozsah stránek, které se mají analyzovat?
Ano.
pages
Použijte parametr (podporovaný ve verzích v2.1, v3.0 a novějších verzích rozhraní REST API) a určete stránky pro vícestránkové dokumenty PDF a TIFF. Akceptované vstupy zahrnují následující rozsahy:
- Jednotlivé stránky. Pokud zadáte
1, 2
například , stránky 1 a 2 se zpracovávají. - Konečné rozsahy. Pokud zadáte
2-5
například , stránky 2 až 5 se zpracovávají. - Rozsahy s otevřeným koncem Pokud například zadáte
5-
, všechny stránky ze stránky 5 se zpracovávají. Pokud zadáte-10
, stránky 1 až 10 se zpracovávají.
Tyto parametry můžete kombinovat a rozsahy se můžou překrývat. Pokud zadáte -5, 1, 3, 5-10
například , stránky 1 až 10 se zpracovávají.
Služba přijme požadavek, pokud může zpracovat aspoň jednu stránku dokumentu. Například použití 5-100
v pětistráně dokumentu je platný vstup, což znamená, že se zpracuje stránka 5.
Pokud nezadáte rozsah stránek, zpracuje se celý dokument.
Doporučujete pro můj projekt místo nástroje PRO popisování ukázek FOTT používat Nástroj Document Intelligence Studio?
Ano.
Nástroj Document Intelligence Studio doporučujeme většinu času, protože může zkrátit dobu konfigurace prostředků Document Intelligence a služeb úložiště.
Zvažte použití nástroje pro testování formulářů (FOTT) pouze pro následující scénáře:
Vaše data musí zůstat v jednom počítači. Použijte nástroj FOTT Sample Labeling a kontejner Document Intelligence.
Váš projekt je vysoce závislý na document Intelligence V2.1 a chcete dál používat rozhraní API verze 2.1.
Existují osvědčené postupy pro zmírnění omezování?
Ano.
Funkce Document Intelligence využívá automatické škálování k poskytování požadovaných výpočetních prostředků na vyžádání a zároveň nízké náklady zákazníků. Pokud chcete omezit omezování během automatického škálování, doporučujeme následující přístup:
Implementujte do své aplikace logiku opakování pokusů.
Pokud zjistíte, že dochází k omezování počtu
POST
požadavků, zvažte přidání zpoždění mezi požadavky.Zvyšujte zatížení postupně. Vyhněte se ostrým změnám.
Vytvořte žádost o podporu pro zvýšení limitu transakcí za sekundu (TPS).
Přečtěte si další informace o kvótách a omezeních služby Document Intelligence.
Vlastní modely
Můžu pro vlastní model vylepšit odhadované skóre přesnosti?
Ano.
Odchylky ve vizuální struktuře dokumentů můžou ovlivnit přesnost modelu. Tady je několik tipů:
Do trénovací datové sady zahrňte všechny varianty dokumentu. Varianty zahrnují různé formáty; Například digitální a naskenované soubory PDF.
Oddělte vizuálně odlišné typy dokumentů a trénujte různé modely.
Ujistěte se, že nemáte nadbytečné popisky.
U popisků podpisů a oblastí nezahrnujte okolní text.
Další informace najdete v tématu Přesnost a skóre spolehlivosti.
Můžu přetrénovat vlastní model?
Ne.
Funkce Document Intelligence nemá explicitní operaci opětovného trénování. Každá operace trénování vygeneruje nový model.
Pokud zjistíte, že váš model je potřeba přetrénovat, můžete do trénovací datové sady přidat další ukázky a vytrénovat nový model.
Můžete také vytvořit nový model, který vytvoří původní model následujícím způsobem:
Vytvořte datovou sadu pro novou šablonu.
Označení a trénování nového modelu
Ověřte, že nový model funguje dobře pro vaše konkrétní typy dokumentů.
Vytvořte nový model s existujícím modelem do jednoho koncového bodu. Funkce Document Intelligence pak může určit nejlepší model pro každý dokument, který se má analyzovat.
Další informace najdete v tématu složené modely.
Můžu svoje vytrénované modely přesunout z jednoho prostředí (například beta verze) do jiného (například produkčního prostředí)?
Ano.
Pomocí rozhraní API pro kopírování můžete kopírovat vlastní modely z jednoho účtu Document Intelligence do jiných, které existují v jakékoli podporované geografické oblasti. Podrobné pokyny najdete v tématu Zotavení po havárii.
Operace kopírování je omezená na kopírování modelů v konkrétním cloudovém prostředí, ve kterém jste model natrénovali. Kopírování modelů z veřejného cloudu do cloudu Azure Government se například nepodporuje.
Při trénování vlastních modelů se mi účtují poplatky?
Ano.
Školení je zdarma pro všechny vlastní modely generování a vlastních šablon. Vytvoření trénovací datové sady pro všechny modely ale vyžaduje spuštění modelu rozložení v trénovacích dokumentech. Za tyto náklady zodpovídají zákazníci.
Vlastní modely generování také spoléhají na funkci automatického popisku, která urychluje generování datové sady s popiskem. K této akci jsou spojené náklady. I když je operace sestavení pro šablony a generující modely bezplatná, vytvoření označené datové sady může vést k určitým minimálním nákladům.
Pro v4.0 2024-07-31-preview
, vlastní neurální modely lze trénovat zdarma na maximálně 10 hodin. Bez ohledu na to, jestli trénujete jeden model na 10 hodin, nebo natrénujete více modelů po dobu 10 hodin, nebudete se účtovat za prvních 10 hodin. Po použití bezplatné 10 hodin se vám automaticky naúčtuje další hodina trénování. Podrobnosti o cenách najdete na stránce s cenami. Tato nová placená funkce trénování umožňuje delší dobu trénování modelů zpracovávat větší dokumenty. Další informace o této placené trénovací funkci najdete v oddílu fakturace vlastního neurálního modelu.
Pro v3.0 2022-08-31
nebo v3.1 2023-07-31
, vlastní neurální modely lze trénovat zdarma na maximálně 20 trénovacích relací, přičemž každá relace je omezena na 30 minut trvání trénování. Jakmile využijete všech 20 trénovacích relací, můžete odeslat lístek podpora Azure a zvýšit limit trénovací relace. Pokud chcete limit zvýšit, považují se dvě tréninkové relace za jednu hodinu trénování a účtuje se vám za dvě relace / jedna hodina trénování. Podrobnosti o cenách najdete na [stránce s cenami]. Další informace o způsobech zvýšení limitu najdete v oddílu fakturace vlastního neurálního modelu. Funkce placeného v3.0
trénování a v3.1
pro placené trénování není k dispozici. Placená funkce trénování pro vlastní neurální model je k dispozici pouze na v4.0
.
Účet úložiště
Vypršela platnost tokenu sdíleného přístupového podpisu (SAS), který mám pro ověřování účtu úložiště?
Ano.
Při vytváření sdíleného přístupového podpisu (SAS) je výchozí doba trvání 48 hodin. Po 48 hodinách musíte vytvořit nový token.
Zvažte nastavení delší doby trvání pro dobu, po kterou používáte účet úložiště s funkcí Document Intelligence.
Může funkce Document Intelligence přistupovat k datům v mém účtu úložiště, pokud se nachází za virtuální sítí nebo bránou firewall?
Ne, ne přímo.
Funkce Document Intelligence nemá přístup k vašemu účtu úložiště, pokud je chráněná virtuální sítí nebo bránou firewall.
Přístup k privátnímu účtu úložiště Azure a ověřování ale podporují spravované identity pro prostředky Azure. Když používáte spravovanou identitu, může služba Document Intelligence přistupovat k vašemu účtu úložiště pomocí přiřazených přihlašovacích údajů.
Pokud máte v úmyslu analyzovat data účtu privátního úložiště pomocí FUNKCE FOTT, musíte nástroj nasadit za virtuální sítí nebo bránou firewall.
Naučte se vytvářet a používat spravovanou identitu pro prostředek Document Intelligence.
Kontejnery
Existuje rozdíl mezi odpojenými a připojenými kontejnery?
Ano.
I když jsou možnosti modelu stejné pro připojené a odpojené kontejnery, způsoby fakturace a připojení se liší:
Připojené kontejnery odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. U připojených kontejnerů se k odesílání fakturačních údajů do Azure vyžaduje připojení k internetu. Připojené kontejnery Document Intelligence odesílají fakturační údaje do Azure pomocí prostředku Document Intelligence na vašem účtu Azure. Připojené kontejnery neodesílají zákaznická data, jako je obrázek nebo text analyzovaný, do Microsoftu. Příklad informací, které připojené kontejnery odesílají Do Microsoftu za účelem fakturace, najdete v nejčastějších dotazech ke kontejnerům Azure AI.
Odpojené kontejnery umožňují používat rozhraní API, která jsou odpojená od internetu. Fakturační údaje se neposílají přes internet. Místo toho se poplatky zakládají na zakoupené úrovni závazku. V současné době je využití odpojeného kontejneru k dispozici pro vlastní modely Document Intelligence a faktury.
Můžu použít místní úložiště pro kontejner s popisky ukázky funkce Document Intelligence (FOTT)?
Ano.
FOTT má verzi, která používá místní úložiště. Na počítači s Windows musí být nainstalovaná verze. Můžete ho nainstalovat z tohoto umístění.
Na stránce projektu zadejte identifikátor URI složky popisku jako /shared nebo /shared/sub-dir, pokud jsou soubory popisků v podadresáři. Všechny ostatní chování nástroje popisování v ukázce document intelligence jsou stejné jako hostovaná služba.
Je vhodné vertikálně navýšit kapacitu?
Ano.
Pro asynchronní volání můžete spustit více kontejnerů se sdíleným úložištěm. Kontejner, který zpracovává POST
volání analýzy, ukládá výstup do úložiště. Pak může jakýkoli jiný kontejner načíst výsledky z úložiště a obsluhovat GET
volání. ID požadavku není svázané s kontejnerem.
Pro synchronní volání můžete spustit více kontejnerů, ale pouze jeden kontejner obsluhuje požadavek. Vzhledem k tomu, že se jedná o blokující volání, může jakýkoli kontejner z fondu odeslat požadavek a odeslat odpověď. V této části je na žádost vázán pouze jeden kontejner a nevyžaduje se žádné dotazování.
Můžu nastavit kontejnery se sdíleným úložištěm?
Ano.
Kontejnery používají Mounts: Shared
vlastnost při spouštění pro zadání sdíleného úložiště pro ukládání souborů zpracování. Informace o použití této vlastnosti najdete v dokumentaci ke kontejnerům.
Ochrana osobních údajů a zabezpečení
Ukládá funkce Document Intelligence moje data?
Ano, krátce.
U všech funkcí funkce Document Intelligence dočasně ukládá data a výsledky ve službě Azure Storage ve stejné oblasti jako požadavek. Data se pak odstraní do 24 hodin od odeslání žádosti o analýzu.
Přečtěte si další informace o datech, ochraně osobních údajů a zabezpečení pro funkci Document Intelligence.
U vytrénovaných vlastních modelů se dočasné výstupy po analýze a označování ukládají do stejného umístění Azure Storage, kam ukládáte trénovací data. Vytrénované vlastní modely se ukládají ve službě Azure Storage ve stejné oblasti a logicky se izolují s přihlašovacími údaji předplatného Azure a rozhraní API.
Další nápověda a podpora
Jsou k dispozici další prostředky, které poskytují řešení dotazů k azure AI Document Intelligence?
Ano.
Microsoft Q &A je domovskou sadou technických otázek a odpovědí v Microsoftu. Dotazy specifické pro funkci Document Intelligence můžete filtrovat.
Můžu poskytnout přímou zpětnou vazbu, pokud služba nerozpozná konkrétní text nebo ho nesprávně rozpoznává při označování dokumentů?
Ano.
Modely document Intelligence průběžně aktualizujeme a vylepšujeme. Tým document intelligence můžete poslat e-mailem. Pokud je to možné, nasdílejte ukázkový dokument se zvýrazněným problémem.