Co je Azure Porozumění obsahu v nástrojích Foundry?

Azure Zpracování obsahu v nástrojích Foundry je nástroj Foundry Tool, který je k dispozici jako součást Microsoft Foundry Resource na portálu Azure. Pomocí generující umělé inteligence zpracovává a ingestuje mnoho typů obsahu, včetně dokumentů, obrázků, videí a zvuku, do uživatelsky definovaného výstupního formátu. Content Understanding nabízí zjednodušený proces, který umožňuje zdůvodnit velké objemy nestrukturovaných dat, což urychlí čas na hodnotu generováním výstupu, který můžete integrovat do automatizačních a analytických pracovních postupů.

Snímek obrazovky s přehledem, procesem a pracovním postupem služby Content Understanding

Proč používat službu Content Understanding?

Služba Content Understanding zrychluje čas na hodnotu tím, že umožňuje přímé zpracování nestrukturovaných dat se skóre spolehlivosti, minimalizací ruční kontroly a snížením provozních nákladů. Mezi klíčové výhody patří:

  • Zjednodušte a zjednodušte pracovní postupy. Služba Content Understanding standardizuje extrakci a klasifikaci obsahu, struktury a přehledů z různých typů obsahu do sjednoceného procesu.

  • Zjednodušení extrakce polí Extrakce polí služby Content Understanding usnadňuje generování strukturovaného výstupu z nestrukturovaného obsahu. Definujte schéma pro extrakci, klasifikaci a generování hodnot polí bez složitého ladění příkazů.

  • Zvyšte přesnost. Content Understanding využívá více modelů AI k analýze a křížovému ověření informací současně, což vede k přesnějším a spolehlivějším výsledkům.

  • Skóre spolehlivosti a uzemnění Funkce Content Understanding zajišťuje přesnost extrahovaných hodnot a současně minimalizuje náklady na kontrolu člověka.

  • Klasifikovat typy obsahu Funkce Content Understanding umožňuje klasifikovat typy dokumentů a zjednodušit tak schopnost zpracovávat obsah. Tato funkce je nyní dostupná v jednotném přístupu v rozhraní API pro analýzu.

  • Předem připravené analyzátory specifické pro konkrétní odvětví. Content Understanding zahrnuje předem připravené analyzátory navržené pro konkrétní scénáře, včetně přípravy daní, zpracování dokumentů zadávání zakázek, analýzy kontraktů, analýzy call center, analýzy médií a mnoho dalšího.

Případy použití služby Content Understanding

  • Inteligentní zpracování dokumentů (IDP) Služba Content Understanding umožňuje inteligentní zpracování dokumentů převodem nestrukturovaných dokumentů na strukturovaná data s vysokou přesností. Skóre spolehlivosti a možnosti uzemnění zajišťují kvalitu dat a minimalizují ruční kontrolu a snižují provozní náklady. Například automatizujte zpracování faktur, analýzu smluv a správu pojistných událostí extrahováním a ověřováním polí ze složitých dokumentů.

  • Agentické aplikace. Content Understanding změní neuspořádané vstupy multimodálních souborů na předvídatelné standardizované vstupy. Poskytuje čisté reprezentace markdownu pro uspořádání logických a znalostních procesů, což zajišťuje přehlednost a kontext pro následné úkoly. Když jsou vyžadována strukturovaná data, poskytují schématem sladěná pole klíč-hodnota se skóre spolehlivosti a ukotvením, což umožňuje agentům automatizovat rozhodování s přesností a ověřitelností.

  • Generování rozšířené o vyhledávání a načítání (RAG) Služba Content Understanding umožňuje zahrnovat obsah jakéhokoli typu do vyhledávacího indexu, s rozsáhlou podporou pro popis a analýzu obrazců, aby byla vaše data přístupnější. Služba Content Understanding nabízí několik předem připravených analyzátorů, které jsou vyladěné tak, aby vám poskytovaly nejlepší výstupy pro scénáře hledání RAG.

  • Automatizace robotických procesů (RPA) Služba Content Understanding se bezproblémově integruje s pracovními postupy RPA tím, že poskytuje strukturovaná data extrahovaná z různých typů obsahu. Tato funkce umožňuje komplexní automatizaci obchodních procesů, které vyžadují porozumění obsahu, jako je zpracování objednávek, onboarding zákazníků a pracovní postupy dodržování právních předpisů.

  • Analýzy a vytváření sestav: Extrahované výstupy polí služby Content Understanding vylepšují analýzy a vytváření sestav, což firmám umožňuje získávat cenné přehledy, provádět hlubší analýzu a provádět informovaná rozhodnutí na základě přesných sestav.

  • Optimalizovat pracovní postup prostřednictvím klasifikace: Funkce klasifikace obsahu umožňuje nejprve kategorizovat dokumenty před jejich směrováním do přidruženého analyzátoru pro extrakci.

Oborové aplikace

Mezi běžné oborové aplikace pro službu Content Understanding patří:

Aplikace Popis
Automatizace daní Daňové společnosti můžou pomocí služby Content Understanding vygenerovat jednotný pohled na informace z různých dokumentů a vytvořit komplexní daňové přiznání.
Zpracování žádosti o hypotéku Analyzujte dodatečnou podpůrnou dokumentaci a žádosti o hypotéku, abyste zjistili, zda potenciální kupující domu poskytl veškerou potřebnou dokumentaci k zajištění hypotéky.
Ověření smlouvy pomocí faktury Pečlivě zkontrolujte faktury a smluvní smlouvy s klienty. Použití vícekrokového procesu pro analýzu dat. Ujistěte se, že závěry, jako je ověření konzistence mezi fakturou a smlouvou, jsou přesné a důkladné.
Příjem dat rozšířené generace načítání (RAG) Organizace můžou vylepšit pracovní postupy RAG extrahováním komplexních informací z dokumentů, které by jinak chyběly. Popisy obrázku zachycují informace z grafů, diagramů a vizualizací, aby je bylo možné prohledávat. Analýza rozložení zachovává strukturu dokumentů včetně tabulek, oddílů a hierarchií. Detekce poznámek zachycuje rukou psané poznámky, podtržení a přeškrtnutí.
Analýza po volání Firmy a volající centra můžou generovat přehledy z záznamů hovorů za účelem sledování klíčových ukazatelů výkonu (KPI), zlepšení zkušeností produktů, generování obchodních přehledů, vytváření diferencovaných zákaznických prostředí a rychlejší a přesnější odpovědi na dotazy.
Správa mediálních prostředků Dodavatelé softwaru a médií můžou pomocí nástroje Content Understanding extrahovat bohatší cílené informace z videí pro řešení správy mediálních prostředků.
Vylepšená zákaznická podpora Firmy s kanály podpory můžou využít funkci Content Understanding for RAG search k vylepšení kvality odpovědí na základě dat z předchozích problémů a zpětné vazby zákazníků.

Klíčové komponenty služby Content Understanding

Architektura Content Understanding zpracovává nestrukturovaný obsah prostřednictvím několika fází a transformuje vstupy na strukturované a použitelné výstupy. Následující tabulka popisuje jednotlivé komponenty zleva doprava, jak je znázorněno v diagramu:

Diagram znázorňující architekturu Content Understanding se vstupy procházejícími analyzátory do strukturovaného výstupu

Komponenty Popis
Vstupy Zdrojový obsah, který zpracovává Content Understanding. Podporuje různé způsoby, včetně dokumentů, obrázků, videa a zvuku. Přečtěte si další informace o typech vstupních souborů.
Analyzer Základní komponenta, která definuje způsob zpracování obsahu. Konfiguruje nastavení extrakce obsahu, schéma extrakce polí a nasazení modelu. Po nakonfigurování analyzátor konzistentně použije tato nastavení na všechna příchozí data. Content Understanding nabízí předem připravené analyzátory pro běžné scénáře a podporuje vlastní analyzátory přizpůsobené vašim potřebám. Přečtěte si další informace o analyzátorech, předem připravených analyzátorech a vlastních analyzátorech.
Extrakce obsahu Transformuje nestrukturovaný vstup na normalizovaný, strukturovaný text a metadata. Extrahuje text pomocí optického rozpoznávání znaků (OCR), identifikuje značky výběru a čárové kódy, rozpozná vzorce a rozpozná prvky rozložení, jako jsou odstavce, oddíly a tabulky. U zvuku a videa přepisuje řeč a identifikuje klíčové vizuální prvky. Přečtěte si další informace o extrakci obsahu.
Segmentace Rozdělí dokumenty nebo videa do logických oddílů pro cílené zpracování. Nakonfigurováno pomocí enableSegment vlastnosti ve schématu analyzátoru. Umožňuje rozdělit obsah na smysluplné bloky dat, například rozdělit dokument podle typu dokumentu nebo rozdělit video na scény. Přečtěte si další informace o segmentaci a klasifikaci.
Extrakce polí Generuje strukturované páry klíč-hodnota na základě vašeho definovaného schématu. Viz omezení služeb pro podporované typy polí. Pole se dají generovat třemi způsoby:

Extrahování: Přímo extrahujte hodnoty, které se zobrazují ve vstupním obsahu (podporované pouze pro dokumenty), například data z účtenek nebo podrobností o položce z faktur.

Klasifikovat: Klasifikovat obsah z předdefinované sady kategorií, jako je například mínění volání nebo typ grafu, a směrovat ho na správný analyzátor pro analýzu.

Generovat: Generovat hodnoty volně ze vstupních dat, jako je shrnutí zvukové konverzace nebo vytváření popisů scén z videí.

Přečtěte si další informace o extrakci polí.
Skóre spolehlivosti Poskytuje odhady spolehlivosti od 0 do 1 pro každou extrahovanou hodnotu pole. Vysoké skóre značí přesnou extrakci dat, což umožňuje přímé zpracování v pracovních postupech automatizace. Povoleno pomocí estimateFieldSourceAndConfidence nastavení v analyzátorech dokumentů. Přečtěte si další informace o skóre spolehlivosti.
Uzemnění Identifikuje konkrétní oblasti v obsahu, ve kterých se každá hodnota extrahovala nebo vygenerovala. Uzemnění zdroje umožňuje uživatelům ve scénářích automatizace rychle ověřit správnost hodnot polí jejich trasováním zpět ke svému původu ve zdrojovém obsahu. Povoleno pomocí estimateFieldSourceAndConfidence nastavení v analyzátorech dokumentů. Přečtěte si další informace o uzemnění.
Kontextová konfigurace Vrstva contextualizace připraví kontext pro generování modelů a následné zpracování jejich výstupu. Zahrnuje normalizaci a formátování výstupu, výpočet zdrojového uzemnění, výpočet skóre spolehlivosti a kontextové inženýrství pro optimalizaci využití modelu. Přečtěte si další informace o kontextualizaci.
Modely slévárny The Foundry velké jazykové modely (LLM) a vkladové modely, které pohání generativní schopnosti. Pro svoje tréninkové příklady si přineste vlastní nasazení podporovaných generativních modelů a modelů pro vkládání textu. Služba Content Understanding používá tyto modely k extrakci polí, analýze obrázku a dalším funkcím využívajícím AI. Přečtěte si další informace o modelech a nasazeních.
Strukturovaný výstup Konečný výsledek se zadává ve zvoleném formátu. Obsah může být výstupem markdownu pro scénáře vyhledávání a načítání nebo jako strukturovaný JSON odpovídající definovanému schématu pro pracovní postupy automatizace a analýzy.

Nástroje pro porozumění obsahu

Content Understanding je služba Foundry. Pokud chcete použít porozumění obsahu, musíte vytvořit zdroj Azure Foundry. Content Understanding Studio doplňuje prostředí Foundry, pokud potřebujete pokročilé funkce. Podrobnější rozpis jednotlivých služeb najdete v části Porovnání funkcí: Porozumění obsahu v Foundry vs Content Understanding Studio.

  • Content Understanding in Foundry (nový) portál (připravujeme): Portál Foundry NextGen umožňuje vytvářet pokročilé komplexní agentské pracovní postupy pomocí nástroje Content Understanding Tool.
  • Content Understanding Studio: Doplňkové uživatelské prostředí, Content Understanding Studio umožňuje hladký přechod, pokud přecházíte z funkce Document Intelligence. Nabízí prostředí optimalizované pro zlepšení výkonu analyzátoru, včetně vylepšení vlastních analyzátorů pomocí technik označování dat. Podporuje také vytváření vlastních analyzátorů založených na klasifikaci.

Zodpovědná AI

Funkce Content Understanding je navržená tak, aby bránila zpracování škodlivého obsahu, jako je grafické násilí a gore, nenávistná řeč a bullying, zneužití, zneužívání a další. Služba používá standardní infrastrukturu Foundry, včetně Bezpečnost obsahu Azure AI, a integruje výsledky bezpečnosti obsahu do výstupu Content Understanding. Další informace a úplný seznam zakázaného obsahu najdete v poznámce transparentnosti a v kodexu chování.

Filtrování obsahu a mantinely

Content Understanding zobrazí výsledky filtru obsahu přímo z nasazení modelu Foundry, které používá. Každé nasazení modelu Foundry má přidruženou instanci Guardrails , která vyhodnocuje výzvy odeslané do modelu i vrácené dokončení. Když instance Guardrails označí obsah příznakem, výsledek je součástí Content Understanding analyze response ve formátu content_filters pole.

Pokud chcete změnit chování filtrování obsahu pro analyzátory, aktualizujte instanci Guardrails přidruženou k nasazení modelu v projektu Azure AI Foundry. Můžete upravit prahové hodnoty pro každou kategorii nebo přepnout z blokování do režimu poznámek. Podrobnosti najdete v tématu Filtrování obsahu.

Filtry obsahu můžete upravit tak, aby se místo blokování obsahu nastavila úroveň závažnosti nebo aby obsah byl označen, což vám umožní zpracovávat potenciálně škodlivý obsah ve vašem pracovním postupu.

Další informace o typech filtru obsahu najdete v tématu Typy filtru obsahu.

Důležité

Možnosti rozpoznávání tváře

Content Understanding poskytuje možnosti popisu tváře, které můžou generovat podrobné popisy tváří v obsahu videa a obrázku. Pokud je tato možnost povolená, generující model popisuje atributy obličeje, jako jsou vlasy na obličeji a výraz obličeje, a dokáže identifikovat významné osoby nebo celebrity. Přečtěte si další informace o popisu tváře při zpracování videa.

Ochrana osobních údajů a zabezpečení dat

Při používání služby Content Understanding si projděte zásady Microsoft týkající se zákaznických dat. Další informace najdete na stránce Data, ochrana a ochrana osobních údajů .

Důležité

Pokud ke zpracování biometrických údajů používáte Microsoft produkty nebo služby, zodpovídáte za: (i) poskytujete oznámení subjektům údajů, včetně období uchovávání informací a zničení; ii) získání souhlasu subjektů údajů; a (iii) odstranění biometrických údajů podle příslušných požadavků na ochranu údajů. Související informace najdete v tématu Data a ochrana osobních údajů pro rozpoznávání tváře.

Začínáme

Začněte pomocí těchto rychlých úvodních příruček: