Sdílet prostřednictvím


Přehled předem připraveného zpracování dokumentů v Microsoft Syntexu

Poznámka

Až do června 2025 si můžete zdarma vyzkoušet předem připravené zpracování dokumentů a další vybrané služby Syntex, pokud máte nastavené průběžné platby . Informace a omezení najdete v tématu Vyzkoušejte si Microsoft Syntex a prozkoumejte jeho služby.

Kromě vlastních modelů poskytuje Microsoft Syntex předem připravené modely pro automatizaci extrakce informací.

Poznámka

Společnost Microsoft respektuje ochranu osobních údajů a vlastnictví dat, která používáte k trénování a zpracování modelů v syntexu. Microsoft nepoužívá ani nepřenese žádná data vaší organizace k trénování modelů AI, velkojazyčných modelů ani jiných modelů. Vaše data zůstanou bezpečně v tenantovi vaší organizace. Další informace najdete v tématu Ochrana osobních údajů a ochrana osobních údajů společnosti Microsoft.

Úvod do předem připravených modelů

Předem připravené zpracování dokumentů používá předem připravené modely , které jsou předem nakonfigurované tak, aby rozpoznaly dokumenty a strukturované informace v dokumentech. Nemusíte vytvářet nový vlastní model úplně od začátku, ale můžete iterovat stávající předem vytrénovaný model a přidat konkrétní pole, která vyhovují potřebám vaší organizace.

Předem připravené modely používají optické rozpoznávání znaků (OCR) v kombinaci s modely hlubokého učení k identifikaci a extrakci předdefinovaných textových a datových polí společných pro konkrétní typy dokumentů. Začnete analýzou jednoho ze souborů s předem připraveným modelem. Pak vyberete zjištěná pole, která mají smysl pro váš účel. Pokud model nerozpozná pole, která potřebujete, můžete znovu analyzovat pomocí jiného souboru.

Podobně jako ostatní modely se předem připravené modely vytvářejí a spravují v centru obsahu. Při použití na knihovnu dokumentů SharePointu je model přidružený k typu obsahu a obsahuje sloupce pro uložení extrahovaných informací.

Po publikování modelu ho použijte v centru obsahu na libovolnou knihovnu dokumentů SharePointu, ke které máte přístup.

Dostupné předem připravené modely

V současné době jsou k dispozici čtyři předem připravené modely: smlouvy, faktury, účtenky a citlivé informace.

  • Smlouvy. Předem připravený model kontraktů analyzuje a extrahuje klíčové informace z dokumentů kontraktů. Rozhraní API analyzuje kontrakty v různých formátech a extrahuje informace o klíčových kontraktech, jako je název a adresa klienta, doba trvání smlouvy a datum prodloužení platnosti.

  • Faktury. Předem vytvořený model faktur analyzuje a extrahuje klíčové informace z prodejních faktur. Rozhraní API analyzuje faktury v různých formátech a extrahuje klíčové informace o faktuře , jako je jméno zákazníka, fakturační adresa, datum splatnosti a splatná částka.

  • Stvrzenky. Předem vytvořený model účtenek analyzuje a extrahuje klíčové informace z prodejních tržeb. Rozhraní API analyzuje tištěné a ručně psané účtenky a extrahuje klíčové informace o účtenkách , jako je jméno obchodníka, telefonní číslo obchodníka, datum transakce, daň a celkový počet transakcí.

  • Citlivé informace. Předem vytvořený model citlivých informací analyzuje, detekuje a extrahuje klíčové informace z dokumentů. Rozhraní API analyzuje dokumenty v různých formátech a detekuje a extrahuje klíčové citlivé informace, jako jsou osobní a finanční identifikační čísla, fyzické a e-mailové adresy a telefonní čísla.

Další předem připravené modely budou k dispozici v budoucích verzích.

Požadavky a omezení

Informace o požadavcích, které je potřeba zvážit při výběru tohoto modelu, najdete v tématu Požadavky a omezení pro modely v Microsoft Syntexu.