Översikt över ostrukturerad dokumentbearbetning i Microsoft Syntex

Obs!

Till och med juni 2024 kan du prova ostrukturerad dokumentbearbetning och andra valda Syntex-tjänster utan kostnad om du har konfigurerat fakturering med användningsbaserad betalning. Information och begränsningar finns i Prova Microsoft Syntex och utforska dess tjänster.

Använd den ostrukturerade dokumentbearbetningsmodellen (undervisningsmetod) för att automatiskt klassificera filer och extrahera information. Det fungerar bäst för ostrukturerade dokument, till exempel brev eller kontrakt.

Obs!

Microsoft respekterar sekretessen och ägarskapet för data som du använder för att träna och bearbeta modeller i Syntex. Ingen av organisationens data används eller överförs av Microsoft för att träna AI-modeller, stora språkmodeller eller andra modeller. Dina data förblir säkert inom organisationens klientorganisation. Mer information finns i Microsofts dataskydd och sekretess.

Introduktion till ostrukturerade modeller

Den ostrukturerade dokumentbearbetningsmodellen (kallades tidigare modell för dokumenttolkning) använder artificiell intelligens (AI) för att bearbeta dokument. De här dokumenten måste innehålla text som kan identifieras utifrån fraser eller mönster. Med den identifierade texten anges både vilken typ av fil det är (klassificeringen) och vad du vill extrahera (dess extraherare).

Obs!

Mer information om hur du använder Syntex och scenarioexempel finns i Komma igång med att implementera Microsoft Syntex och scenarier och användningsfall för Microsoft Syntex.

Ostrukturerade modeller för dokumentbearbetning skapas och hanteras på en typ av SharePoint-webbplats som kallas ett innehållscenter. När den används i ett SharePoint-dokumentbibliotek kopplas modellen till en innehållstyp med kolumner för att lagra den information som extraheras. Innehållstypen som du skapar lagras i galleriet för innehållstyper i SharePoint. Du kan också välja befintliga innehållstyper för att använda deras schema.

Obs!

Skrivskyddade eller förseglade innehållstyper kan inte uppdateras, så de kan inte användas i en modell.

Lägg till klassificerare och extraktorer i dina ostrukturerade modeller för dokumentbearbetning för att utföra följande åtgärder:

  • Klassificerare används för att identifiera och klassificera dokument som har laddats upp till dokumentbiblioteket. En klassificerare kan t. ex. tränas till att identifiera alla avtalsförnyelser som laddas upp till biblioteket. Innehållstypen avtalsförnyelse definieras av dig när du skapar din klassificerare.

  • Extraktorer hämtar information från dokumenten. För varje kontraktförnyelsedokument som identifieras i dokumentbiblioteket visas till exempel kolumner som visar tjänstens startdatum och klient för varje dokument.

Du kan använda exempelfiler för att träna och testa dina klassificerare och extraktorer på din modell. Exempelfiler tillhandahåller modellexemplen för vad du ska titta efter när du försöker identifiera och hämta data från filer. Till exempel kan du träna dina klassificerare för avtalsförnyelse och extraktorer med exempel på avtalsförlängningar som företaget arbetar med. Du kan också använda exempelfiler för att testa hur effektiv modellen är.

När du har publicerat modellen använder du innehållscentret för att använda det på alla SharePoint-dokumentbibliotek som du har åtkomst till.

Krav och begränsningar

Information om vilka krav du bör tänka på när du väljer den här modellen finns i Krav och begränsningar för modeller i Microsoft Syntex.