Kom igång: Document Intelligence Studio

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)

Document Intelligence Studio är ett onlineverktyg för att visuellt utforska, förstå och integrera funktioner från document intelligence-tjänsten i dina program. Du kan komma igång genom att utforska förtränad modeller med exempel eller egna dokument. Du kan också skapa projekt för att skapa anpassade mallmodeller och referera till modellerna i dina program med hjälp av Python SDK och andra snabbstarter.

Förutsättningar för nya användare

Dricks

Skapa en Azure AI-tjänstresurs om du planerar att komma åt flera Azure AI-tjänster under en enda slutpunkt/nyckel. För endast åtkomst till dokumentinformation skapar du en dokumentinformationsresurs. Observera att du behöver en resurs med en enda tjänst om du tänker använda Microsoft Entra-autentisering.

Azure-rolltilldelningar

För dokumentanalys och fördefinierade modeller krävs följande rolltilldelningar för olika scenarier.

  • Grundläggande
    • Cognitive Services-användare: du behöver den här rollen för att dokumentera intelligens eller Azure AI-tjänster för att komma in på analyssidan.
  • Avancerade
    • Deltagare: du behöver den här rollen för att skapa resursgruppen, document intelligence-tjänsten eller Azure AI-tjänstresursen.

Modeller

Fördefinierade modeller hjälper dig att lägga till funktioner för dokumentinformation i dina appar utan att behöva skapa, träna och publicera dina egna modeller. Du kan välja mellan flera fördefinierade modeller som var och en har en egen uppsättning datafält som stöds. Valet av modell som ska användas för analysåtgärden beror på vilken typ av dokument som ska analyseras. Dokumentinformation stöder för närvarande följande fördefinierade modeller:

Dokumentanalys

  • Layout: extrahera text, tabeller, markeringsmarkeringar och strukturinformation från dokument (PDF, TIFF) och bilder (JPG, PNG, BMP).
  • Läs: extrahera textrader, ord, deras platser, identifierade språk och handskriven stil om de identifieras från dokument (PDF, TIFF) och bilder (JPG, PNG, BMP).

Inbyggda

  • Faktura: extrahera text, markeringar, tabeller, nyckel/värde-par och nyckelinformation från fakturor.
  • Kvitto: extrahera text och nyckelinformation från kvitton.
  • Sjukförsäkringskort: extrahera försäkringsgivare, medlem, recept, gruppnummer och annan viktig information från amerikanska sjukförsäkringskort.
  • W-2: extrahera text och nyckelinformation från W-2 skatteformulär.
  • ID-dokument: Extrahera text och viktig information från körkort och internationella pass.

Anpassat

  • Anpassade extraheringsmodeller: extrahera information från formulär och dokument med anpassade extraheringsmodeller. Träna snabbt en modell genom att märka så få som fem exempeldokument.
  • Anpassad klassificeringsmodell: träna en anpassad klassificerare för att skilja mellan de olika dokumenttyperna i dina program. Träna snabbt en modell med så få som två klasser och fem exempel per klass.

När du har slutfört förutsättningarna går du till Document Intelligence Studio.

  1. Välj en funktion för dokumentinformationstjänsten på startsidan för Studio.

  2. Det här steget är en engångsprocess om du inte redan har valt tjänstresursen från tidigare användning. Välj din Azure-prenumeration, resursgrupp och resurs. (Du kan ändra resurserna när som helst i "Inställningar" på den översta menyn.) Granska och bekräfta dina val.

  3. Välj knappen Analysera för att köra analys i exempeldokumentet eller prova dokumentet med hjälp av kommandot Lägg till.

  4. Använd kontrollerna längst ned på skärmen för att zooma in och ut och rotera dokumentvyn.

  5. Observera det markerade extraherade innehållet i dokumentvyn. Håll muspekaren över nycklar och värden för att se information.

  6. På fliken Resultat i utdataavsnittet bläddrar du i JSON-utdata för att förstå tjänstsvarsformatet.

  7. På fliken Kod bläddrar du i exempelkoden för integrering. Kopiera och ladda ned för att komma igång.

Krav har lagts till för anpassade projekt

Förutom Azure-kontot och en dokumentinformations- eller Azure AI-tjänstresurs behöver du:

Azure Blob Storage-container

Ett Azure Blob Storage-konto med standardprestanda. Du skapar containrar för att lagra och organisera dina träningsdokument i ditt lagringskonto. Om du inte vet hur du skapar ett Azure-lagringskonto med en container följer du dessa snabbstarter:

  • Skapa ett lagringskonto. När du skapar ditt lagringskonto måste du välja Standardprestanda i fältet Instansinformation → Prestanda .
  • Skapa en container. När du skapar containern anger du fältet Offentlig åtkomstnivå till Container (anonym läsåtkomst för containrar och blobar) i fönstret Ny container .

Azure-rolltilldelningar

För anpassade projekt krävs följande rolltilldelningar för olika scenarier.

  • Grundläggande
    • Cognitive Services-användare: Du behöver den här rollen för dokumentintelligens eller Azure AI-tjänstresurs för att träna den anpassade modellen eller göra analyser med tränade modeller.
    • Storage Blob Data-deltagare: Du behöver den här rollen för lagringskontot för att skapa ett projekt och etikettdata.
  • Avancerade
    • Lagringskontodeltagare: Du behöver den här rollen för att lagringskontot ska kunna konfigurera CORS-inställningar (det här är en engångsinsats om samma lagringskonto återanvänds).
    • Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser.

Konfigurera CORS

CORS (Cross Origin Resource Sharing) måste konfigureras på ditt Azure-lagringskonto för att det ska vara tillgängligt från Document Intelligence Studio. För att konfigurera CORS i Azure-portalen behöver du åtkomst till cors-fliken för ditt lagringskonto.

  1. Välj fliken CORS för lagringskontot.

    Skärmbild av CORS-inställningsmenyn i Azure-portalen.

  2. Börja med att skapa en ny CORS-post i Blob-tjänsten.

  3. Ange Tillåtna ursprung till https://documentintelligence.ai.azure.com.

    Skärmbild som visar CORS-konfiguration för ett lagringskonto.

    Dricks

    Du kan använda jokertecknet *i stället för en angiven domän för att tillåta att alla ursprungsdomäner gör begäranden via CORS.

  4. Välj alla tillgängliga 8 alternativ för Tillåtna metoder.

  5. Godkänn alla tillåtna rubriker och synliga rubriker genom att ange en * i varje fält.

  6. Ange Maxålder till 120 sekunder eller ett acceptabelt värde.

  7. Välj knappen Spara överst på sidan för att spara ändringarna.

CORS bör nu konfigureras för att använda lagringskontot från Document Intelligence Studio.

Exempeldokumentuppsättning

  1. Logga in på Azure-portalen och gå till Lagringskontots>datalagringscontainrar>.

    Skärmbild av menyn Datalagring i Azure-portalen.

  2. Välj en container i listan.

  3. Välj Ladda upp på menyn överst på sidan.

    Skärmbild av knappen för uppladdning av containrar i Azure-portalen.

  4. Fönstret Ladda upp blob visas.

  5. Välj vilka filer som ska laddas upp.

    Skärmbild av uppladdningsblobfönstret i Azure-portalen.

Kommentar

Som standard använder Studio dokument som finns i containerns rot. Du kan dock använda data ordnade i mappar genom att ange mappsökvägen i stegen för att skapa anpassade formulärprojekt. SeOrdna dina data i undermappar

Anpassade modeller

Om du vill skapa anpassade modeller börjar du med att konfigurera projektet:

  1. Från Studio-startsidan väljer du kortet Anpassad modell för att öppna sidan Anpassade modeller.

  2. Använd kommandot "Skapa ett projekt" för att starta den nya projektkonfigurationsguiden.

  3. Ange projektinformation, välj Azure-prenumerationen och resursen och Azure Blob Storage-containern som innehåller dina data.

  4. Granska och skicka dina inställningar för att skapa projektet.

  5. Om du vill snabbstarta etiketteringsprocessen använder du funktionen för automatisk etikett för att märka med hjälp av en redan tränad modell eller någon av våra fördefinierade modeller.

  6. För manuell etikettering från grunden definierar du etiketterna och deras typer som du är intresserad av att extrahera.

  7. Markera texten i dokumentet och välj etiketten i listrutan eller i fönstret Etiketter.

  8. Märk ytterligare fyra dokument för att få minst fem dokument märkta.

  9. Välj kommandot Träna och ange modellnamnet, välj om du vill att den neurala modellen (rekommenderas) eller mallmodellen ska börja träna din anpassade modell.

  10. När modellen är klar använder du kommandot Test för att verifiera den med dina testdokument och observera resultaten.

Demo för anpassad dokumentinformationsmodell

Etikettering som tabeller

Kommentar

  1. Använd kommandot Ta bort för att ta bort modeller som inte krävs.

  2. Ladda ned modellinformation för offlinevisning.

  3. Välj flera modeller och skapa dem i en ny modell som ska användas i dina program.

Använda tabeller som visuellt mönster:

För anpassade formulärmodeller kan du när du skapar dina anpassade modeller behöva extrahera datasamlingar från dina dokument. Datasamlingar kan visas i ett par format. Använda tabeller som visuellt mönster:

  • Dynamiskt eller variabelt antal värden (rader) för en viss uppsättning fält (kolumner)

  • Specifik samling värden för en viss uppsättning fält (kolumner och/eller rader)

Etikett som dynamisk tabell

Använd dynamiska tabeller för att extrahera variabelantalet värden (rader) för en viss uppsättning fält (kolumner):

  1. Lägg till en ny etikett av typen "Tabell", välj typen "Dynamisk tabell" och ge etiketten namnet.

  2. Lägg till det antal kolumner (fält) och rader (för data) som du behöver.

  3. Markera texten på sidan och välj sedan cellen som ska tilldelas till texten. Upprepa för alla rader och kolumner på alla sidor i alla dokument.

Dokumentinformationsetiketter som exempel på dynamisk tabell

Etikett som fast tabell

Använd fasta tabeller för att extrahera en specifik samling värden för en viss uppsättning fält (kolumner och/eller rader):

  1. Skapa en ny etikett av typen "Tabell", välj typen "Fast tabell" och ge den namnet.

  2. Lägg till det antal kolumner och rader som du behöver motsvara de två fältuppsättningarna.

  3. Markera texten på sidan och välj sedan cellen för att tilldela den till texten. Upprepa för andra dokument.

Dokumentinformationsetiketter som exempel på fast tabell

Signaturidentifiering

Kommentar

Signaturfält stöds för närvarande endast för anpassade mallmodeller. När du tränar en anpassad neural modell ignoreras etiketterade signaturfält.

Så här etiketterar du för signaturidentifiering: (endast anpassat formulär)

  1. I etikettvyn skapar du en ny etikett av typen Signatur och namnger den.

  2. Använd kommandot Region för att skapa en rektangulär region på den förväntade platsen för signaturen.

  3. Välj den ritade regionen och välj etiketten Signaturtyp för att tilldela den till din ritade region. Upprepa för andra dokument.

Dokumentinformationsetiketter för exempel på signaturidentifiering

Nästa steg

  • Följ migreringsguiden för Document Intelligence v3.1 för att lära dig skillnaderna från den tidigare versionen av REST-API:et.
  • Utforska våra V3.0 SDK-snabbstarter för att prova v3.0-funktionerna i dina program med hjälp av de nya SDK:erna.
  • Se våra rest-API-snabbstarter för v3.0 för att prova v3.0-funktionerna med hjälp av det nya REST-API:et.

Kom igång med Document Intelligence Studio.