Document Intelligence Studio

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
  • Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
  • Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
  • USA, östra
  • USA, västra 2
  • Europa, västra

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.0

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1

Document Intelligence Studio är ett onlineverktyg för att visuellt utforska, förstå och integrera funktioner från document intelligence-tjänsten i dina program. Använd Document Intelligence Studio för att:

  • Läs mer om de olika funktionerna i Dokumentinformation.
  • Använd dokumentinformationsresursen för att testa modeller på exempeldokument eller ladda upp dina egna dokument.
  • Experimentera med olika tilläggs- och förhandsversionsfunktioner för att anpassa utdata efter dina behov.
  • Träna anpassade klassificeringsmodeller för att klassificera dokument.
  • Träna anpassade extraheringsmodeller för att extrahera fält från dokument.
  • Hämta exempelkod för de språkspecifika SDK:er som ska integreras i dina program.

Använd snabbstarten för Document Intelligence Studio för att komma igång med att analysera dokument med dokumentanalys eller fördefinierade modeller. Skapa anpassade modeller och referera till modellerna i dina program med någon av de språkspecifika SDK:erna och andra snabbstarter.

Följande bild visar landningssidan för Document Intelligence Studio.

Startsida för Document Intelligence Studio

Komma igång

Om du besöker Studio för första gången följer du komma igång-guiden för att konfigurera Studio för användning.

Analysera alternativ

  • Dokumentinformation stöder avancerade analysfunktioner. Studio tillåter en startpunkt (knappen Analysera alternativ) för att enkelt konfigurera tilläggsfunktionerna.

  • Beroende på scenariot för dokumentextrahering konfigurerar du analysintervallet, dokumentsidans intervall, valfri identifiering och premiumidentifieringsfunktioner.

    Skärmbild av dialogrutan analysera-alternativ.

    Kommentar

    Extrahering av teckensnitt visualiseras inte i Document Intelligence Studio. Du kan dock kontrollera formatmallsavsnittet i JSON-utdata för att se resultatet av teckensnittsidentifieringen.

✔️ Automatisk etikettering av dokument med fördefinierade modeller eller en av dina egna modeller

  • På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka dina dokument med någon av de fördefinierade modellerna i Document Intelligent Service eller dina tränade modeller.

    Animerad skärmbild som visar automatisk etikettering i Studio.

  • För vissa dokument är duplicerade etiketter möjliga när autoetiketten har körts. Se till att ändra etiketterna så att det inte finns några dubblettetiketter på etikettsidan efteråt.

    Skärmbild som visar dubblettetikettvarning efter automatisk etikettering.

✔️ Tabeller för automatisk etikettering

  • På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka tabellerna i dokumentet utan att behöva märka tabellerna manuellt.

    Animerad skärmbild som visar automatisk tabelletikettering i Studio.

✔️ Lägga till testfiler direkt i din träningsdatauppsättning

  • När du har tränat en anpassad extraheringsmodell använder du testsidan för att förbättra modellkvaliteten genom att ladda upp testdokument till träningsdatauppsättningen om det behövs.

  • Om en låg konfidenspoäng returneras för vissa etiketter kontrollerar du att de är korrekt märkta. Om inte lägger du till dem i träningsdatauppsättningen och ometiketter för att förbättra modellkvaliteten.

Animerad skärmbild som visar hur du lägger till testfiler i träningsdatauppsättningen.

✔️ Använd alternativen och filtren för dokumentlistan i anpassade projekt

  • På sidan med anpassade extraheringsmodeller kan du nu enkelt navigera i dina träningsdokument genom att använda sökningen, filtrera och sortera efter funktion.

  • Använd rutnätsvyn för att förhandsgranska dokument eller använda listvyn för att rulla igenom dokumenten enklare.

    Skärmbild av alternativ och filter för dokumentlistans vy.

✔️ Projektdelning

Stöd för dokumentinformationsmodell

  • Läs: Prova funktionen Läs i Dokumentinformation för att extrahera textrader, ord, identifierade språk och handskriven stil om det identifieras. Börja med studioläsningsfunktionen. Utforska med exempeldokument och dokument. Använd den interaktiva visualiseringen och JSON-utdata för att förstå hur funktionen fungerar. Se läsöversikten för att lära dig mer och komma igång med Python SDK-snabbstarten för Layout.

  • Layout: Prova layoutfunktionen i Dokumentinformation för att extrahera text, tabeller, markeringsmarkeringar och strukturinformation. Börja med studiolayoutfunktionen. Utforska med exempeldokument och dokument. Använd den interaktiva visualiseringen och JSON-utdata för att förstå hur funktionen fungerar. Se layoutöversikten för att lära dig mer och komma igång med Python SDK-snabbstarten för Layout.

  • Fördefinierade modeller: Med dokumentinformationens fördefinierade modeller kan du lägga till intelligent dokumentbearbetning i dina appar och flöden utan att behöva träna och skapa egna modeller. Börja till exempel med funktionen Studio-faktura. Utforska med exempeldokument och dokument. Använd den interaktiva visualiseringen, listan över extraherade fält och JSON-utdata för att förstå hur funktionen fungerar. Se översikten över modeller för att lära dig mer och komma igång med Python SDK-snabbstarten för fördefinierad faktura.

  • Anpassade extraheringsmodeller: Med dokumentinformationens anpassade modeller kan du extrahera fält och värden från modeller som tränats med dina data, skräddarsydda för dina formulär och dokument. Skapa fristående anpassade modeller eller kombinera två eller flera anpassade modeller för att skapa en sammansatt modell för att extrahera data från flera formulärtyper. Börja med funktionen Anpassade Studio-modeller. Använd hjälpguiden, etiketteringsgränssnittet, träningssteget och visualiseringarna för att förstå hur funktionen fungerar. Testa den anpassade modellen med dina exempeldokument och iterera för att förbättra modellen. Mer information finns i översikten över anpassade modeller.

  • Anpassade klassificeringsmodeller: Dokumentklassificering är ett nytt scenario som stöds av Dokumentinformation. API:et för dokumentklassificerare stöder klassificerings- och delningsscenarier. Träna en klassificeringsmodell för att identifiera de olika typer av dokument som programmet stöder. Indatafilen för klassificeringsmodellen kan innehålla flera dokument och klassificera varje dokument inom ett associerat sidintervall. Mer information finns i anpassade klassificeringsmodeller .

  • Tilläggsfunktioner: Dokumentinformation stöder nu mer avancerade analysfunktioner. Dessa valfria funktioner kan aktiveras och inaktiveras i studion med hjälp av Analze Options knappen på varje modellsida. Det finns fyra tillgängliga tilläggsfunktioner: highResolution, formel, teckensnitt och extrahering av streckkoder. Mer information finns i Tilläggsfunktioner .

Nästa steg