Redigera

Dela via


Vanliga frågor och svar

Det här innehållet gäller för: Bockmarkering v4.0 (förhandsversion)Bockmarkering v3.1 (GA) Bockmarkering v3.0 (GA) Bockmarkering v2.1 (GA)

Azure AI Document Intelligence är en molnbaserad tjänst som använder maskininlärningsmodeller för att extrahera nyckel/värde-par, text och tabeller från dina dokument. Det returnerade resultatet är en strukturerad JSON-utdata. Användningsfall för dokumentinformation omfattar automatiserad databehandling, förbättrade datadrivna strategier och utökade funktioner för dokumentsökning.

Översikt

Är Azure AI Document Intelligence och Azure AI Form Recognizer samma tjänst?

Ja.

Azure AI Document Intelligence och Azure AI Form Recognizer är samma tjänst. Tjänsten bytte namn från Azure AI Form Recognizer till Azure AI Document Intelligence i juli 2023. Tjänsten har samma funktioner och funktioner som före namnbytet.

  • Prisändringar: Det finns inga ändringar i prissättningen. Namnen Cognitive Services och Applied AI Services fortsätter att användas i Azure-fakturering, kostnadsanalys, prislistor och pris-API:er.

  • Icke-bakåtkompatibla ändringar: Det finns inga icke-bakåtkompatibla ändringar i API:er eller klientbibliotek. REST API:er och SDK-versioner 2024-02-29-preview, 2023-10-31-preview och senare byter document intelligencenamn på .

Integreras Dokumentinformation med andra Microsoft usluge?

Ja.

Dokumentinformation integreras med följande tjänster:

AI-funktioner

Kan jag använda Dokumentinformation med generativ AI för dokumentbearbetning?

Ja.

Du kan använda en dokumentgenererande AI-lösning för att chatta med dina dokument, generera fängslande innehåll från dessa dokument och få åtkomst till Azure OpenAI-tjänstmodeller på dina data.

  • Med Azure AI Document Intelligence och Azure OpenAI tillsammans kan du skapa ett företagsprogram som smidigt interagerar med dina dokument med hjälp av naturliga språk. Du kan enkelt hitta svar, få värdefulla insikter och generera nytt och engagerande innehåll från befintliga dokument.

  • Mer information finns i den tekniska communitybloggen.

Erbjuder Dokumentinformation en semantisk segmenteringslösning för hämtning av utökad generering?

Ja.

Semantisk segmentering är ett viktigt steg i hämtningsförhöjd generering (RAG) för att säkerställa effektiv lagring och hämtning.

  • Dokumentinformation tillhandahåller en layoutmodell som segmenterar dokument i sammanhängande enheter baserat på deras semantiska innehåll.

  • Du kan sedan exportera den erhållna informationen till Markdown-format så att du kan anpassa din semantiska segmenteringsstrategi baserat på tillgängliga byggstenar.

Mer information finns i översikten över RAG i Dokumentinformation

Document Intelligence Studio

Behöver jag specifika behörigheter för att få åtkomst till Document Intelligence Studio?

Ja.

Du behöver ett aktivt Azure-konto och en prenumeration med minst en läsarroll för att få åtkomst till Document Intelligence Studio.

Här är rollkraven för användarscenarier för dokumentanalys och fördefinierade modeller:

Här är rollkraven för användarscenarier för anpassade modellprojekt:

  • Grundläggande

    • Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller cognitive services-resurs med flera tjänster för att träna en anpassad modell eller analysera med tränade modeller.

    • Storage Blob Data-deltagare: Du behöver den här rollen för ett lagringskonto för att skapa projekt- och etikettdata.

  • Avancerad

    • Lagringskontodeltagare: Du behöver den här rollen för lagringskontot för att konfigurera CORS-inställningar (cross-origin resource sharing). Det är en engångsinsats om du återanvänder samma lagringskonto.

    • Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser. Rollen Deltagare eller Lagringskontodeltagare ger dig inte åtkomst till att använda dokumentinformationsresursen eller lagringskontot om lokal (nyckelbaserad) autentisering är inaktiverad. Du behöver fortfarande de grundläggande rollerna (Cognitive Services-användare och Storage Data Blob-deltagare) för att använda funktionerna i Document Intelligence Studio.

Mer information finns i Inbyggda Microsoft Entra-roller och avsnitten om Azure-rolltilldelningar i snabbstarten för Document Intelligence Studio.

Kan jag bearbeta dokument med fler än två sidor i Document Intelligence Studio?

Ja, för resurser på betald nivå.

Nej, för resurser på den kostnadsfria nivån.

  • För resurser på den kostnadsfria nivån (F0) analyseras endast de två första sidorna oavsett om du använder Document Intelligence Studio, REST API eller klientbibliotek.

  • Om du vill analysera alla sidor i ett dokument ändrar du till en betald resurs (S0). I Document Intelligence Studio väljer du knappen Inställningar (kugghjul), väljer fliken Resurser och kontrollerar prisnivån som ska användas för att analysera dina dokument.

Kan jag ändra kataloger eller prenumerationer i Document Intelligence Studio?

Ja.

  • Om du vill ändra en katalog i Document Intelligence Studio väljer du knappen Inställningar (kugghjul). Under Katalog väljer du katalogen i listan och väljer sedan Växla katalog. Logga in igen när du har bytt katalog.

  • Om du vill ändra en prenumeration eller resurs går du till fliken Resurs under Inställningar.

Kan jag använda Document Intelligence Studio med en resurs som har konfigurerats med en brandvägg eller ett virtuellt nätverk?

Ja.

Om dokumentinformationsresursen har konfigurerats med en brandvägg eller ett virtuellt nätverk måste du lägga till den dedikerade IP-adressen 20.3.165.95 i brandväggens tillåtna lista för dokumentinformationsresursen.

Kan jag återanvända eller anpassa etiketteringsupplevelsen från Document Intelligence Studio och bygga in den i mitt eget program?

Ja.

Etiketteringsupplevelsen från Document Intelligence Studio är öppen källkod på Toolkit-lagringsplatsen.

Finns det separata URL-slutpunkter för nationella molnregioner i Document Intelligence?

Ja.

Document Intelligence Studio har separata URL-slutpunkter för nationella molnregioner:

Apputveckling

Kan jag utveckla program med hjälp av Azure AI Document Intelligence med hjälp av de senaste utvecklingsalternativen?

Ja.

Document Intelligence erbjuder de senaste utvecklingsalternativen på följande plattformar:

Kan jag migrera mitt program till den senaste versionen av Dokumentinformation?

Ja.

Följande tabell innehåller länkar till detaljerade instruktioner för migrering till den senaste versionen av Dokumentinformation:

Språk/API Migreringsguide
REST-API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Kan jag ange ett intervall med sidor som ska analyseras i ett dokument?

Ja.

Använd parametern pages (stöds i v2.1, v3.0 och senare versioner av REST-API:et) och ange sidor för PDF- och TIFF-dokument med flera sidor. Godkända indata innehåller följande intervall:

  • Enkla sidor. Om du till exempel anger 1, 2bearbetas sidorna 1 och 2.
  • Ändliga intervall. Om du till exempel anger 2-5bearbetas sidorna 2 till 5.
  • Intervall med öppen slutpunkt. Om du till exempel anger 5-bearbetas alla sidor från sidan 5. Om du anger -10bearbetas sidorna 1 till 10.

Du kan blanda dessa parametrar och intervall kan överlappa varandra. Om du till exempel anger -5, 1, 3, 5-10bearbetas sidorna 1 till 10.

Tjänsten godkänner begäran om den kan bearbeta minst en sida i dokumentet. Att till exempel använda 5-100 på ett femsidigt dokument är en giltig indata som innebär att sidan 5 bearbetas.

Om du inte anger något sidintervall bearbetas hela dokumentet.

Rekommenderar du att du använder Document Intelligence Studio i stället för FOTT-exempeletikettverktyget för mitt projekt?

Ja.

Vi rekommenderar Document Intelligence Studio för det mesta eftersom det kan minska din tid för att konfigurera dokumentinformationsresurser och lagringstjänster.

Överväg endast att använda FOTT (Form Testing Tool) för följande scenarier:

Finns det metodtips för att minska begränsningen?

Ja.

Dokumentinformation använder automatisk skalning för att tillhandahålla nödvändiga beräkningsresurser på begäran, samtidigt som kundkostnaderna hålls låga. För att minska begränsningen under autoskalning rekommenderar vi följande metod:

  • Implementera logik för omprövning i ditt program.

  • Om du upptäcker att du begränsas av antalet POST begäranden kan du överväga att lägga till en fördröjning mellan begäranden.

  • Öka arbetsbelastningen gradvis. Undvik skarpa ändringar.

  • Skapa en supportbegäran för att öka gränsen för transaktioner per sekund (TPS).

Läs mer om kvoter och gränser för Document Intelligence-tjänsten.

Anpassade modeller

Kan jag förbättra en uppskattad noggrannhetspoäng för en anpassad modell?

Ja.

Avvikelser i den visuella strukturen i dina dokument kan påverka en modells noggrannhet. Här följer några tips:

  • Inkludera alla varianter av ett dokument i träningsdatauppsättningen. Varianter inkluderar olika format; till exempel digitala jämfört med skannade PDF-filer.

  • Separera visuellt distinkta dokumenttyper och träna olika modeller.

  • Kontrollera att du inte har överflödiga etiketter.

  • För signatur- och regionsetiketter ska du inte inkludera den omgivande texten.

Mer information finns i Noggrannhets- och konfidenspoäng.

Kan jag träna om en anpassad modell?

Nej.

  • Dokumentinformation har ingen explicit omträningsåtgärd. Varje tågåtgärd genererar en ny modell.

  • Om du upptäcker att din modell behöver tränas om kan du lägga till fler exempel i din träningsdatauppsättning och träna en ny modell.

  • Du kan också skapa en ny modell för att skapa med din ursprungliga modell på följande sätt:

    1. Skapa en datauppsättning för den nya mallen.

    2. Märk och träna en ny modell.

    3. Kontrollera att den nya modellen fungerar bra för dina specifika dokumenttyper.

    4. Skapa din nya modell med den befintliga modellen till en enda slutpunkt. Dokumentinformation kan sedan fastställa den bästa modellen för varje dokument som ska analyseras.

    Mer information finns i sammansatta modeller.

Kan jag flytta mina tränade modeller från en miljö (till exempel beta) till en annan (som produktion)?

Ja.

Du kan använda API:et Kopiera för att kopiera anpassade modeller från ett dokumentinformationskonto till andra som finns i valfri geografisk region som stöds. Detaljerade instruktioner finns i Haveriberedskap.

Kopieringsåtgärden är begränsad till att kopiera modeller i den specifika molnmiljö där du har tränat modellen. Till exempel stöds inte kopiering av modeller från det offentliga molnet till Azure Government-molnet.

Lagringskonto

Finns det en förfallotid för sas-token (signatur för delad åtkomst) som jag har för mitt lagringskontoautentisering?

Ja.

När du skapar en signatur för delad åtkomst (SAS) är standardvaraktigheten 48 timmar. Efter 48 timmar måste du skapa en ny token.

Överväg att ange en längre varaktighetsperiod för den tid som du använder ditt lagringskonto med Dokumentinformation.

Kan dokumentinformation komma åt data i mitt lagringskonto om det finns bakom ett virtuellt nätverk eller en brandvägg?

Nej, inte direkt.

Dokumentinformation kan inte komma åt ditt lagringskonto om det skyddas av ett virtuellt nätverk eller en brandvägg.

Åtkomst och autentisering för privata Azure Storage-konton stöder dock hanterade identiteter för Azure-resurser. När du använder en hanterad identitet kan document intelligence-tjänsten komma åt ditt lagringskonto med hjälp av en tilldelad autentiseringsuppgift.

Om du tänker analysera dina privata lagringskontodata med hjälp av FOTT måste du distribuera verktyget bakom det virtuella nätverket eller brandväggen.

Lär dig hur du skapar och använder en hanterad identitet för din dokumentinformationsresurs.

Containers

Finns det någon skillnad mellan frånkopplade och anslutna containrar?

Ja.

Även om modellfunktionerna är desamma för anslutna och frånkopplade containrar skiljer sig fakturerings- och anslutningsmetoderna åt:

  • Anslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Med anslutna containrar krävs internetanslutning för att skicka faktureringsinformation till Azure. Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Anslutna containrar skickar inte kunddata, till exempel den bild eller text som analyseras, till Microsoft. Ett exempel på den information som anslutna containrar skickar till Microsoft för fakturering finns i Vanliga frågor och svar om Azure AI-container.

  • Med frånkopplade containrar kan du använda API:er som är frånkopplade från Internet. Faktureringsinformation skickas inte via Internet. Avgifter baseras i stället på en inköpt åtagandenivå. För närvarande är frånkopplad containeranvändning tillgänglig för anpassade dokumentinformations- och fakturamodeller.

Kan jag använda lokal lagring för FOTT-containern (Document Intelligence Sample Labeling Tool) ?

Ja.

FOTT har en version som använder lokal lagring. Versionen måste installeras på en Windows-dator. Du kan installera den från den här platsen.

På projektsidan anger du etikettmappens URI som /shared eller /shared/sub-dir om etiketteringsfilerna finns i en underkatalog. Alla andra beteenden för exempeletiketteringsverktyget för dokumentinformation är samma som den värdbaserade tjänsten.

Finns det bästa praxis för att skala upp?

Ja.

För asynkrona anrop kan du köra flera containrar med delad lagring. Containern som bearbetar analysanropet POST lagrar utdata i lagringen. Sedan kan alla andra containrar hämta resultatet från lagringen och hantera anropen GET . Begärande-ID:t är inte kopplat till en container.

För synkrona anrop kan du köra flera containrar, men bara en container hanterar en begäran. Eftersom det är ett blockerande anrop kan alla containrar från poolen hantera begäran och skicka svaret. Här är endast en container kopplad till en begäran i taget och ingen avsökning krävs.

Kan jag konfigurera containrar med delad lagring?

Ja.

Containrarna använder Mounts: Shared egenskapen när de startas för att ange det delade lagringsutrymmet för att lagra bearbetningsfilerna. Information om hur du använder den här egenskapen finns i dokumentationen för containrar.

Säkerhet och sekretess

Lagrar Dokumentinformation mina data?

Ja, kortfattat.

För alla funktioner lagrar Document Intelligence tillfälligt data och resultat i Azure Storage i samma region som begäran. Dina data tas sedan bort inom 24 timmar från den tidpunkt då du skickar en analysbegäran.

Läs mer om data, sekretess och säkerhet för dokumentinformation.

För tränade anpassade modeller lagras interimutdata efter analys och etikettering på samma Azure Storage-plats där du lagrar dina träningsdata. De tränade anpassade modellerna lagras i Azure Storage i samma region och är logiskt isolerade med din Azure-prenumeration och DINA API-autentiseringsuppgifter.

Mer hjälp och support

Finns det andra resurser tillgängliga för att tillhandahålla lösningar på frågor om Azure AI Document Intelligence?

Ja.

Microsoft Q &A är hem för tekniska frågor och svar på Microsoft. Du kan filtrera frågor som är specifika för dokumentinformation.

Kan jag ge direkt feedback om tjänsten inte känner igen specifik text eller identifierar den felaktigt när jag etiketterar dokument?

Ja.

Vi uppdaterar och förbättrar kontinuerligt modellerna för dokumentinformation. Du kan skicka ett e-postmeddelande till dokumentinformationsteamet. Om möjligt kan du dela ett exempeldokument med problemet markerat.