Kom igång med exempeletikettverktyget för dokumentinformation
Det här innehållet gäller för: v2.1.
Dricks
- För en förbättrad upplevelse och avancerad modellkvalitet kan du prova Document Intelligence v3.0 Studio.
- v3.0 Studio stöder alla modeller som tränats med v2.1-märkta data.
- Du kan läsa api-migreringsguiden för detaljerad information om migrering från v2.1 till v3.0.
- Se våra REST API- eller C#-, Java-, JavaScript- eller Python SDK-snabbstarter för att komma igång med v3.0-versionen.
Exempeletikettverktyget för Azure AI Document Intelligence är ett öppen källkod verktyg som gör att du kan testa de senaste funktionerna i OCR-tjänster (Document Intelligence and Optical Character Recognition):
Analysera dokument med layout-API:et. Prova layout-API:et för att extrahera text, tabeller, markeringsmarkeringar och struktur från dokument.
Analysera dokument med hjälp av en fördefinierad modell. Börja med en fördefinierad modell för att extrahera data från fakturor, kvitton, identitetsdokument eller visitkort.
Träna och analysera ett anpassat formulär. Använd en anpassad modell för att extrahera data från dokument som är specifika för olika affärsdata och användningsfall.
Förutsättningar
Du behöver följande för att komma igång:
En Azure-prenumeration – du kan skapa en kostnadsfritt
En Azure AI-tjänst eller dokumentinformationsresurs. När du har din Azure-prenumeration skapar du en dokumentinformationsresurs med en enda tjänst eller flera tjänster i Azure Portal för att hämta din nyckel och slutpunkt. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten och uppgradera senare till en betald nivå för produktion.Dricks
Skapa en Azure AI-tjänstresurs om du planerar att komma åt flera Azure AI-tjänster under en enda slutpunkt/nyckel. För endast åtkomst till dokumentinformation skapar du en dokumentinformationsresurs. Observera att du behöver en resurs med en enda tjänst om du tänker använda Microsoft Entra-autentisering.
Skapa en dokumentinformationsresurs
Gå till Azure Portal och skapa en ny dokumentinformationsresurs . Ange följande information i fönstret Skapa :
Projektinformation | beskrivning |
---|---|
Abonnemang | Välj den Azure-prenumeration som har beviljats åtkomst. |
Resursgrupp | Den Azure-resursgrupp som innehåller din resurs. Du kan skapa en ny grupp eller lägga till den i en befintlig grupp. |
Region | Platsen för din Azure AI-tjänstresurs. Olika platser kan ge svarstid, men påverkar inte resursens körningstillgänglighet. |
Namn | Ett beskrivande namn för resursen. Vi rekommenderar att du använder ett beskrivande namn, till exempel MyNameFormRecognizer. |
Prisnivå | Kostnaden för din resurs beror på vilken prisnivå du väljer och din användning. Mer information finns i information om API-priser. |
Granska + skapa | Välj knappen Granska + skapa för att distribuera resursen på Azure Portal. |
Hämta nyckeln och slutpunkten
När dokumentinformationsresursen är klar med distributionen letar du upp och väljer den i listan Alla resurser i portalen. Din nyckel och slutpunkt finns på resursens nyckel- och slutpunktssida under Resurshantering. Spara båda dessa på en tillfällig plats innan du går vidare.
Analysera med hjälp av en fördefinierad modell
Dokumentinformation erbjuder flera fördefinierade modeller att välja mellan. Varje modell har en egen uppsättning fält som stöds. Vilken modell som ska användas för Analyze
åtgärden beror på vilken typ av dokument som ska analyseras. Här är de fördefinierade modeller som för närvarande stöds av document intelligence-tjänsten:
- Faktura: extraherar text, markeringar, tabeller, nyckel/värde-par och nyckelinformation från fakturor.
- Kvitto: extraherar text och nyckelinformation från kvitton.
- ID-dokument: extraherar text och viktig information från körkort och internationella pass.
- Visitkort: extraherar text och viktig information från visitkort.
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .
Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.
Välj en URL för filen som du vill analysera från alternativen nedan:
I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .
I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.
I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.
Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.
Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.
Ladda ned JSON-utdatafilen för att visa de detaljerade resultaten.
- Noden "readResults" innehåller varje textrad med respektive placering av avgränsningsrutan på sidan.
- Noden "selectionMarks" visar varje markeringsmarkering (kryssruta, alternativmarkering) och om dess status är
selected
ellerunselected
. - Avsnittet "pageResults" innehåller de tabeller som extraherats. För varje tabell extraheras text-, rad- och kolumnindex, rad- och kolumnintervall, avgränsningsruta med mera.
- Fältet "documentResults" innehåller information om nyckel/värde-par och radobjektinformation för de mest relevanta delarna i dokumentet.
Analysera layout
Api:et för dokumentinformationslayout extraherar text, tabeller, markeringsmarkeringar och strukturinformation från dokument (PDF, TIFF) och bilder (JPG, PNG, BMP).
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du Använd layout för att hämta text, tabeller och markeringsmarkeringar.
I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.
I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.
I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in följande URL
https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/layout-page-001.jpg
och väljer knappen Hämta .Välj Kör layout. Exempeletikettverktyget för dokumentinformation anropar
Analyze Layout API
och analyserar dokumentet.Visa resultatet – se den markerade texten som extraherats, markeringsmarkeringar har identifierats och tabeller har identifierats.
Ladda ned JSON-utdatafilen för att visa detaljerade layoutresultat.
- Noden
readResults
innehåller varje textrad med respektive placering av avgränsningsrutan på sidan. - Noden
selectionMarks
visar varje markeringsmarkering (kryssruta, alternativmarkering) och om dess status ärselected
ellerunselected
. - Avsnittet
pageResults
innehåller de tabeller som extraherats. För varje tabell extraheras text-, rad- och kolumnindex, rad- och kolumnintervall, avgränsningsruta med mera.
- Noden
Träna en anpassad formulärmodell
Träna en anpassad modell för att analysera och extrahera data från formulär och dokument som är specifika för din verksamhet. API:et är ett maskininlärningsprogram som tränats att identifiera formulärfält i ditt distinkta innehåll och extrahera nyckel/värde-par och tabelldata. Du behöver minst fem exempel av samma formulärtyp för att komma igång och din anpassade modell kan tränas med eller utan etiketterade datauppsättningar.
Förutsättningar för att träna en anpassad formulärmodell
En Azure Storage-blobcontainer som innehåller en uppsättning träningsdata. Kontrollera att alla träningsdokument har samma format. Om du har formulär i flera format ordnar du dem i undermappar efter format. För det här projektet kan du använda vår exempeldatauppsättning.
Om du inte vet hur du skapar ett Azure Storage-konto med en container följer du snabbstarten för Azure Storage för Azure Portal.
Konfigurera CORS
CORS (Cross Origin Resource Sharing) måste konfigureras på ditt Azure-lagringskonto för att det ska vara tillgängligt från Document Intelligence Studio. För att konfigurera CORS i Azure Portal behöver du åtkomst till cors-fliken för ditt lagringskonto.
Välj fliken CORS för lagringskontot.
Börja med att skapa en ny CORS-post i Blob-tjänsten.
Ange Tillåtna ursprung till
https://fott-2-1.azurewebsites.net
.Dricks
Du kan använda jokertecknet *i stället för en angiven domän för att tillåta att alla ursprungsdomäner gör begäranden via CORS.
Välj alla tillgängliga 8 alternativ för Tillåtna metoder.
Godkänn alla tillåtna rubriker och synliga rubriker genom att ange en * i varje fält.
Ange Maxålder till 120 sekunder eller ett acceptabelt värde.
Välj knappen Spara överst på sidan och spara ändringarna.
Använd exempeletikettverktyget
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du Använd anpassat formulär för att träna en modell med etiketter och hämta nyckel/värde-par.
Välj Nytt projekt
Skapa ett nytt projekt
Konfigurera fälten Projektinställningar med följande värden:
Visningsnamn. Ge projektet ett namn.
Säkerhetstoken. Varje projekt skapar automatiskt en säkerhetstoken som kan användas för att kryptera/dekryptera känsliga projektinställningar. Du hittar säkerhetstoken i Programinställningar genom att välja kugghjulsikonen längst ned i det vänstra navigeringsfältet.
Källanslutning. Verktyget Exempeletiketter ansluter till en källa (dina ursprungliga uppladdade formulär) och ett mål (skapade etiketter och utdata). Anslutningar kan konfigureras och delas mellan projekt. De använder en utökningsbar leverantörsmodell, så att du enkelt kan lägga till nya käll-/målproviders.
- Skapa en ny anslutning. Välj knappen Lägg till anslutning. Fyll i fälten med följande värden:
- Visningsnamn. Namnge anslutningen.
- Beskrivning. Lägg till en kort beskrivning.
- SAS-URL. Klistra in URL:en för signatur för delad åtkomst (SAS) för din Azure Blob Storage-container.
Om du vill hämta SAS-URL:en för dina träningsdata för anpassade modeller går du till lagringsresursen i Azure Portal och väljer fliken Storage Explorer. Navigera till containern, högerklicka och välj Hämta signatur för delad åtkomst. Det är viktigt att hämta SAS för din container, inte för själva lagringskontot. Kontrollera att behörigheterna Läs, Skriv, Ta bort och Lista är markerade och välj Skapa. Kopiera sedan värdet i URL-avsnittet till en tillfällig plats. Det bör ha formatet:
https://<storage account>.blob.core.windows.net/<container name>?<SAS value>
.
Mappsökväg (valfritt). Om dina källformulär finns i en mapp i blobcontainern anger du mappnamnet.
Uri för Document Intelligence Service – din slutpunkts-URL för dokumentinformation.
Nyckel. Din dokumentinformationsnyckel.
API-version. Behåll värdet v2.1 (standard).
Beskrivning (valfritt). Beskriv projektet.
Etikettera dina formulär
När du skapar eller öppnar ett projekt öppnas huvudfönstret för taggredigeraren. Taggredigeraren består av tre delar:
- Ett storleksbart förhandsgranskningsfönster som innehåller en rullningsbar lista över formulär från källanslutningen.
- Huvudredigerarens fönster där du kan använda taggar.
- Fönstret taggar redigerare som gör det möjligt för användare att ändra, låsa, ordna om och ta bort taggar.
Identifiera text och tabeller
Välj Kör layout i dokument som inte visas i det vänstra fönstret för att hämta text- och tabelllayoutinformationen för varje dokument. Märkningsverktyget ritar avgränsningsrutor runt varje textelement.
Märkningsverktyget visar också vilka tabeller som extraherades automatiskt. Välj tabell-/rutnätsikonen till vänster i dokumentet och se den extraherade tabellen. Eftersom tabellinnehållet extraheras automatiskt etiketterar vi inte tabellinnehållet, utan förlitar oss i stället på automatisk extrahering.
Använd etiketter på text
Därefter skapar du taggar (etiketter) och tillämpar dem på de textelement som du vill att modellen ska analysera. Observera att datauppsättningen Exempeletikett innehåller redan märkta fält. vi lägger till ett annat fält.
Använd fönstret taggar redigerare för att skapa en ny tagg som du vill identifiera:
Välj + plustecken för att skapa en ny tagg.
Ange namnet på taggen "Total".
Spara taggen genom att välja Retur .
I huvudredigeraren väljer du det totala värdet från de markerade textelementen.
Välj taggen Total för att tillämpa på värdet eller tryck på motsvarande tangentbordstangent. Nummernycklarna tilldelas som snabbtangenter för de första 10 taggarna. Du kan ändra ordning på taggarna med hjälp av upp- och nedpilsikonerna i taggredigerarens fönster. Följ dessa steg för att märka alla fem formulären i exempeldatauppsättningen:
Dricks
Tänk på följande tips när du etiketterar dina formulär:
Du kan bara använda en tagg för varje markerat textelement.
Varje tagg kan bara tillämpas en gång per sida. Om ett värde visas flera gånger i samma formulär skapar du olika taggar för varje instans. Till exempel: "invoice# 1", "invoice# 2" och så vidare.
Taggar kan inte sträcka sig över flera sidor.
Etikettvärden som de visas i formuläret. försök inte dela upp ett värde i två delar med två olika taggar. Ett adressfält bör till exempel märkas med en enda tagg även om det sträcker sig över flera rader.
Inkludera inte nycklar i dina taggade fält – bara värdena.
Tabelldata bör identifieras automatiskt och kommer att vara tillgängliga i den slutliga utdata-JSON-filen i avsnittet "pageResults". Men om modellen inte kan identifiera alla dina tabelldata kan du även märka och träna en modell för att identifiera tabeller. Mer information finns i Träna en anpassad modell | Etikettera dina formulär
Använd knapparna till höger om + för att söka, byta namn på, ordna om och ta bort taggarna.
Om du vill ta bort en tillämpad tagg utan att ta bort själva taggen markerar du den taggade rektangeln i dokumentvyn och trycker på borttagningsnyckeln.
Träna en anpassad modell
Välj ikonen Träna i den vänstra rutan och öppna sidan Utbildning. Välj sedan knappen Träna för att börja träna modellen. När träningsprocessen är klar visas följande information:
Modell-ID – ID för modellen som skapades och tränades. Varje träningsanrop skapar en ny modell med sitt eget ID. Kopiera strängen till en säker plats. du behöver det om du vill göra förutsägelseanrop via REST-API:et eller klientbiblioteket.
Genomsnittlig noggrannhet – modellens genomsnittliga noggrannhet. Du kan förbättra modellens noggrannhet genom att märka fler formulär och träna om för att skapa en ny modell. Vi rekommenderar att du börjar med att märka fem formulär som analyserar och testar resultaten och sedan, om det behövs, lägga till fler formulär efter behov.
Listan över taggar och den uppskattade noggrannheten per tagg. Mer information finns i Tolka och förbättra noggrannheten och konfidensen.
Analysera ett anpassat formulär
Välj ikonen i
Analyze
navigeringsfältet och testa din modell.Välj källlokal fil och bläddra efter en fil att välja från exempeldatauppsättningen som du har packat upp i testmappen.
Välj knappen Kör analys för att hämta nyckel/värde-par, text och tabellförutsägelser för formuläret. Verktyget använder taggar i avgränsningsrutor och rapporterar varje taggs förtroende.
Det var allt! Du har lärt dig hur du använder exempelverktyget för dokumentinformation för fördefinierade modeller, layout och anpassade modeller. Du har också lärt dig att analysera ett anpassat formulär med manuellt märkta data.