Visitkortsmodell för Document Intelligence
Viktigt!
Från och med Document Intelligence v4.0 (förhandsversion) och framöver är visitkortsmodellen (prebuilt-businessCard) inaktuell. Om du vill extrahera data från visitkortsformat använder du följande:
Funktion | version | Model ID |
---|---|---|
Visitkortsmodell | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
Det här innehållet gäller för: v3.0 (GA) | Senaste versioner: v4.0 (förhandsversion) v3.1 | Tidigare version: v2.1
[! INCLUDE [gäller för v2.1].. /(includes/applies-to-v21.md)]
Visitkortsmodellen för Document Intelligence kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera data från visitkortsbilder. API:et analyserar tryckta visitkort; extraherar viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer. och returnerar en strukturerad JSON-datarepresentation.
Extrahering av visitkortsdata
Visitkort är ett bra sätt att representera ett företag eller en professionell. Företagets logotyp, teckensnitt och bakgrundsbilder som finns i visitkort hjälper till att marknadsföra företagets varumärke och skilja det från andra. Att använda OCR- och maskininlärningsbaserade tekniker för att automatisera genomsökning av visitkort är ett vanligt scenario för bildbearbetning. Företagssystem som används av sälj- och marknadsföringsteam har vanligtvis integrering av funktioner för extrahering av visitkortsdata till förmån för användarna.
Exempel på visitkort som bearbetas med Document Intelligence Studio
Exempel på företag som bearbetas med exempeletikettverktyget för Dokumentinformation
Utvecklingsalternativ
Document Intelligence v3.1:2023-07-31 (GA) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Visitkortsmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Document Intelligence v3.0:2022-08-31 (GA) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Visitkortsmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Document Intelligence v2.1 (GA) stöder följande verktyg, program och bibliotek:
Funktion | Resurser |
---|---|
Visitkortsmodell | • Etikettverktyg för dokumentinformation • REST API • SDK för klientbibliotek • Docker-container för dokumentinformation |
Prova extrahering av visitkortsdata
Se hur data, inklusive namn, befattning, adress, e-post och företagsnamn, extraheras från visitkort. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Document Intelligence Studio
Kommentar
Document Intelligence Studio är tillgängligt med v3.1- och v3.0-API:er.
På startsidan för Document Intelligence Studio väljer du Visitkort.
Du kan analysera exempelkortet eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :
Exempeletikettverktyg för dokumentinformation
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .
Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.
Välj en URL för filen som du vill analysera från alternativen nedan:
I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .
I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.
I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.
Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.
Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.
Indatakrav
Filformat som stöds:
Modell PDF Bild: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och
4
MB för den kostnadsfria nivån (F0).Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om
8
punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och
1
GB för den neurala modellen.För anpassad klassificeringsmodellträning är
1
den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är2
den totala storleken på träningsdata GB med högst 10 000 sidor.
- Filformat som stöds: JPEG, PNG, PDF och TIFF
- PDF och TIFF, upp till 2 000 sidor bearbetas. För prenumeranter på den kostnadsfria nivån bearbetas endast de två första sidorna.
- Filstorleken måste vara mindre än 50 MB och dimensionerna minst 50 x 50 bildpunkter och högst 10 000 x 10 000 bildpunkter.
Språk och nationella inställningar som stöds
En fullständig lista över språk som stöds finns på vår fördefinierade supportsida för modellspråk.
Fältextraheringar
Information om vilka dokumentextraheringsfält som stöds finns på schemasidan för visitkortsmodellen i vår GitHub-exempellagringsplats.
Fält extraherade
Namn | Type | Beskrivning | Text |
---|---|---|---|
ContactNames | en matris med objekt | Kontaktnamn som extraherats från visitkortet | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | sträng | Första (angivna) namnet på kontakten | "John" |
LastName | sträng | Efternamn (familj) på kontakt | "Doe" |
Företagsnamn | strängmatris | Företagsnamn som extraherats från visitkort | ["Contoso"] |
Avdelningar | strängmatris | Avdelning eller organisation av kontakt | ["R&D"] |
JobTitles | strängmatris | Listad befattning för kontakt | ["Programvarutekniker"] |
E-postmeddelanden | strängmatris | Kontakta e-post som extraherats från visitkortet | [""johndoe@contoso.com] |
Webbplatser | strängmatris | Webbplats som extraherats från visitkort | ["https://www.contoso.com"] |
Adresser | strängmatris | Adress som extraherats från visitkort | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | matris med telefonnummer | Mobiltelefonnummer som extraherats från visitkort | ["+19876543210"] |
Fax | matris med telefonnummer | Faxtelefonnummer som extraherats från visitkortet | ["+19876543211"] |
WorkPhones | matris med telefonnummer | Arbetstelefonnummer som extraherats från visitkortet | ["+19876543231"] |
OtherPhones | matris med telefonnummer | Annat telefonnummer som extraherats från visitkortet | ["+19876543233"] |
Språk som stöds
Fördefinierade visitkort v2.1 stöder följande språk:
- en-us
- en-au
- en-ca
- en-gb
- en-in
Migreringsguide och REST API v3.1
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.
Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.