Visitkortsmodell för Document Intelligence

Viktigt!

Från och med Document Intelligence v4.0 (förhandsversion) och framöver är visitkortsmodellen (prebuilt-businessCard) inaktuell. Om du vill extrahera data från visitkortsformat använder du följande:

Funktion version Model ID
Visitkortsmodell • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Tidigare versioner:blå bockmarkeringv3.0blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1 | Tidigare version:blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv2.1 | Senaste version:blå bockmarkeringv4.0 (förhandsversion)

Visitkortsmodellen för Document Intelligence kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera data från visitkortsbilder. API:et analyserar tryckta visitkort; extraherar viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer. och returnerar en strukturerad JSON-datarepresentation.

Extrahering av visitkortsdata

Visitkort är ett bra sätt att representera ett företag eller en professionell. Företagets logotyp, teckensnitt och bakgrundsbilder som finns i visitkort hjälper till att marknadsföra företagets varumärke och skilja det från andra. Att använda OCR- och maskininlärningsbaserade tekniker för att automatisera genomsökning av visitkort är ett vanligt scenario för bildbearbetning. Företagssystem som används av sälj- och marknadsföringsteam har vanligtvis integrering av funktioner för extrahering av visitkortsdata till förmån för användarna.

Exempel på visitkort som bearbetas med Document Intelligence Studio

Skärmbild av ett exempel på ett visitkort som analyserats i Document Intelligence Studio.

Exempel på företag som bearbetas med exempeletikettverktyget för Dokumentinformation

Skärmbild av ett exempel på visitkort som analyserats med exempeletikettverktyget för dokumentinformation.

Utvecklingsalternativ

Document Intelligence v3.1:2023-07-31 (GA) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Visitkortsmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Document Intelligence v3.0:2022-08-31 (GA) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Visitkortsmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Document Intelligence v2.1 (GA) stöder följande verktyg, program och bibliotek:

Funktion Resurser
Visitkortsmodell Etikettverktyg för dokumentinformation
REST API
SDK för klientbibliotek
Docker-container för dokumentinformation

Prova extrahering av visitkortsdata

Se hur data, inklusive namn, befattning, adress, e-post och företagsnamn, extraheras från visitkort. Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt

  • En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure-portalen.

Document Intelligence Studio

Kommentar

Document Intelligence Studio är tillgängligt med v3.1- och v3.0-API:er.

  1. På startsidan för Document Intelligence Studio väljer du Visitkort.

  2. Du kan analysera exempelkortet eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Exempeletikettverktyg för dokumentinformation

  1. Gå till exempelverktyget för dokumentinformation.

  2. På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .

    Skärmbild av layoutmodellen analyserar resultatåtgärden.

  3. Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.

  4. Välj en URL för filen som du vill analysera från alternativen nedan:

  5. I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .

    Skärmbild av listrutan källplats.

  6. I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.

  7. I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.

    Skärmbild av listrutan select-form-type.

  8. Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.

  9. Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.

    Skärmbild av visitkortsmodellen analyserar resultatåtgärden.

Kommentar

Verktyget Exempeletiketter stöder inte BMP-filformatet. Det här är en begränsning för verktyget, inte dokumentunderrättelsetjänsten.

Indatakrav

  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTML
    Läsa
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-02-29-preview)
  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär 8-punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1GB den totala storleken på träningsdata med högst 10 000 sidor.

  • Filformat som stöds: JPEG, PNG, PDF och TIFF
  • För PDF och TIFF bearbetas upp till 2 000 sidor. För prenumeranter på den kostnadsfria nivån bearbetas endast de två första sidorna.
  • Filstorleken måste vara mindre än 50 MB och dimensionerna minst 50 x 50 bildpunkter och högst 10 000 x 10 000 bildpunkter.

Språk och nationella inställningar som stöds

En fullständig lista över språk som stöds finns på sidan Språksupport .

Fältextraheringar

Namn Type Beskrivning Standardiserade utdata
ContactNames Objektmatris Kontaktnamn
FirstName String Första (angivna) namnet på kontakten
LastName String Efternamn (familj) på kontakt
Företagsnamn Strängmatris Företagsnamn
Avdelningar Strängmatris Avdelning(er) eller kontaktorganisationer
JobTitles Strängmatris Befattning(er) för kontakt i listan
E-postmeddelanden Strängmatris Kontakta e-postadresser
Webbplatser Strängmatris Företagswebbplatser
Adresser Strängmatris Adresser som extraherats från visitkort
Mobilt Telefon Matris med telefonnummer Mobiltelefonnummer från visitkort +1 xxx xxx xxxx
Fax Matris med telefonnummer Faxtelefonnummer från visitkort +1 xxx xxx xxxx
Arbeta Telefon Matris med telefonnummer Telefonnummer för arbete från visitkort +1 xxx xxx xxxx
Andra Telefon Matris med telefonnummer Andra telefonnummer från visitkort +1 xxx xxx xxxx

Fält extraherade

Namn Type Beskrivning Text
ContactNames en matris med objekt Kontaktnamn som extraherats från visitkortet [{ "FirstName": "John", "LastName": "Doe" }]
FirstName sträng Första (angivna) namnet på kontakten "John"
LastName sträng Efternamn (familj) på kontakt "Doe"
Företagsnamn strängmatris Företagsnamn som extraherats från visitkort ["Contoso"]
Avdelningar strängmatris Avdelning eller organisation av kontakt ["R&D"]
JobTitles strängmatris Listad befattning för kontakt ["Programvarutekniker"]
E-postmeddelanden strängmatris Kontakta e-post som extraherats från visitkortet [""johndoe@contoso.com]
Webbplatser strängmatris Webbplats som extraherats från visitkort ["https://www.contoso.com"]
Adresser strängmatris Adress som extraherats från visitkort ["123 Main Street, Redmond, WA 98052"]
Mobilt Telefon matris med telefonnummer Mobiltelefonnummer som extraherats från visitkort ["+19876543210"]
Fax matris med telefonnummer Faxtelefonnummer som extraherats från visitkortet ["+19876543211"]
Arbeta Telefon matris med telefonnummer Arbetstelefonnummer som extraherats från visitkortet ["+19876543231"]
Andra Telefon matris med telefonnummer Annat telefonnummer som extraherats från visitkortet ["+19876543233"]

Språk som stöds

Fördefinierade visitkort v2.1 stöder följande språk:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

Migreringsguide och REST API v3.1

  • Följ migreringsguiden för Document Intelligence v3.1 för att lära dig hur du använder v3.0-versionen i dina program och arbetsflöden.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.

  • Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.