Document Intelligence névjegykártya-modell

Fontos

A Document Intelligence 4.0-s (előzetes verzió) verziójától kezdve a névjegykártya-modell (előre összeállított-businessCard) elavult. A névjegykártya-formátumok adatainak kinyeréséhez használja a következőket:

Szolgáltatás Verzió Modellazonosító
Névjegykártya-modell • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Korábbi verziók:kék pipav3.0kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1 | Korábbi verzió:kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

A Dokumentumintelligencia névjegykártya-modell hatékony optikai karakterfelismerési (OCR) képességeket és mélytanulási modelleket kombinál a névjegykártya-rendszerképek adatainak elemzéséhez és kinyeréséhez. Az API elemzi a nyomtatott névjegykártyákat; kinyeri a legfontosabb információkat, például az utónevet, a vezetéknevet, a cégnevet, az e-mail-címet és a telefonszámot; és strukturált JSON-adatábrázolást ad vissza.

Névjegykártya-adatok kinyerése

A névjegykártyák kiválóan alkalmasak üzleti vagy szakmai képviseletre. A névjegykártyákon található céges embléma, betűtípusok és háttérképek segítenek a cég arculatának népszerűsítésében és másoktól való megkülönböztetésében. Az OCR és a gépi tanuláson alapuló technikák alkalmazása a névjegykártyák vizsgálatának automatizálására gyakori képfeldolgozási forgatókönyv. Az értékesítési és marketingcsapatok által használt nagyvállalati rendszerek általában névjegykártya-adatkinyerési képességgel rendelkeznek a felhasználók javára.

A Document Intelligence Studióval feldolgozott minta névjegykártya

Képernyőkép a Document Intelligence Studióban elemzett névjegykártyákról.

A dokumentumintelligencia-mintacímkéző eszközzel feldolgozott mintavállalat

Képernyőkép a Dokumentumintelligencia mintacímkéző eszközzel elemzett névjegykártyáról.

Fejlesztési lehetőségek

A Document Intelligence v3.1:2023-07-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Névjegykártya-modell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított-businessCard

A Document Intelligence v3.0:2022-08-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Névjegykártya-modell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított-businessCard

A Document Intelligence v2.1 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források
Névjegykártya-modell Dokumentumintelligencia-címkézési eszköz
REST API
Ügyféloldali kódtár SDK
Document Intelligence Docker-tároló

Névjegykártya-adatok kinyerésének kipróbálás

Megtudhatja, hogyan nyeri ki a névjegykártyákból az adatokat, beleértve a nevet, a beosztást, a címet, az e-mail-címet és a cégnevet. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Document Intelligence Studio

Feljegyzés

A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal érhető el.

  1. A Document Intelligence Studio kezdőlapján válassza a Névjegykártyák lehetőséget.

  2. Elemezheti a minta névjegykártyát, vagy feltöltheti saját fájljait.

  3. Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Dokumentumintelligencia-mintacímkéző eszköz

  1. Lépjen a dokumentumintelligencia-mintaeszközre.

  2. A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.

    Képernyőkép az elrendezési modell eredményelemzési műveletéről.

  3. Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.

  4. Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:

  5. A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.

    Képernyőkép a forráshely legördülő menüről.

  6. A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.

  7. A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.

    Képernyőkép a select-form típusú legördülő menüről.

  8. Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.

  9. Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

    Képernyőkép a névjegykártya-modell eredményelemzési műveletéről.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

  • Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF
  • PDF és TIFF esetén legfeljebb 2000 oldal feldolgozása történik. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
  • A fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját a Nyelvi támogatás oldalon találja.

Mezőkinyerések

Név Típus Leírás Szabványosított kimenet
ContactNames Objektumok tömbje Kapcsolattartó neve
FirstName Sztring A kapcsolattartó első (adott) neve
LastName Sztring A kapcsolattartó vezetékneve (családi) neve
CompanyNames Sztringek tömbje Cégnév(ek)
Osztályok Sztringek tömbje Kapcsolattartó részleg(ek) vagy szervezet(ek)
JobTitles Sztringek tömbje Partner felsorolt beosztása(i)
E-mailek Sztringek tömbje Kapcsolattartási e-mail-cím(ek)
Webhelyek Sztringek tömbje Céges webhely(ek)
Címek Sztringek tömbje Névjegykártyából kinyert cím(ek)
Mobil Telefon Telefonszámok tömbje Mobiltelefonszám(ok) névjegykártyáról +1 xxx xxx xxxx
Faxok Telefonszámok tömbje Faxszám(ok) névjegykártyáról +1 xxx xxx xxxx
Munka Telefon Telefonszámok tömbje Munkahelyi telefonszám(ok) névjegykártyáról +1 xxx xxx xxxx
Egyéb Telefon Telefonszámok tömbje Egyéb telefonszám(ok) névjegykártyáról +1 xxx xxx xxxx

Kinyert mezők

Név Típus Leírás Szöveges
ContactNames objektumtömb Névjegykártyából kinyert partnernév [{ "FirstName": "John", "LastName": "Doe" }]
FirstName húr A kapcsolattartó első (adott) neve "János"
LastName húr A kapcsolattartó vezetékneve (családi) neve "Doe"
CompanyNames sztringek tömbje Névjegykártyából kinyert cégnév ["Contoso"]
Osztályok sztringek tömbje Kapcsolattartási részleg vagy szervezet ["R&D"]
JobTitles sztringek tömbje A partner listában szereplő beosztása ["Szoftvermérnök"]
E-mailek sztringek tömbje Névjegykártyából kinyert e-mail-cím ["johndoe@contoso.com"]
Webhelyek sztringek tömbje Névjegykártyából kinyert webhely ["https://www.contoso.com"]
Címek sztringek tömbje Névjegykártyából kinyert cím ["123 Main Street, Redmond, WA 98052"]
Mobil Telefon telefonszámok tömbje Névjegykártyából kinyert mobiltelefonszám ["+19876543210"]
Faxok telefonszámok tömbje Névjegykártyából kinyert faxszám ["+19876543211"]
Munka Telefon telefonszámok tömbje Névjegykártyából kinyert munkahelyi telefonszám ["+19876543231"]
Egyéb Telefon telefonszámok tömbje Névjegykártyából kinyert egyéb telefonszám ["+19876543233"]

Támogatott területi beállítások

Az előre összeállított névjegykártyák v2.1 a következő területi beállításokat támogatják:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • beadás

Migrálási útmutató és REST API 3.1-es verzió

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.0-s verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések