Tárolók telepítése és futtatása

A tárolók támogatása jelenleg az összes modell dokumentumintelligencia-verziójával és csak olvasási és 2023-07-31 (GA) elrendezési verzióval 2022-08-31 (GA) érhető el:

✔️ A támogatott tárolódokumentációért tekintse meg a Document Intelligence v3.0-tárolók telepítését és futtatását.

Ez a tartalom a következőre vonatkozik::checkmarkv3.0 (GA)checkmarkv3.1 (GA)

Az Azure AI Document Intelligence egy Azure AI-szolgáltatás, amellyel automatizált adatfeldolgozási szoftvereket hozhat létre gépi tanulási technológiával. A dokumentumintelligencia lehetővé teszi szöveg, kulcs/érték párok, kijelölési jelek, táblázatadatok és egyebek azonosítását és kinyerét a dokumentumokból. Az eredmények olyan strukturált adatokként jelennek meg, amelyek .. A /tartalmazza az eredeti fájlban lévő kapcsolatokat.

Ebből a cikkből megtudhatja, hogyan tölthet le, telepíthet és futtathat Dokumentumintelligencia-tárolókat. A tárolók lehetővé teszik a Dokumentumintelligencia szolgáltatás futtatását a saját környezetében. A tárolók kiválóan alkalmasak adott biztonsági és adatszabályozási követelményekhez.

  • Az olvasási és elrendezési modelleket a Document Intelligence v3.1-tárolók támogatják.

  • Az olvasási, elrendezési, általános dokumentum-, azonosítódokumentum-, nyugta-, számla-, névjegykártya- és egyéni modelleket a Document Intelligence v3.0-tárolók támogatják.

  • A névjegykártya-modell jelenleg csak a v2.1-tárolókban támogatott.

Előfeltételek

Az első lépésekhez aktív Azure-fiókra van szüksége. Ha még nincs fiókja, hozzon létre egy ingyenes fiókot.

A Dokumentumintelligencia-tárolók használatához az alábbiakra is szüksége van:

Szükséges Cél
A Docker ismerete Alapvető ismeretekkel kell rendelkeznie a Docker-fogalmakról, például a regisztrációs adatbázisokról, az adattárakról, a tárolókról és a tárolórendszerképekről, valamint ismernie kell az alapvető dockerterminológiát és parancsokat.
Docker Engine telepítve
  • A gazdaszámítógépen telepítve kell lennie a Docker-motornak. A Docker csomagokat biztosít a Docker-környezet konfigurálásához macOS, Windows és Linux rendszereken. A Docker és a tárolók alapszintű ismertetéséért lásd a Docker felhasználói útmutatóját.
  • A Dockert úgy kell konfigurálni, hogy a tárolók kapcsolódhassanak és számlázási adatokat küldjenek az Azure-ba.
  • Windows rendszeren a Dockert úgy is konfigurálnia kell, hogy támogassa a Linux-tárolókat.
Dokumentumintelligencia-erőforrás Egy egyszolgáltatásos Azure AI-dokumentumintelligencia vagy többszolgáltatásos erőforrás az Azure Portalon. A tárolók használatához rendelkeznie kell a társított kulccsal és végpont URI-val. Mindkét érték elérhető az Azure Portal dokumentumintelligencia-kulcsai és végpontoldalán :
  • {FORM_RECOGNIZER_KEY}: a két elérhető erőforráskulcs egyike.
  • {FORM_RECOGNIZER_ENDPOINT_URI}: a számlázási adatok nyomon követésére használt erőforrás végpontja.
Választható Cél
Azure CLI (parancssori felület) Az Azure CLI lehetővé teszi, hogy online parancsokat használjon az Azure-erőforrások létrehozásához és kezeléséhez. Telepíthető Windows, macOS és Linux rendszerű környezetekben, és Docker-tárolóban és Azure Cloud Shellben is futtatható.

Gazdagépre vonatkozó követelmények

A gazdagép egy x64-alapú számítógép, amely a Docker-tárolót futtatja. Ez lehet egy számítógép a helyszínen vagy egy Docker-üzemeltetési szolgáltatás az Azure-ban, például:

Tárolókövetelmények és javaslatok

Szükséges támogató tárolók

Az alábbi táblázat az egyes letöltött Dokumentumintelligencia-tárolókhoz tartozó támogató tároló(ka)t sorolja fel. További információkért lásd a Számlázás szakaszt.

Szolgáltatástároló Támogató tároló(k)
Olvasás Nem kötelező
Elrendezés Nem kötelező
Névjegykártya Olvasás
Általános dokumentum Elrendezés
Számla Elrendezés
Beérkezési Olvasás vagy elrendezés
Azonosító dokumentum Olvasás
Egyéni sablon Elrendezés

Feljegyzés

A minimális és ajánlott értékek a Docker korlátain alapulnak, nem pedig a gazdagép erőforrásain.

Dokumentumintelligencia-tárolók
Tároló Minimum Ajánlott
Read 8 magok, 10 GB memória 8 magok, 24 GB memória
Layout 8 magok, 16 GB memória 8 magok, 24 GB memória
Business Card 8 magok, 16 GB memória 8 magok, 24 GB memória
General Document 8 magok, 12 GB memória 8 magok, 24 GB memória
ID Document 8 magok, 8 GB memória 8 magok, 24 GB memória
Invoice 8 magok, 16 GB memória 8 magok, 24 GB memória
Receipt 8 magok, 11 GB memória 8 magok, 24 GB memória
Custom Template 8 magok, 16 GB memória 8 magok, 24 GB memória
  • Minden magnak legalább 2,6 gigahertzesnek (GHz) vagy gyorsabbnak kell lennie.
  • A mag és a memória megfelel a --cpus parancs részeként docker compose használt beállításoknak és --memorydocker run beállításoknak.

Tipp.

A docker images paranccsal listázhatja a letöltött tárolólemezképeket. Az alábbi parancs például az egyes letöltött tárolólemezképek azonosítóját, adattárát és címkéjét sorolja fel táblázatként formázva:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

A tároló futtatása a docker-compose up paranccsal

  • Cserélje le a(z) {ENDPOINT_URI} és {API_KEY} értékeket az erőforrásvégpont URI-jára és az Azure-erőforráslap kulcsára.

    Screenshot of Azure portal keys and endpoint page.

  • Győződjön meg arról, hogy az EULA értéke elfogadásra van állítva.

  • Meg EULAkell adni a , Billingés ApiKey az értékeket, ellenkező esetben a tároló nem indítható el.

Fontos

A kulcsok a dokumentumintelligencia-erőforrás eléréséhez használhatók. Ne ossza meg a kulcsokat. Biztonságosan tárolhatja őket, például az Azure Key Vault használatával. Javasoljuk, hogy a kulcsokat rendszeresen hozza újra létre. API-hívás létrehozásához csak egy kulcs szükséges. Az első kulcs újragenerálásakor a második kulccsal továbbra is hozzáférhet a szolgáltatáshoz.

Az alábbi kódminta egy önálló példa a dokumentumintelligencia-elrendezés docker compose tárolójának futtatására. Ezzel docker composeegy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg az Elrendezés tárolópéldány {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit.

version: "3.9"
services:
  azure-form-recognizer-read:
    container_name: azure-form-recognizer-read
    image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.0
    environment:
      - EULA=accept
      - billing={FORM_RECOGNIZER_ENDPOINT_URI}
      - apiKey={FORM_RECOGNIZER_KEY}
    ports:
      - "5000:5000"
    networks:
      - ocrvnet
networks:
  ocrvnet:
    driver: bridge

Most a docker compose paranccsal indíthatja el a szolgáltatást:

docker-compose up

Ellenőrizze, hogy a szolgáltatás fut-e

A tároló futásának ellenőrzésére többféleképpen is van lehetőség:

  • A tároló vizuális ellenőrzésként egy kezdőlapot \ biztosít, amely ellenőrzi, hogy a tároló fut-e.

  • Megnyithatja a kedvenc webböngészőt, és navigálhat a kérdéses tároló külső IP-címére és közzétett portjára. A felsorolt kérelem URL-címeinek használatával ellenőrizze, hogy a tároló fut-e. A felsorolt példakérési URL-címek a következők http://localhost:5000, de az adott tároló eltérő lehet. Ne feledje, hogy a tároló külső IP-címére és a közzétett portra navigál.

    Kérelem URL-címe Cél
    http:// localhost:5000/ A tároló egy kezdőlappal rendelkezik.
    http:// localhost:5000/ready A GET kérése ellenőrzi, hogy a tároló készen áll-e egy lekérdezés elfogadására a modellen. Ez a kérés használható a Kubernetes-beli élő- és készültségi mintavételekhez.
    http:// localhost:5000/status A GET használatával kért kérés ellenőrzi, hogy a tároló elindításához használt API-kulcs érvényes-e végpontlekérdezés nélkül. Ez a kérés használható a Kubernetes-beli élő- és készültségi mintavételekhez.
    http:// localhost:5000/swagger A tároló átfogó dokumentációval is rendelkezik a végpontokhoz, valamint egy kipróbálás funkcióval is. Ezzel a funkcióval beírhatja a beállításokat egy webes HTML-űrlapba, és kódírás nélkül is elvégezheti a lekérdezést. A lekérdezés visszatérése után megjelenik egy példa CURL-parancs, amely bemutatja a szükséges HTTP-fejléceket és törzsformátumot.

Screenshot of Azure containers welcome page.

Tárolók leállítása

A tárolók leállításához használja a következő parancsot:

docker-compose down

Számlázás

A Dokumentumintelligencia-tárolók számlázási adatokat küldenek az Azure-nak egy Dokumentumintelligencia-erőforrás használatával az Azure-fiókban.

A tárolóba irányuló lekérdezések számlázása az API-hoz Keyhasznált Azure-erőforrás tarifacsomagján lesz. A dokumentumok és képek feldolgozásához használt tárolópéldányokért díjat kell fizetnie.

Csatlakozás az Azure szolgáltatáshoz

A tárolónak futtatnia kell a számlázási argumentum értékeit. Ezek az értékek lehetővé teszik, hogy a tároló csatlakozzon a számlázási végponthoz. A tároló körülbelül 10–15 percenként jelenti a használatot. Ha a tároló az engedélyezett időkereten belül nem csatlakozik az Azure-hoz, a tároló továbbra is fut, de a számlázási végpont visszaállításáig nem szolgál ki lekérdezéseket. A kapcsolat 10 alkalommal, 10–15 perces időintervallumban történik. Ha a 10 próbálkozáson belül nem tud csatlakozni a számlázási végponthoz, a tároló leállítja a kérések kiszolgálását. Tekintse meg az Azure AI-tárolóval kapcsolatos gyakori kérdéseket a Microsoftnak számlázás céljából küldött információk példájáért.

Számlázási argumentumok

A docker-compose up parancs akkor indítja el a tárolót, ha az alábbi lehetőségek közül mind a három érvényes értéket tartalmazza:

Lehetőség Leírás
ApiKey A számlázási adatok nyomon követéséhez használt Azure AI-szolgáltatási erőforrás kulcsa.
Ennek a beállításnak az értékét a megadott kiépített erőforrás kulcsára kell állítani.Billing
Billing A számlázási adatok nyomon követésére használt Azure AI-szolgáltatási erőforrás végpontja.
Ennek a beállításnak az értékét egy kiépített Azure-erőforrás végponti URI-jára kell állítani.
Eula Azt jelzi, hogy elfogadta a tároló licencét.
Ennek a beállításnak az értékét el kell fogadni.

Ezekről a lehetőségekről további információt a Tárolók konfigurálása című témakörben talál.

Összegzés

Ennyi az egész! Ebben a cikkben megismerkedett a Dokumentumintelligencia-tárolók letöltésével, telepítésével és futtatásával kapcsolatos fogalmakkal és munkafolyamatokkal. Összegezve:

  • A Document Intelligence hét Linux-tárolót biztosít a Docker számára.
  • A tárolólemezképek az mcr-ről töltődnek le.
  • A tárolólemezképek a Dockerben futnak.
  • A számlázási adatokat meg kell adni egy tároló példányosításakor.

Fontos

Az Azure AI-tárolók nem rendelkeznek licenceléssel anélkül, hogy az Azure-hoz csatlakozna mérési célokra. Az ügyfeleknek engedélyeznie kell a tárolóknak, hogy mindig közöljék a számlázási adatokat a mérési szolgáltatással. Az Azure AI-tárolók nem küldenek ügyféladatokat (például az elemzett képet vagy szöveget) a Microsoftnak.

Következő lépések