Dokumentumintelligencia-tárolók konfigurálása
A tárolók támogatása jelenleg az összes modell dokumentumintelligencia-verziójával 2022-08-31 (GA)
, valamint 2023-07-31 (GA)
az olvasási, elrendezési, számla-, nyugta- és azonosítódokumentum-modellekkel érhető el:
- REST API
2022-08-31 (GA)
- REST API
2023-07-31 (GA)
- Ügyfélkódtárak célzása
REST API 2022-08-31 (GA)
- Ügyfélkódtárak célzása
REST API 2023-07-31 (GA)
✔️ Lásd: Document Intelligence v3.0-tárolók konfigurálása a támogatott tárolódokumentációhoz.
Ez a tartalom a következőre vonatkozik: v3.0 (GA) v3.1 (GA)
A Document Intelligence-tárolókkal olyan alkalmazásarchitektúrát hozhat létre, amely a robusztus felhőbeli képességek és a peremhálózat kihasználása érdekében optimalizált. A tárolók minimalista, elszigetelt környezetet biztosítanak, amely könnyen üzembe helyezhető a helyszínen és a felhőben. Ebben a cikkben bemutatjuk, hogyan konfigurálhatja a Dokumentumintelligencia-tároló futásidejű környezetét a docker compose
parancsargumentumok használatával. A dokumentumintelligencia-funkciókat hét dokumentumintelligencia-szolgáltatástároló támogatja: olvasás, elrendezés, névjegykártya, azonosító dokumentum, nyugta, számla, egyéni. Ezek a tárolók kötelező és opcionális beállításokkal is rendelkeznek. Néhány példát a Példa docker-compose.yml fájl szakaszban talál.
Konfigurációs beállítások
Minden tároló a következő konfigurációs beállításokkal rendelkezik:
Kötelező | Beállítás | Cél |
---|---|---|
Igen | Kulcs | Nyomon követi a számlázási adatokat. |
Igen | Számlázás | Az Azure-beli szolgáltatáserőforrás végponti URI-ját adja meg. További információ: Számlázás. További információkért és a regionális végpontok teljes listájáért tekintse meg az Azure AI-szolgáltatások egyéni altartományneveit. |
Igen | Eula | Azt jelzi, hogy elfogadta a tároló licencét. |
Nem | ApplicationInsights | Lehetővé teszi Azure-alkalmazás Insights-ügyféltámogatás hozzáadását a tárolóhoz. |
Nem | Fluentd | Napló- és metrikaadatokat ír egy Fluentd-kiszolgálóra. |
Nem | HTTP-proxy | HTTP-proxyt konfigurál kimenő kérések végrehajtásához. |
Nem | Logging | ASP.NET Alapvető naplózási támogatást biztosít a tárolóhoz. |
Fontos
A Key
rendszer együtt használja a , Billing
és Eula
a beállításokat. Mindhárom beállításhoz érvényes értékeket kell megadnia; ellenkező esetben a tárolók nem indulnak el. A tárolók példányosításához a konfigurációs beállítások használatával kapcsolatos további információkért lásd a Számlázás című témakört.
Kulcs- és számlázási konfigurációs beállítás
A Key
beállítás megadja a tároló számlázási adatainak nyomon követésére használt Azure-erőforráskulcsot. A kulcs értékének érvényes kulcsnak kell lennie ahhoz az erőforráshoz Billing
, amely a "Számlázási konfigurációs beállítás" szakaszban van megadva.
A Billing
beállítás megadja az Azure-beli erőforrás végponti URI-ját, amely a tároló számlázási adatainak mérésére szolgál. A konfigurációs beállítás értékének érvényes végponti URI-nak kell lennie egy Azure-beli erőforráshoz. A tároló körülbelül 10–15 percenként jelenti a használatot.
Ezeket a beállításokat az Azure Portal kulcsok és végpontok lapján találja.
EULA
beállítás
A Eula
beállítás azt jelzi, hogy elfogadta a tároló licencét. Ehhez a konfigurációs beállításhoz meg kell adnia egy értéket, az értéknek pedig a következőre accept
kell lennie.
Szükséges | Név | Adattípus | Leírás |
---|---|---|---|
Igen | Eula |
Sztring | Licenc elfogadása Példa: Eula=accept |
Az Azure AI-szolgáltatások tárolóinak licencelése az Ön szerződése alapján, az Azure használatára vonatkozik. Ha nem rendelkezik az Azure használatára vonatkozó meglévő szerződéssel, elfogadja, hogy az Azure használatára vonatkozó szerződése a Microsoft Online Előfizetési Szerződés, amely tartalmazza az online szolgáltatási feltételeket. Az előzetes verziók esetében ön elfogadja a Microsoft Azure Előzetes verzióra vonatkozó kiegészítő használati feltételeket is. A tároló használatával elfogadja ezeket a feltételeket.
ApplicationInsights-beállítás
A ApplicationInsights
beállítás lehetővé teszi Azure-alkalmazás Insights telemetriai támogatás hozzáadását a tárolóhoz. Az Application Insights részletes monitorozást biztosít a tárolóról. A tárolót egyszerűen monitorozhatja a rendelkezésre állás, a teljesítmény és a használat szempontjából. Emellett gyorsan azonosíthatja és diagnosztizálhatja a tároló hibáit.
Az alábbi táblázat a szakaszban támogatott ApplicationInsights
konfigurációs beállításokat ismerteti.
Szükséges | Név | Adattípus | Leírás |
---|---|---|---|
Nem | InstrumentationKey |
Sztring | Annak az Application Insights-példánynak a rendszerállapotkulcsa, amelybe a tároló telemetriai adatait küldi a rendszer. További információ: Application Insights for ASP.NET Core. Példa: InstrumentationKey=123456789 |
Fluentd-beállítások
A Fluentd egy nyílt forráskódú adatgyűjtő az egységes naplózáshoz. A Fluentd
beállítások kezelik a tároló fluentd-kiszolgálóhoz való kapcsolatát. A tároló tartalmaz egy Fluentd naplózási szolgáltatót, amely lehetővé teszi, hogy a tároló naplókat írjon, és opcionálisan metrikaadatokat írjon egy Fluentd-kiszolgálóra.
Az alábbi táblázat a szakaszban támogatott Fluentd
konfigurációs beállításokat ismerteti.
Név | Adattípus | Leírás |
---|---|---|
Host |
Sztring | A Fluentd-kiszolgáló IP-címe vagy DNS-állomásneve. |
Port |
Egész | A Fluentd-kiszolgáló portja. Az alapértelmezett érték 24224. |
HeartbeatMs |
Egész | A szívverési időköz ezredmásodpercben. Ha az időköz lejárta előtt nem küldött eseményforgalmat, a rendszer szívverést küld a Fluentd-kiszolgálónak. Az alapértelmezett érték 60000 ezredmásodperc (1 perc). |
SendBufferSize |
Egész | A küldési műveletekhez lefoglalt hálózati pufferterület bájtban. Az alapértelmezett érték 32768 bájt (32 kilobájt). |
TlsConnectionEstablishmentTimeoutMs |
Egész | Ezredmásodpercben az időtúllépés a Fluentd-kiszolgálóval létesített SSL-/TLS-kapcsolat létrehozásához. Az alapértelmezett érték 10000 ezredmásodperc (10 másodperc). Ha UseTLS hamis értékre van állítva, a rendszer figyelmen kívül hagyja ezt az értéket. |
UseTLS |
Logikai | Azt jelzi, hogy a tárolónak SSL/TLS protokollt kell-e használnia a Fluentd-kiszolgálóval való kommunikációhoz. Az alapértelmezett érték: hamis. |
HTTP-proxy hitelesítő adatainak beállításai
Ha HTTP-proxyt kell konfigurálnia a kimenő kérések végrehajtásához, használja az alábbi két argumentumot:
Név | Adattípus | Leírás |
---|---|---|
HTTP_PROXY | húr | A használni kívánt proxy, például: http://proxy:8888 <proxy-url> |
HTTP_PROXY_CREDS | húr | A proxyn való hitelesítéshez szükséges hitelesítő adatok, például username:password . Ennek az értéknek kisbetűsnek kell lennie. |
<proxy-user> |
húr | A proxy felhasználója. |
<proxy-password> |
húr | A proxyhoz <proxy-user> társított jelszó. |
docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
--mount type=bind,src=/home/azureuser/output,target=/output \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
HTTP_PROXY=<proxy-url> \
HTTP_PROXY_CREDS=<proxy-user>:<proxy-password> \
Naplózási beállítások
A Logging
beállítások kezelik a tároló ASP.NET Core naplózási támogatását. Ugyanazokat a konfigurációs beállításokat és értékeket használhatja a tárolóhoz, amelyeket egy ASP.NET Core-alkalmazáshoz használ.
A tároló a következő naplózási szolgáltatókat támogatja:
Szolgáltató | Cél |
---|---|
Console | A ASP.NET Core Console naplózási szolgáltató. A naplózási szolgáltató összes ASP.NET alapkonfigurációs beállítása és alapértelmezett értéke támogatott. |
Debug | A ASP.NET Core Debug naplózási szolgáltató. A naplózási szolgáltató összes ASP.NET alapkonfigurációs beállítása és alapértelmezett értéke támogatott. |
Disk | A JSON-naplózási szolgáltató. Ez a naplózási szolgáltató naplóadatokat ír a kimeneti csatlakoztatáshoz. |
Ez a tárolóparancs JSON formátumban tárolja a naplózási adatokat a kimeneti csatlakoztatáshoz:
docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
--mount type=bind,src=/home/azureuser/output,target=/output \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
Logging:Disk:Format=json \
Mounts:Output=/output
Ez a tárolóparancs a hibakeresési információkat jeleníti meg, a tároló futása közben előtaggal dbug
:
docker run --rm -it -p 5000:5000 \
--memory 2g --cpus 1 \
<registry-location>/<image-name> \
Eula=accept \
Billing=<endpoint> \
ApiKey=<api-key> \
Logging:Console:LogLevel:Default=Debug
Lemeznaplózás
A Disk
naplózási szolgáltató a következő konfigurációs beállításokat támogatja:
Név | Adattípus | Leírás |
---|---|---|
Format |
Sztring | A naplófájlok kimeneti formátuma. Megjegyzés: Ezt az értéket úgy kell beállítani, hogy json engedélyezze a naplózási szolgáltatót. Ha ez az érték anélkül van megadva, hogy kimeneti csatlakoztatást is megad a tároló példányosítása közben, hiba történik. |
MaxFileSize |
Egész | A naplófájl maximális mérete megabájtban (MB). Ha az aktuális naplófájl mérete eléri vagy meghaladja ezt az értéket, a naplózási szolgáltató elindít egy új naplófájlt. Ha -1 van megadva, a naplófájl méretét csak a kimeneti csatlakoztatás maximális fájlmérete korlátozza. Az alapértelmezett érték 1. |
A ASP.NET Core naplózási támogatásának konfigurálásáról további információt a Beállítások fájlkonfiguráció című témakörben talál.
Kötetbeállítások
Kötetek használatával olvashat és írhat adatokat a tárolóba és onnan. A Kötetek előnyben részesítik a Docker-tárolók által létrehozott és használt adatok megőrzését. Megadhat bemeneti csatlakoztatást vagy kimeneti csatlakoztatást a beállítás és a volumes
beállítás (kötés), source
(a mappa elérési útja) és target
(a fájl elérési útvonalának paramétere) megadásával type
.
A Dokumentumintelligencia-tárolóhoz bemeneti és kimeneti kötet szükséges. A bemeneti kötet írásvédett lehet (ro
), és a betanításhoz és a pontozáshoz használt adatokhoz való hozzáféréshez szükséges. A kimeneti kötetnek írhatónak kell lennie, és a modellek és az ideiglenes adatok tárolására kell használnia.
A gazdagép kötetének pontos szintaxisa a gazdagép operációs rendszerétől függően változik. Emellett előfordulhat, hogy a gazdaszámítógép kötethelye nem érhető el a Docker szolgáltatásfiók engedélyei és a gazdagép csatlakoztatási helyének engedélyei közötti ütközés miatt.
Példa docker-compose.yml fájlra
A docker compose metódus három lépésből áll:
- Hozzon létre egy Dockerfile-t.
- Definiálja a szolgáltatásokat egy docker-compose.yml , hogy együtt fussanak egy elszigetelt környezetben.
- Futtassa
docker-compose up
a szolgáltatásokat.
Példa egy tárolóra
Ebben a példában adja meg az Elrendezés tárolópéldány {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit.
Elrendezéstároló
version: "3.9"
services:
azure-cognitive-service-layout:
container_name: azure-cognitive-service-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- key={FORM_RECOGNIZER_KEY}
ports:
- "5000"
networks:
- ocrvnet
networks:
ocrvnet:
driver: bridge
Több tároló – példa
Nyugta- és OCR-olvasási tárolók
Ebben a példában adja meg a {FORM_RECOGNIZER_ENDPOINT_URI} és a {FORM_RECOGNIZER_KEY} értéket a Nyugtatárolóhoz, az Azure AI Vision Read-tároló {COMPUTER_VISION_ENDPOINT_URI} és {COMPUTER_VISION_KEY} értékeit.
version: "3"
services:
azure-cognitive-service-receipt:
container_name: azure-cognitive-service-receipt
image: cognitiveservicespreview.azurecr.io/microsoft/cognitive-services-form-recognizer-receipt:2.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- key={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceReadHost=http://azure-cognitive-service-read:5000
ports:
- "5000:5050"
networks:
- ocrvnet
azure-cognitive-service-read:
container_name: azure-cognitive-service-read
image: mcr.microsoft.com/azure-cognitive-services/vision/read:3.2
environment:
- EULA=accept
- billing={COMPUTER_VISION_ENDPOINT_URI}
- key={COMPUTER_VISION_KEY}
networks:
- ocrvnet
networks:
ocrvnet:
driver: bridge