Ez a tartalom a következőre vonatkozik: v3.0 (GA) v3.1 (GA)
Az Azure AI Document Intelligence egy Azure AI-szolgáltatás, amellyel automatizált adatfeldolgozási szoftvereket hozhat létre gépi tanulási technológiával. A dokumentumintelligencia lehetővé teszi szöveg, kulcs/érték párok, kijelölési jelek, táblázatadatok és egyebek azonosítását és kinyerét a dokumentumokból. Az eredmények olyan strukturált adatokként jelennek meg, amelyek .. A /tartalmazza az eredeti fájlban lévő kapcsolatokat. A tárolók csak a számukra megadott adatokat dolgozzák fel, és kizárólag azokat az erőforrásokat használják, amelyekhez hozzáférésük engedélyezett. A tárolók más régiókból származó adatokat nem tudnak feldolgozni.
Ebben a cikkben megtudhatja, hogyan tölthet le, telepíthet és futtathat Dokumentumintelligencia-tárolókat. A tárolók lehetővé teszik a Dokumentumintelligencia szolgáltatás futtatását a saját környezetében. A tárolók kiválóan alkalmasak adott biztonsági és adatszabályozási követelményekhez.
Az olvasási, elrendezési, azonosító dokumentum-, nyugta- és számlamodelleket a Document Intelligence v3.1-tárolók támogatják.
Az olvasási, elrendezési, általános dokumentum-, névjegykártya- és egyéni modelleket a Document Intelligence v3.0-tárolók támogatják.
Verziótámogatás
A tárolók támogatása jelenleg az összes modell dokumentumintelligencia-verziójával v3.0: 2022-08-31 (GA)
, valamint v3.1 2023-07-31 (GA)
olvasási, elrendezési, azonosító dokumentum-, nyugta- és számlamodellekhez érhető el:
Előfeltételek
Az első lépésekhez aktív Azure-fiókra van szüksége. Ha még nincs fiókja, hozzon létre egy ingyenes fiókot.
A Dokumentumintelligencia-tárolók használatához az alábbiakra is szüksége van:
Kötelező |
Cél |
A Docker ismerete |
Alapvető ismeretekkel kell rendelkeznie a Docker-fogalmakról, például a regisztrációs adatbázisokról, az adattárakról, a tárolókról és a tárolórendszerképekről, valamint ismernie kell az alapvető docker terminológiát és parancsokat. |
Docker Engine telepítve |
- A gazdaszámítógépen telepítve kell lennie a Docker-motornak. A Docker csomagokat biztosít a Docker-környezet konfigurálásához macOS, Windows és Linux rendszereken. A Docker és a tárolók alapszintű ismertetéséért lásd a Docker felhasználói útmutatóját.
- A Dockert úgy kell konfigurálni, hogy a tárolók kapcsolódhassanak és számlázási adatokat küldjenek az Azure-ba.
- Windows rendszeren a Dockert úgy is konfigurálnia kell, hogy támogassa a Linux-tárolókat.
|
Dokumentumintelligencia-erőforrás |
Egy egyszolgáltatásos Azure AI-dokumentumintelligencia vagy többszolgáltatásos erőforrás az Azure Portalon. A tárolók használatához rendelkeznie kell a társított kulccsal és végpont URI-val. Mindkét érték elérhető az Azure Portal dokumentumintelligencia-kulcsai és végpontoldalán : - {FORM_RECOGNIZER_KEY}: a két elérhető erőforráskulcs egyike.
- {FORM_RECOGNIZER_ENDPOINT_URI}: a számlázási adatok nyomon követésére használt erőforrás végpontja.
|
Választható |
Cél |
Azure CLI (parancssori felület) |
Az Azure CLI lehetővé teszi, hogy online parancsokat használjon az Azure-erőforrások létrehozásához és kezeléséhez. Telepíthető Windows, macOS és Linux rendszerű környezetekben, és Docker-tárolóban és Azure Cloud Shellben is futtatható. |
Gazdagépre vonatkozó követelmények
A gazdagép egy x64-alapú számítógép, amely a Docker-tárolót futtatja. Ez lehet egy számítógép a helyszínen vagy egy Docker-üzemeltetési szolgáltatás az Azure-ban, például:
Feljegyzés
Vegye figyelembe, hogy a Studio-tároló nem helyezhető üzembe és futtatható az Azure Kubernetes Service-ben. A Studio-tároló csak helyi gépen futtatható.
Tárolókövetelmények és javaslatok
Szükséges támogató tárolók
Az alábbi táblázat egy vagy több támogató tárolót sorol fel minden letöltött Dokumentumintelligencia-tárolóhoz. További információkért lásd a Számlázás szakaszt.
Szolgáltatástároló |
Támogató tárolók |
Olvasás |
Nem kötelező |
Elrendezés |
Nem kötelező |
Névjegykártya |
Olvasás |
Általános dokumentum |
Elrendezés |
Számla |
Elrendezés |
Nyugta |
Olvasás vagy elrendezés |
Azonosító dokumentum |
Olvasás |
Egyéni sablon |
Elrendezés |
Ajánlott processzormagok és memória
Feljegyzés
A minimális és ajánlott értékek a Docker korlátain alapulnak, nem pedig a gazdagép erőforrásain.
Dokumentumintelligencia-tárolók
Tároló |
Minimum |
Ajánlott |
Read |
8 magok, 10 GB memória |
8 magok, 24 GB memória |
Layout |
8 magok, 16 GB memória |
8 magok, 24 GB memória |
Business Card |
8 magok, 16 GB memória |
8 magok, 24 GB memória |
General Document |
8 magok, 12 GB memória |
8 magok, 24 GB memória |
ID Document |
8 magok, 8 GB memória |
8 magok, 24 GB memória |
Invoice |
8 magok, 16 GB memória |
8 magok, 24 GB memória |
Receipt |
8 magok, 11 GB memória |
8 magok, 24 GB memória |
Custom Template |
8 magok, 16 GB memória |
8 magok, 24 GB memória |
- Minden magnak legalább 2,6 gigahertzesnek (GHz) vagy gyorsabbnak kell lennie.
- A mag és a memória megfelel a
--cpus
parancs részeként docker compose
használt beállításoknak és --memory
docker run
beállításoknak.
Tipp.
A docker images paranccsal listázhatja a letöltött tárolólemezképeket. Az alábbi parancs például az egyes letöltött tárolólemezképek azonosítóját, adattárát és címkéjét sorolja fel táblázatként formázva:
docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"
IMAGE ID REPOSITORY TAG
<image-id> <repository-path/name> <tag-name>
A tároló futtatása a docker-compose up paranccsal
Cserélje le a(z) {ENDPOINT_URI} és {API_KEY} értékeket az erőforrásvégpont URI-jára és az Azure-erőforráslap kulcsára.
Győződjön meg arról, hogy az EULA
érték elfogadásra van állítva.
Meg EULA
kell adni a , Billing
és ApiKey
az értékeket, ellenkező esetben a tároló nem indítható el.
Fontos
A kulcsok a dokumentumintelligencia-erőforrás eléréséhez használhatók. Ne ossza meg a kulcsokat. Biztonságosan tárolhatja őket, például az Azure Key Vault használatával. Javasoljuk, hogy a kulcsokat rendszeresen hozza újra létre. API-hívás létrehozásához csak egy kulcs szükséges. Az első kulcs újragenerálásakor a második kulccsal továbbra is hozzáférhet a szolgáltatáshoz.
Az alábbi kódminta egy önálló példa a dokumentumintelligencia-elrendezés docker compose
tárolójának futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg az Elrendezés tárolópéldány {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit.
version: "3.9"
services:
azure-form-recognizer-read:
container_name: azure-form-recognizer-read
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
ports:
- "5000:5000"
networks:
- ocrvnet
networks:
ocrvnet:
driver: bridge
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
Az alábbi kódminta egy önálló docker compose
példa a Dokumentumintelligencia általános dokumentumtárolójának futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Az Általános dokumentum- és elrendezéstároló-példányok {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit adja meg.
version: "3.9"
services:
azure-cognitive-service-document:
container_name: azure-cognitive-service-document
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/document-3.0
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceLayoutHost=http://azure-cognitive-service-layout:5000
ports:
- "5000:5050"
azure-cognitive-service-layout:
container_name: azure-cognitive-service-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout-3.0
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
A gépen lévő erőforrások miatt az Általános dokumentum tároló üzembe helyezése eltarthat egy ideig.
Az alábbi kódminta egy önálló példa a dokumentumintelligencia-elrendezés docker compose
tárolójának futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg az Elrendezés tárolópéldány {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit.
version: "3.9"
services:
azure-form-recognizer-layout:
container_name: azure-form-recognizer-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
ports:
- "5000:5000"
networks:
- ocrvnet
networks:
ocrvnet:
driver: bridge
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
Az alábbi kódminta egy önálló példa a Dokumentumintelligencia számlatároló docker compose
futtatásához. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg a számlázási és elrendezési tárolópéldányok {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értékeit.
A 3.1 GA-elrendezési rendszerképet a 3.0 GA és a 3.1 GA számlamodellekhez is felsőbb rétegként kell használnia.
version: "3.9"
services:
azure-cognitive-service-invoice:
container_name: azure-cognitive-service-invoice
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceLayoutHost=http://azure-cognitive-service-layout:5000
ports:
- "5000:5050"
azure-cognitive-service-layout:
container_name: azure-cognitive-service-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
Az alábbi kódminta egy önálló docker compose
példa a Dokumentumintelligencia általános dokumentumtárolójának futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg a {FORM_RECOGNIZER_ENDPOINT_URI} és a {FORM_RECOGNIZER_KEY} értéket a nyugta- és olvasási tárolópéldányokhoz.
A 3.1 GA-elrendezés képe olvasási kép helyett felsőbb rétegként is használható.
version: "3.9"
services:
azure-cognitive-service-receipt:
container_name: azure-cognitive-service-receipt
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/receipt-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceReadHost=http://azure-cognitive-service-read:5000
ports:
- "5000:5050"
azure-cognitive-service-read:
container_name: azure-cognitive-service-read
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
Az alábbi kódminta egy önálló docker compose
példa a Dokumentumintelligencia általános dokumentumtárolójának futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból. Adja meg a(z) {FORM_RECOGNIZER_ENDPOINT_URI} és {FORM_RECOGNIZER_KEY} értéket az azonosító- és olvasási tárolópéldányokhoz.
A 3.1 GA-elrendezés képe olvasási kép helyett felsőbb rétegként is használható.
version: "3.9"
services:
azure-cognitive-service-id-document:
container_name: azure-cognitive-service-id-document
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/id-document-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceReadHost=http://azure-cognitive-service-read:5000
ports:
- "5000:5050"
azure-cognitive-service-read:
container_name: azure-cognitive-service-read
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.1
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
Most a docker compose paranccsal indíthatja el a szolgáltatást:
docker-compose up
version: "3.9"
services:
azure-cognitive-service-invoice:
container_name: azure-cognitive-service-businesscard
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/businesscard-3.0
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
- AzureCognitiveServiceLayoutHost=http://azure-cognitive-service-layout:5000
ports:
- "5000:5050"
azure-cognitive-service-layout:
container_name: azure-cognitive-service-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout-3.0
environment:
- EULA=accept
- billing={FORM_RECOGNIZER_ENDPOINT_URI}
- apiKey={FORM_RECOGNIZER_KEY}
Az előfeltételek mellett az alábbiakat kell tennie egy egyéni dokumentum feldolgozásához:
Mappa létrehozása és a következő fájlok tárolása
- Nevezze el ezt a mappafájlt.
- A mappa fájlelérési útvonalára {FILE_MOUNT_PATH} néven hivatkozunk.
- Másolja a fájl elérési útját egy megfelelő helyre, és hozzá kell adnia az .env fájlhoz. Ha például a mappát fájloknak nevezzük, és ugyanabban a mappában található, mint a
docker-compose
fájl, az .env fájlbejegyzés FILE_MOUNT_PATH="./files"
Hozzon létre egy mappát a Dokumentumintelligencia szolgáltatás által a helyi számítógépen írt naplók tárolásához
- Nevezze el ezt a mappakimenetet.
- A mappa fájlelérési útvonalára {OUTPUT_MOUNT_PATH} néven hivatkozunk.
- Másolja a fájl elérési útját egy megfelelő helyre, és hozzá kell adnia az .env fájlhoz. Ha például a mappát kimenetnek nevezzük, amely ugyanabban a mappában található, mint a
docker-compose
fájl, az .env fájlbejegyzés OUTPUT_MOUNT_PATH="./output"
Mappa létrehozása a tárolók között megosztott belső feldolgozás tárolásához
- Nevezze el ezt a mappát megosztva.
- A mappa fájlelérési útvonalára {SHARED_MOUNT_PATH} néven hivatkozunk.
- Másolja a fájl elérési útját egy megfelelő helyre, és hozzá kell adnia az .env fájlhoz. Ha például a mappát megosztottnak nevezzük, és ugyanabban a mappában található, mint a
docker-compose
fájl, akkor az .env fájlbejegyzés SHARED_MOUNT_PATH="./shared"
- Nevezze el ezt a mappaadatbázist.
- A mappa fájlelérési útvonalára {DB_MOUNT_PATH} néven hivatkozunk.
- Másolja a fájl elérési útját egy megfelelő helyre, és hozzá kell adnia az .env fájlhoz. Ha például a mappát db-nek hívják, amely a
docker-compose
fájllal megegyező mappában található, az .env fájlbejegyzés a következő: DB_MOUNT_PATH="./db"
Környezeti fájl létrehozása
Nevezze el ezt a fájlt .env.
Deklarálja a következő környezeti változókat:
SHARED_MOUNT_PATH="./shared"
OUTPUT_MOUNT_PATH="./output"
FILE_MOUNT_PATH="./files"
DB_MOUNT_PATH="./db"
FORM_RECOGNIZER_ENDPOINT_URI="YourFormRecognizerEndpoint"
FORM_RECOGNIZER_KEY="YourFormRecognizerKey"
NGINX_CONF_FILE="./nginx.conf"
Nginx-fájl létrehozása
Nevezze el ezt a fájlt nginx.conf néven.
Adja meg a következő konfigurációt:
worker_processes 1;
events { worker_connections 1024; }
http {
sendfile on;
client_max_body_size 90M;
upstream docker-custom {
server azure-cognitive-service-custom-template:5000;
}
upstream docker-layout {
server azure-cognitive-service-layout:5000;
}
server {
listen 5000;
location = / {
proxy_set_header Host $host:$server_port;
proxy_set_header Referer $scheme://$host:$server_port;
proxy_pass http://docker-custom/;
}
location /status {
proxy_pass http://docker-custom/status;
}
location /test {
return 200 $scheme://$host:$server_port;
}
location /ready {
proxy_pass http://docker-custom/ready;
}
location /swagger {
proxy_pass http://docker-custom/swagger;
}
location /formrecognizer/documentModels/prebuilt-layout {
proxy_set_header Host $host:$server_port;
proxy_set_header Referer $scheme://$host:$server_port;
add_header 'Access-Control-Allow-Origin' '*' always;
add_header 'Access-Control-Allow-Headers' 'cache-control,content-type,ocp-apim-subscription-key,x-ms-useragent' always;
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS' always;
add_header 'Access-Control-Expose-Headers' '*' always;
if ($request_method = 'OPTIONS') {
return 200;
}
proxy_pass http://docker-layout/formrecognizer/documentModels/prebuilt-layout;
}
location /formrecognizer/documentModels {
proxy_set_header Host $host:$server_port;
proxy_set_header Referer $scheme://$host:$server_port;
add_header 'Access-Control-Allow-Origin' '*' always;
add_header 'Access-Control-Allow-Headers' 'cache-control,content-type,ocp-apim-subscription-key,x-ms-useragent' always;
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS, DELETE' always;
add_header 'Access-Control-Expose-Headers' '*' always;
if ($request_method = 'OPTIONS') {
return 200;
}
proxy_pass http://docker-custom/formrecognizer/documentModels;
}
location /formrecognizer/operations {
add_header 'Access-Control-Allow-Origin' '*' always;
add_header 'Access-Control-Allow-Headers' 'cache-control,content-type,ocp-apim-subscription-key,x-ms-useragent' always;
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS, PUT, DELETE, PATCH' always;
add_header 'Access-Control-Expose-Headers' '*' always;
if ($request_method = OPTIONS ) {
return 200;
}
proxy_pass http://docker-custom/formrecognizer/operations;
}
}
}
Docker-összeállítási fájl létrehozása
A fájl neve docker-compose.yml
Az alábbi kódminta egy önálló példa a Dokumentumintelligencia-elrendezés docker compose
, a Studio és az Egyéni sablontárolók együttes futtatására. Ezzel docker compose
egy YAML-fájlt használ az alkalmazás szolgáltatásainak konfigurálásához. Ezután a docker-compose up
paranccsal létrehozza és elindítja az összes szolgáltatást a konfigurációból.
version: '3.3'
services:
nginx:
image: nginx:alpine
container_name: reverseproxy
volumes:
- ${NGINX_CONF_FILE}:/etc/nginx/nginx.conf
ports:
- "5000:5000"
layout:
container_name: azure-cognitive-service-layout
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/layout-3.0:latest
environment:
eula: accept
apikey: ${FORM_RECOGNIZER_KEY}
billing: ${FORM_RECOGNIZER_ENDPOINT_URI}
Logging:Console:LogLevel:Default: Information
SharedRootFolder: /shared
Mounts:Shared: /shared
Mounts:Output: /logs
volumes:
- type: bind
source: ${SHARED_MOUNT_PATH}
target: /shared
- type: bind
source: ${OUTPUT_MOUNT_PATH}
target: /logs
expose:
- "5000"
custom-template:
container_name: azure-cognitive-service-custom-template
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/custom-template-3.0:latest
restart: always
depends_on:
- layout
environment:
AzureCognitiveServiceLayoutHost: http://azure-cognitive-service-layout:5000
eula: accept
apikey: ${FORM_RECOGNIZER_KEY}
billing: ${FORM_RECOGNIZER_ENDPOINT_URI}
Logging:Console:LogLevel:Default: Information
SharedRootFolder: /shared
Mounts:Shared: /shared
Mounts:Output: /logs
volumes:
- type: bind
source: ${SHARED_MOUNT_PATH}
target: /shared
- type: bind
source: ${OUTPUT_MOUNT_PATH}
target: /logs
expose:
- "5000"
studio:
container_name: form-recognizer-studio
image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/studio:3.0
environment:
ONPREM_LOCALFILE_BASEPATH: /onprem_folder
STORAGE_DATABASE_CONNECTION_STRING: /onprem_db/Application.db
volumes:
- type: bind
source: ${FILE_MOUNT_PATH} # path to your local folder
target: /onprem_folder
- type: bind
source: ${DB_MOUNT_PATH} # path to your local folder
target: /onprem_db
ports:
- "5001:5001"
user: "1000:1000" # echo $(id -u):$(id -g)
Az egyéni sablontároló és az Elrendezés tároló azure Storage-üzenetsorokat vagy memóriasorokat használhat. A Storage:ObjectStore:AzureBlob:ConnectionString
környezeti és queue:azure:connectionstring
a környezeti változókat csak akkor kell beállítani, ha Azure Storage-üzenetsorokat használ. Helyi futtatáskor törölje ezeket a változókat.
Győződjön meg arról, hogy a szolgáltatás fut
A szolgáltatás működésének biztosítása. Futtassa ezeket a parancsokat egy Ubuntu-rendszerhéjban.
$cd <folder containing the docker-compose file>
$source .env
$docker-compose up
Az egyéni sablontárolókhoz szükség van néhány különböző konfigurációra, és támogatják az egyéb választható konfigurációkat.
Beállítás |
Kötelező |
Leírás |
EULA |
Igen |
Licencelfogadási példa: Eula=accept |
Számlázás |
Igen |
Az FR-erőforrás számlázási végpontjának URI-ja |
ApiKey |
Igen |
Az FR-erőforrás végpontkulcsa |
Queue:Azure:ConnectionString |
Nem |
Azure Queue kapcsolati sztring |
Storage:ObjectStore:AzureBlob:ConnectionString |
Nem |
Azure Blob kapcsolati sztring |
HealthCheck:MemoryUpperboundInMB |
Nem |
Memóriaküszöb a nem megfelelő állapotnak az élőségről való jelentéséhez. Alapértelmezett: Ugyanaz, mint az ajánlott memória |
StorageTimeToLiveInMinutes |
Nem |
TTL időtartamot az összes köztes és végleges fájl eltávolításához. Alapértelmezett: Két nap, TTL öt perc és hét nap között állítható be |
Feladat:MaxRunningTimeSpanInMinutes |
Nem |
A kérelem időtúllépésként való kezeléséhez szükséges maximális futási idő. Alapértelmezett: 60 perc |
HTTP_PROXY_BYPASS_URLS |
Nem |
Url-címek megadása proxy megkerüléséhez Példa: HTTP_PROXY_BYPASS_URLS = abc.com, xyz.com |
AzureCognitiveServiceReadHost (csak nyugta, IdDocument-tárolók) |
Igen |
Adja meg az olvasási tároló uri-példa:AzureCognitiveServiceReadHost=http://onprem-frread:5000 |
AzureCognitiveServiceLayoutHost (csak dokumentum- és számlatárolók) |
Igen |
Elrendezési tároló uri-ának megadása példa:AzureCognitiveServiceLayoutHost=http://onprem-frlayout:5000 |
Modell betanítása a Document Intelligence Studióval
Gyűjtsön össze legalább öt azonos típusú formát. Ezeket az adatokat használva betanítsa a modellt, és teszteljen egy űrlapot. Használhat mintaadatkészletet (letölthet és kinyerhet sample_data.zip).
Miután meggyőződhetett arról, hogy a tárolók futnak, nyisson meg egy böngészőt, és keresse meg azt a végpontot, ahol a tárolók telepítve vannak. Ha ez az üzembe helyezés a helyi gép, a végpont a következő [http://localhost:5001](http://localhost:5001)
: .
Válassza ki az egyéni kinyerési modell csempét.
Válassza ki a Create project
lehetőséget.
Adjon meg egy projektnevet és opcionálisan egy leírást
Az "erőforrás konfigurálása" lépésben adja meg az egyéni sablonmodell végpontját. Ha telepítette a tárolókat a helyi gépen, használja ezt az URL-címet [http://localhost:5000](http://localhost:5000)
.
Adjon meg egy almappát, ahol a betanítási adatok a fájlok mappájában találhatók.
Végül hozza létre a projektet
Most létre kell hoznia egy projektet, amely készen áll a címkézésre. Töltse fel a betanítási adatokat, és kezdje el a címkézést. Ha még nem rendelkezik címkézéssel, tekintse meg az egyéni modellek összeállítását és betanítását.
Az API használata a betanítása érdekében
Ha közvetlenül egy modell betanításához szeretné meghívni az API-kat, az egyéni sablonmodell betanítási API-ja egy base64 kódolású zip-fájlt igényel, amely a címkézési projekt tartalma. Kihagyhatja a PDF- vagy képfájlokat, és csak a JSON-fájlokat küldheti el.
Miután felcímkézett és *.ocr.json, *.labels.json és fields.json fájlokat adott hozzá egy zip-fájlhoz, a PowerShell-parancsokkal hozza létre a base64 kódolású sztringet.
$bytes = [System.IO.File]::ReadAllBytes("<your_zip_file>.zip")
$b64String = [System.Convert]::ToBase64String($bytes, [System.Base64FormattingOptions]::None)
A kérés közzétételéhez használja a buildmodell API-t.
POST http://localhost:5000/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "mymodel",
"description": "test model",
"buildMode": "template",
"base64Source": "<Your base64 encoded string>",
"tags": {
"additionalProp1": "string",
"additionalProp2": "string",
"additionalProp3": "string"
}
}
Ellenőrizze, hogy a szolgáltatás fut-e
A tároló futásának ellenőrzésére többféleképpen is van lehetőség:
A tároló vizuális ellenőrzésként egy kezdőlapot \
biztosít, amely ellenőrzi, hogy a tároló fut-e.
Megnyithatja a kedvenc webböngészőt, és navigálhat a kérdéses tároló külső IP-címére és közzétett portjára. A felsorolt kérelem URL-címeinek használatával ellenőrizze, hogy a tároló fut-e. A felsorolt példakérési URL-címek a következők http://localhost:5000
, de az adott tároló eltérő lehet. Ne feledje, hogy a tároló külső IP-címére és a közzétett portra navigál.
URL-cím kérése |
Cél |
http:// localhost:5000/ |
A tároló egy kezdőlappal rendelkezik. |
http:// localhost:5000/ready |
A GET kérése ellenőrzi, hogy a tároló készen áll-e egy lekérdezés elfogadására a modellen. Ez a kérés használható a Kubernetes-beli élő- és készültségi mintavételekhez. |
http:// localhost:5000/status |
A GET használatával kért kérés ellenőrzi, hogy a tároló elindításához használt API-kulcs érvényes-e végpontlekérdezés nélkül. Ez a kérés használható a Kubernetes-beli élő- és készültségi mintavételekhez. |
http:// localhost:5000/swagger |
A tároló átfogó dokumentációval is rendelkezik a végpontokhoz, valamint egy kipróbálás funkcióval is. Ezzel a funkcióval beírhatja a beállításokat egy webes HTML-űrlapba, és kódírás nélkül is elvégezheti a lekérdezést. A lekérdezés visszatérése után megjelenik egy példa CURL-parancs, amely bemutatja a szükséges HTTP-fejléceket és törzsformátumot. |
|
|
Tárolók leállítása
A tárolók leállításához használja a következő parancsot:
docker-compose down
Számlázás
A Dokumentumintelligencia-tárolók számlázási adatokat küldenek az Azure-nak egy Dokumentumintelligencia-erőforrás használatával az Azure-fiókban.
A tárolóba irányuló lekérdezések számlázása az API-hoz Key
használt Azure-erőforrás tarifacsomagján lesz. A rendszer kiszámítja a számlázást minden olyan tárolópéldányhoz, amely a dokumentumok és a rendszerképek feldolgozására szolgál.
Ha a következő hibaüzenet jelenik meg: A tároló nincs érvényes állapotban. Az előfizetés érvényesítése nem sikerült, mert az "OutOfQuota" API-kulcs nincs kvótában. Ez azt jelzi, hogy a tárolók nem kommunikálnak a számlázási végpont használatával.
Csatlakozás az Azure szolgáltatáshoz
A tárolónak futtatnia kell a számlázási argumentum értékeit. Ezek az értékek lehetővé teszik, hogy a tároló csatlakozzon a számlázási végponthoz. A tároló körülbelül 10–15 percenként jelenti a használatot. Ha a tároló az engedélyezett időkereten belül nem csatlakozik az Azure-hoz, a tároló továbbra is fut, de a számlázási végpont visszaállításáig nem szolgál ki lekérdezéseket. A kapcsolat 10 alkalommal, 10–15 perces időintervallumban történik. Ha a 10 próbálkozáson belül nem tud csatlakozni a számlázási végponthoz, a tároló leállítja a kérések kiszolgálását. Tekintse meg az Azure AI-tárolóval kapcsolatos gyakori kérdéseket a Microsoftnak számlázás céljából küldött információk példájáért.
Számlázási argumentumok
A docker-compose up parancs akkor indítja el a tárolót, ha az alábbi lehetőségek közül mind a három érvényes értéket tartalmazza:
Lehetőség |
Leírás |
ApiKey |
A számlázási adatok nyomon követéséhez használt Azure AI-szolgáltatási erőforrás kulcsa. Ennek a beállításnak az értékét a megadott kiépített erőforrás kulcsára kell állítani.Billing |
Billing |
A számlázási adatok nyomon követésére használt Azure AI-szolgáltatási erőforrás végpontja. Ennek a beállításnak az értékét egy kiépített Azure-erőforrás végponti URI-jára kell állítani. |
Eula |
Azt jelzi, hogy elfogadta a tároló licencét. Ennek a beállításnak az értékét el kell fogadni. |
Ezekről a lehetőségekről további információt a Tárolók konfigurálása című témakörben talál.
Összegzés
Ennyi az egész! Ebben a cikkben megismerkedett a Dokumentumintelligencia-tárolók letöltésével, telepítésével és futtatásával kapcsolatos fogalmakkal és munkafolyamatokkal. Összegezve:
- A Document Intelligence hét Linux-tárolót biztosít a Docker számára.
- A tárolólemezképek az mcr-ről töltődnek le.
- A tárolólemezképek a Dockerben futnak.
- A számlázási adatokat meg kell adni egy tároló példányosításakor.
Fontos
Az Azure AI-tárolók nem rendelkeznek licenceléssel anélkül, hogy az Azure-hoz csatlakozna mérési célokra. Az ügyfeleknek engedélyeznie kell a tárolóknak, hogy mindig közöljék a számlázási adatokat a mérési szolgáltatással. Az Azure AI-tárolók nem küldenek ügyféladatokat (például az elemzett képet vagy szöveget) a Microsoftnak.
Következő lépések