Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Ebben az oktatóanyagban megtudhatja, hogyan aktiválhat Batch-feladatokat az Azure Functions használatával. Ez a cikk egy példát mutat be, amely egy Azure Storage-blobtárolóhoz hozzáadott dokumentumokat alkalmaz optikai karakterfelismerésre (OCR) az Azure Batch használatával. Az OCR-feldolgozás egyszerűsítése érdekében ez a példa egy Azure-függvényt konfigurál, amely batch OCR-feladatot futtat minden alkalommal, amikor egy fájlt hozzáad a blobtárolóhoz. Megtudhatja, hogyan:
- Készletek és feladatok létrehozásához használja az Azure Portalt.
- Blobtárolók és közös hozzáférésű jogosultságkód (SAS) létrehozása.
- Hozzon létre egy Azure-függvényt, amelyet Blob aktivál.
- Bemeneti fájlok feltöltése a Tárolóba.
- Tevékenység végrehajtásának figyelése.
- Kimeneti fájlok lekérése.
Előfeltételek
- Egy Azure-fiók, aktív előfizetéssel. Hozzon létre egy fiókot ingyenesen.
- Egy Azure Batch-fiók és egy társított Azure Storage-fiók. A fiókok létrehozásáról és összekapcsolásáról további információt a Batch-fiók létrehozása című témakörben talál.
Bejelentkezés az Azure-ba
Jelentkezzen be a Azure portalra.
Batch-készlet és Batch-feladat létrehozása az Azure Portal használatával
Ebben a szakaszban az Azure Portal használatával hozza létre az OCR-feladatokat futtató Batch-készletet és Batch-feladatot.
Készlet létrehozása
Jelentkezzen be az Azure Portalra azure-beli hitelesítő adataival.
Hozzon létre egy készletet a bal oldali navigációs sáv Készletek elemének kiválasztásával, majd a keresési űrlap fölött található Hozzáadás gombra kattintva.
- Adjon meg egy készletazonosítót. Ez a példa a készletet
ocr-pool-nek nevezi. - Válassza a Canonical opciót közzétevőként.
- Ajánlatként válassza a 0001-com-ubuntu-server-jammy lehetőséget.
- Válassza ki a 22_04-ltsSku-ként.
- Válassza ki
Standard_F2s_v2 - 2 vCPUs, 2 GB Memorya virtuális gép méretét a Csomópontméret szakaszban. - Állítsa a Méretezés szakaszban lévő módotRögzített értékre, és adja meg a 3 értéket a dedikált célcsomópontokhoz.
- Állítsa be a Start feladatot úgy, hogy engedélyezve legyen a kezdési feladat, és írja be a parancsot
/bin/bash -c "sudo update-locale LC_ALL=C.UTF-8 LANG=C.UTF-8; sudo apt-get update; sudo apt-get -y install ocrmypdf"a parancssorba. Ügyeljen arra, hogy a jogosultságszintetkészlet autouserként, rendszergazdaként állítsa be, amely lehetővé teszi, hogy az indítási feladatok parancsokat tartalmazzanak a következővelsudo: . - Kattintson az OK gombra.
- Adjon meg egy készletazonosítót. Ez a példa a készletet
Feladat létrehozása
- Hozzon létre egy feladatot a feladatlistán a bal oldali navigációs sáv Feladatok elemének kiválasztásával, majd válassza a keresési űrlap feletti Hozzáadás gombot.
- Adjon meg egy feladatazonosítót. Ez a példa a következőt használja:
ocr-job. - Válassza ki
ocr-poola jelenlegi medencét, vagy a medencéhez választott nevet. - Kattintson az OK gombra.
- Adjon meg egy feladatazonosítót. Ez a példa a következőt használja:
Blobtárolók létrehozása
Itt blobtárolókat hoz létre, amelyek az OCR Batch-feladat bemeneti és kimeneti fájljait tárolják. Ebben a példában a bemeneti tároló neve van elnevezve input , és a rendszer először az OCR nélküli összes dokumentumot feltölti feldolgozásra. A kimeneti tároló neve el van nevezve output , és a Batch-feladat a feldolgozott dokumentumokat OCR-vel írja.
Tárfiókok keresése és kiválasztása az Azure Portalon.
Válassza ki a Batch-fiókhoz társított tárfiókot.
A bal oldali navigációs sávon válassza a Tárolók lehetőséget, és hozzon létre két blobtárolót (egyet a bemeneti fájlokhoz, egyet a kimeneti fájlokhoz) a Blob-tároló létrehozása lépésekkel.
Hozzon létre megosztott hozzáférési aláírást a kimeneti tárolóhoz a kimeneti tároló kiválasztásával, majd a Megosztott hozzáférési jogkivonatok lapon válassza az Írás lehetőséget az Engedélyek legördülő menüben. Nincs szükség más engedélyekre.
Válassza a SAS jogkivonat és URL-cím generálása lehetőséget, majd másolja ki a Blob SAS URL-cím a függvény későbbi használatához.
Azure-függvény létrehozása
Ebben a szakaszban létrehozza az Azure-függvényt, amely aktiválja az OCR Batch-feladatot, amikor egy fájl feltöltésre kerül a bemeneti konténerbe.
A függvény létrehozásához kövesse az Azure Blob Storage által aktivált függvény létrehozása című témakörben leírt lépéseket.
- Futtatókörnyezeti verem esetén válassza a .NET lehetőséget. Ez a példafüggvény a C# használatával használja a Batch .NET SDK előnyeit.
- A Storage lapon használja ugyanazt a tárfiókot, amelyet a Batch-fiókhoz csatolt.
- Válassza a Véleményezés + Létrehozás lehetőséget>.
Az alábbi képernyőkép a Függvényalkalmazás létrehozása lap az Alapok lapon, példaadatok használatával.
A függvényben válassza a Függvények lehetőséget a bal oldali navigációs sávon, és válassza a Létrehozás lehetőséget.
A Függvény létrehozása panelen válassza az Azure Blob Storage-eseményindítót.
Adja meg a függvény nevét az Új függvényben. Ebben a példában a név OcrTrigger. Adja meg az elérési utat úgy, hogy a
input/{name}helyén a Blob-tároló nevét használja bemenetként.Válassza a Create gombot.
A blob által aktivált függvény létrehozása után válassza a Kód + Teszt lehetőséget. Használja a
run.csxésfunction.projelemeket a GitHubból a függvényben.function.projalapértelmezés szerint nem létezik, ezért válassza a Feltöltés gombot a fejlesztési munkaterületre való feltöltéshez.-
run.csxakkor fut, ha új blobot ad hozzá a bemeneti blobtárolóhoz. -
function.projA függvénykód külső kódtárait sorolja fel, például a Batch .NET SDK-t.
-
Módosítsa a változók helyőrző értékeit a
Run()fájlrun.csxfüggvényében úgy, hogy azok tükrözzék a Batch és a tár hitelesítő adatait. A Batch és a tárfiók hitelesítő adatait az Azure Portalon, a Batch és a tárfiók Kulcsok szakaszában találja.
A függvény aktiválása és az eredmények lekérése
Töltsön fel bármelyik vagy az összes beolvasott fájlt a input_files könyvtárból a GitHubon a bemeneti konténerbe.
A függvényt az Azure Portalon tesztelheti a függvény Kód + Teszt oldalán.
- Válassza a Teszt/futtatás lehetőséget a Kód + Teszt lapon.
- Adja meg a bemeneti tároló elérési útját a Bevitel lapon a Törzs lapon.
- Válassza a Futtatás parancsot.
Néhány másodperc elteltével az OCR-t tartalmazó fájl hozzáadódik a kimeneti tárolóhoz. A naplóinformációk az alsó ablakba kerülnek ki. A fájl ezután látható és lekérthető a Storage Explorerben.
A naplóadatokat a Monitor lapon is megtalálhatja:
2019-05-29T19:45:25.846 [Information] Creating job...
2019-05-29T19:45:25.847 [Information] Accessing input container <inputContainer>...
2019-05-29T19:45:25.847 [Information] Adding <fileName> as a resource file...
2019-05-29T19:45:25.848 [Information] Name of output text file: <outputTxtFile>
2019-05-29T19:45:25.848 [Information] Name of output PDF file: <outputPdfFile>
2019-05-29T19:45:26.200 [Information] Adding OCR task <taskID> for <fileName> <size of fileName>...
A kimeneti fájlok helyi gépre való letöltéséhez nyissa meg a tárfiók kimeneti tárolóját. Válassza ki a kívánt fájl további beállításait, majd válassza a Letöltés lehetőséget.
Jótanács
A letöltött fájlok kereshetők, ha pdf-olvasóban vannak megnyitva.
Erőforrások tisztítása
A csomópontkészletért akkor is fizetnie kell, amíg a csomópontok futnak, még akkor is, ha nincsenek ütemezve feladatok. Ha már nincs szüksége a készletre, törölje a következő lépésekkel:
- A Batch-fiók Készletek lapján válassza ki a készlet további beállításait.
- Válassza a Törlés lehetőséget.
Amikor a készletet törli, a csomópontokon lévő összes feladat kimenete is törlődik. A kimeneti fájlok azonban megmaradnak a Storage-fiókban. Ha már nincs rá szükség, törölheti a Batch-fiókot és a tárfiókot is.
Következő lépések
A .NET API-val a Batch számítási feladatainak ütemezésére és feldolgozására vonatkozó további példákért tekintse meg a GitHubon található mintákat.