Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
V tomto kurzu se dozvíte, jak aktivovat úlohu Batch pomocí Azure Functions. Tento článek vás provede příkladem, který přebírá dokumenty přidané do kontejneru objektů blob služby Azure Storage, používá optické rozpoznávání znaků (OCR) pomocí služby Azure Batch. Pro zjednodušení zpracování OCR tento příklad nakonfiguruje funkci Azure, která spouští úlohu Batch OCR při každém přidání souboru do kontejneru objektů blob. Naučíte se:
- Pomocí portálu Azure můžete vytvářet fondy a úlohy.
- Vytvořte kontejnery objektů blob a sdílený přístupový podpis (SAS).
- Vytvořte funkci Azure aktivovanou objektem blob.
- Nahrajte vstupní soubory do úložiště.
- Monitorování provádění úkolů
- Načtěte výstupní soubory.
Požadavky
- Účet Azure s aktivním předplatným. Vytvoření účtu zdarma
- Účet Azure Batch a propojený účet Azure Storage. Další informace o vytváření a propojení účtů najdete v tématu Vytvoření účtu Batch.
Přihlášení k Azure
Přihlaste se do Azure Portalu.
Vytvoření fondu Batch a úlohy Batch pomocí Azure portálu
V této části pomocí webu Azure Portal vytvoříte fond Batch a úlohu Batch, která spouští úlohy OCR.
Vytvořit bazén
Přihlaste se k webu Azure Portal pomocí svých přihlašovacích údajů Azure.
Fond vytvoříte tak, že v levém navigačním panelu vyberete Fondy a pak vyberete tlačítko Přidat nad vyhledávacím formulářem.
- Zadejte ID fondu. Tento příklad pojmenuje pool
ocr-pool. - Vyberte kanonický jako Vydavatel.
- Jako nabídku vyberte 0001-com-ubuntu-server-jammy.
- Jako SKU vyberte 22_04-lts.
- V části
Standard_F2s_v2 - 2 vCPUs, 2 GB Memoryzvolte velikost VM. - Nastavte režim v oddílu Škálování na pevné a zadejte 3 pro cílové vyhrazené uzly.
- Nastavte spouštěcí úkol na Povoleno spouštěcí úkol a zadejte příkaz
/bin/bash -c "sudo update-locale LC_ALL=C.UTF-8 LANG=C.UTF-8; sudo apt-get update; sudo apt-get -y install ocrmypdf"do příkazového řádku. Nezapomeňte nastavit úroveň oprávnění jako uživatel fondu, správce, což umožňuje startovním úkolům obsahovat příkazy ssudo. - Vyberte OK.
- Zadejte ID fondu. Tento příklad pojmenuje pool
Vytvořit pracovní pozici
- Vytvořte úlohu ve fondu tak, že v levém navigačním panelu vyberete Úlohy a pak vyberete tlačítko Přidat nad vyhledávacím formulářem.
- Zadejte ID úlohy. Tento příklad používá
ocr-job. - Vyberte
ocr-poolpro Current pool nebo pro jakýkoli jiný název, který jste pro svůj fond zvolili. - Vyberte OK.
- Zadejte ID úlohy. Tento příklad používá
Vytvoření kontejnerů Blob
Tady vytvoříte kontejnery objektů blob, které ukládají vstupní a výstupní soubory pro úlohu OCR Batch. V tomto příkladu je vstupní kontejner pojmenován input a je tam, kde se všechny dokumenty bez OCR nahrají ke zpracování. Výstupní kontejner je pojmenovaný output a je místem, kde úloha Batch zapisuje zpracovávané dokumenty pomocí OCR.
Na webu Azure Portal vyhledejte a vyberte Účty úložiště .
Zvolte účet úložiště propojený s vaším účtem Batch.
V levém navigačním panelu vyberte Kontejnery a vytvořte dva kontejnery objektů blob (jeden pro vstupní soubory, jeden pro výstupní soubory) podle kroků v části Vytvoření kontejneru objektů blob.
Vytvořte sdílený přístupový podpis pro výstupní kontejner tím, že vyberete výstupní kontejner, a na stránce Sdílené přístupové tokeny v rozevíracím seznamu Oprávnění vyberte zapisovat. Žádná další oprávnění nejsou nutná.
Vyberte Vygenerovat token SAS a adresu URL a zkopírujte adresu URL SAS objektu blob , která se použije později pro vaši funkci.
Vytvoření funkce Azure Functions
V této části vytvoříte funkci Azure Functions, která aktivuje úlohu služby OCR Batch při každém nahrání souboru do vstupního kontejneru.
Postupujte podle kroků v tématu Vytvoření funkce aktivované službou Azure Blob Storage a vytvořte funkci.
- Pro runtime stack zvolte .NET. Tato ukázková funkce používá jazyk C# k využití sady Batch .NET SDK.
- Na stránce Úložiště použijte stejný účet úložiště, který jste propojili se svým účtem Batch.
- Vyberte Zkontrolovat a vytvořit> Vytvořit.
Následující snímek obrazovky zobrazuje stránku Vytvořit funkční aplikaci na kartě Základy, za použití ukázkových informací.
Ve funkci vyberte Funkce z levého navigačního panelu a vyberte Vytvořit.
V podokně Vytvořit funkci vyberte trigger služby Azure Blob Storage.
Do nové funkce zadejte název funkce. V tomto příkladu je název OcrTrigger. Zadejte cestu jako
input/{name}, kde jako „vstup“ použijte název vašeho kontejneru typu Blob.Vyberte Vytvořit.
Po vytvoření funkce aktivované objektem blob vyberte Kód + Test. Použijte
run.csxafunction.projz GitHubu ve funkci.function.projve výchozím nastavení neexistuje, takže výběrem tlačítka Nahrát ho nahrajte do vývojového pracovního prostoru.-
run.csxse spustí, když se do vstupního kontejneru objektů blob přidá nový objekt blob. -
function.projzobrazí seznam externích knihoven v kódu funkce, například batch .NET SDK.
-
Změňte zástupné hodnoty proměnných ve
Run()funkcirun.csxsouboru tak, aby odrážely přihlašovací údaje služby Batch a úložiště. Přihlašovací údaje účtu Batch a úložiště najdete na webu Azure Portal v části Klíče účtu Batch a úložiště.
Aktivace funkce a načtení výsledků
Nahrajte všechny naskenované soubory z adresáře na GitHubu do vstupního input_files kontejneru.
Funkci můžete otestovat na webu Azure Portal na stránce Code + Test funkce.
- Na stránce Kód + test vyberte Test/spustit.
- Zadejte cestu ke vstupnímu kontejneru v části Text na kartě Vstup .
- Vyberte Spustit.
Po několika sekundách se soubor s použitým OCR přidá do výstupního kontejneru. Záznamové informace se zobrazí v dolním okně. Soubor je pak viditelný a dostupný ve Storage Exploreru.
Další možností je najít informace protokolu na stránce Monitorování :
2019-05-29T19:45:25.846 [Information] Creating job...
2019-05-29T19:45:25.847 [Information] Accessing input container <inputContainer>...
2019-05-29T19:45:25.847 [Information] Adding <fileName> as a resource file...
2019-05-29T19:45:25.848 [Information] Name of output text file: <outputTxtFile>
2019-05-29T19:45:25.848 [Information] Name of output PDF file: <outputPdfFile>
2019-05-29T19:45:26.200 [Information] Adding OCR task <taskID> for <fileName> <size of fileName>...
Pokud chcete stáhnout výstupní soubory do místního počítače, přejděte do výstupního kontejneru v účtu úložiště. Vyberte další možnosti požadovaného souboru a pak vyberte Stáhnout.
Návod
Stažené soubory se dají prohledávat, pokud jsou otevřeny ve čtečce PDF.
Upravte zdroje
Během běhu uzlů se vám budou účtovat poplatky za fond, a to i v případě, že nejsou naplánované žádné úlohy. Pokud už bazén nepotřebujete, odstraňte jej následujícím postupem:
- Na stránce Fondy vašeho účtu Batch vyberte další možnosti ve fondu.
- Vyberte Odstranit.
Při odstranění fondu se odstraní všechny výstupy úkolů na uzlech. Výstupní soubory ale zůstanou v účtu úložiště. Pokud už ho nepotřebujete, můžete také odstranit účet Batch a účet úložiště.
Další kroky
Další příklady použití rozhraní .NET API k plánování a zpracování úloh Batch najdete v ukázkách na GitHubu.