Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu öğreticide , Azure İşlevleri'nin kullanıldığı bir Batch işini tetiklemeyi öğreneceksiniz. Bu makalede, Azure Depolama blob kapsayıcısına eklenen belgelerin Azure Batch kullanarak optik karakter tanıma (OCR) uyguladığı bir örnek açıklanmaktadır. OCR işlemeyi kolaylaştırmak için bu örnekte blob kapsayıcısına her dosya eklendiğinde Batch OCR işi çalıştıran bir Azure işlevi yapılandırılır. Şunları yapmayı öğreneceksiniz:
- Havuzlar ve işler oluşturmak için Azure portalını kullanın.
- Blob kapsayıcıları ve paylaşılan erişim imzası (SAS) oluşturun.
- Blob ile tetiklenen bir Azure İşlevi oluşturun.
- Giriş dosyalarını Depolama'ya yükleyin.
- Görev yürütmeyi izleyin.
- Çıkış dosyalarını alın.
Önkoşullar
- Etkin aboneliği olan bir Azure hesabı. Ücretsiz hesap oluşturun.
- Bir Azure Batch hesabı ve bağlı bir Azure Depolama hesabı. Hesapları oluşturma ve bağlama hakkında daha fazla bilgi için bkz . Batch hesabı oluşturma.
Azure'da oturum açma
Azure portalınaoturum açın.
Azure portalını kullanarak bir Batch havuzu ve Batch işi oluşturun
Bu bölümde, Azure portalını kullanarak OCR görevlerini çalıştıracak olan Batch havuzunu ve Batch işini oluşturacaksınız.
Havuz oluşturma
Azure kimlik bilgilerinizi kullanarak Azure portalında oturum açın.
Sol taraftaki gezinti bölmesinde Havuzlar'ı ve ardından arama formunun üstündeki Ekle düğmesini seçerek bir havuz oluşturun.
-
Bir Havuz Kimliği girin. Bu örnekte havuzu
ocr-pool
olarak adlandırabilirsiniz. - Yayımcı olarak kurallı seçeneğini belirleyin.
- Teklif olarak 0001-com-ubuntu-server-jammy seçeneğini belirleyin.
- Sku olarak 22_04-lts öğesini seçin.
-
Düğüm Boyutu bölümünde,
Standard_F2s_v2 - 2 vCPUs, 2 GB Memory
ögesini VM boyutu olarak seçin. - Ölçek bölümündeki ModuSabit olarak ayarlayın ve Hedef ayrılmış düğümler için 3 girin.
-
Başlangıç görevi'ni Başlangıç görevietkin olarak ayarlayın ve Komut satırına komutunu
/bin/bash -c "sudo update-locale LC_ALL=C.UTF-8 LANG=C.UTF-8; sudo apt-get update; sudo apt-get -y install ocrmypdf"
girin. Yükseltme düzeyini, başlangıç görevlerininsudo
ile komutlar içermesine izin veren Havuz autouser, Yönetici olarak ayarladığınızdan emin olun. - Tamam'ı seçin.
-
Bir Havuz Kimliği girin. Bu örnekte havuzu
İş oluşturma
- Sol taraftaki gezinti bölmesinde İşler'i seçip arama formunun üstündeki Ekle düğmesini seçerek havuzda bir iş oluşturun.
-
bir İş Kimliği girin. Bu örnekte
ocr-job
kullanılmıştır. -
ocr-pool
için Geçerli havuz veya havuzunuz için seçtiğiniz adı seçin. - Tamam'ı seçin.
-
bir İş Kimliği girin. Bu örnekte
Blob kapsayıcıları oluşturma
Burada, OCR Batch işi için giriş ve çıkış dosyalarınızı depolayan blob kapsayıcıları oluşturursunuz. Bu örnekte, adı input
olan girdi kapsayıcısı, OCR içermeyen tüm belgelerin başlangıçta işlenmek üzere yüklendiği yerdir. Çıkış kapsayıcısının ismi output
'dir ve bu, Batch işinin OCR ile işlenmiş belgeleri yazdığı yerdir.
Azure portalında Depolama hesapları'nı arayın ve seçin.
Batch hesabınıza bağlı depolama hesabınızı seçin.
Sol taraftaki gezinti bölmesinden Kapsayıcılar'ı seçin ve Blob kapsayıcısı oluşturma başlığındaki adımları izleyerek iki blob kapsayıcısı (biri giriş dosyaları, biri çıkış dosyaları için) oluşturun.
Çıkış kapsayıcısını seçerek, kapsayıcınız için paylaşılan erişim imzası oluşturun ve Paylaşılan erişim belirteçleri sayfasında, İzinler açılır listesinden Yaz'ı seçin. Başka izin gerekmez.
SAS belirteci ve URL oluştur'a tıklayın ve daha sonra işleviniz için kullanmak üzere Blob SAS URL'sini kopyalayın.
Azure İşlevi oluşturma
Bu bölümde, giriş kapsayıcınıza her dosya yüklendiğinde OCR Batch işini tetikleyen Azure İşlevi'ni oluşturacaksınız.
İşlev oluşturmak için Azure Blob depolama tarafından tetiklenen işlev oluşturma'daki adımları izleyin.
- Çalışma zamanı yığını için .NET'i seçin. Bu örnek işlev, Batch .NET SDK'sının avantajlarından yararlanmak için C# kullanır.
- Depolama sayfasında, Batch hesabınıza bağladığınız depolama hesabını kullanın.
- Gözden Geçir + Oluştur'u >seçin.
Aşağıdaki ekran görüntüsü, örnek bilgiler kullanılarak Temel Bilgiler sekmesindeki İşlev Uygulaması Oluştur sayfasının ekran görüntüsü.
İşlevinizde sol taraftaki gezinti bölmesinden İşlevler'i ve ardından Oluştur'u seçin.
İşlev oluştur bölmesinde Azure Blob Depolama tetikleyicisi'ni seçin.
Yeni İşlev'de işleviniz için bir ad girin. Bu örnekte adı OcrTrigger'dır. Yolu
input/{name}
olarak girin; burada Blob kapsayıcınızın adını girin.Oluştur'i seçin.
Blob ile tetiklenen işlev oluşturulduktan sonra Kod + Test'i seçin. GitHub'dan alınan
run.csx
vefunction.proj
öğelerini işlevde kullanın.function.proj
varsayılan olarak mevcut değildir, bu nedenle karşıya yükle düğmesini seçerek geliştirme çalışma alanınıza yükleyin.-
run.csx
, giriş blob kapsayıcınıza yeni bir blob eklendiğinde çalıştırılır. -
function.proj
İşlev kodunuzdaki dış kitaplıkları listeler, örneğin Batch .NET SDK'sı.
-
Dosyanın işlevindeki
Run()
run.csx
değişkenlerin yer tutucu değerlerini Batch ve depolama kimlik bilgilerinizi yansıtacak şekilde değiştirin. Batch ve depolama hesabı kimlik bilgilerinizi Azure portalında Batch ve depolama hesabınızın Anahtarlar bölümünde bulabilirsiniz.
İşlevi tetikle ve sonuçları al
Taranan dosyaların herhangi birini veya tümünü GitHub dizininden input_files
giriş kapsayıcınıza yükleyin.
İşlevinizi Azure portalından işlevinizin Kod + Test sayfasında test edebilirsiniz.
- Kod + Test sayfasında Test/çalıştır'ı seçin.
- Girişsekmesindeki Gövde alanına giriş kapsayıcınızın yolunu girin.
- Çalıştır'ı seçin.
Birkaç saniye sonra, OCR uygulanmış olan dosya çıkış kapsayıcısına eklenir. Günlük bilgileri en alttaki pencereye çıktı verir. Dosya daha sonra Depolama Gezgini'ne görünür ve alınabilir.
Alternatif olarak, günlük bilgilerini İzleyici sayfasında bulabilirsiniz:
2019-05-29T19:45:25.846 [Information] Creating job...
2019-05-29T19:45:25.847 [Information] Accessing input container <inputContainer>...
2019-05-29T19:45:25.847 [Information] Adding <fileName> as a resource file...
2019-05-29T19:45:25.848 [Information] Name of output text file: <outputTxtFile>
2019-05-29T19:45:25.848 [Information] Name of output PDF file: <outputPdfFile>
2019-05-29T19:45:26.200 [Information] Adding OCR task <taskID> for <fileName> <size of fileName>...
Çıktı dosyalarını yerel makinenize indirmek için depolama hesabınızdaki çıkış kapsayıcısına gidin. İstediğiniz dosyada daha fazla seçenek belirleyin ve ardından İndir'i seçin.
Tavsiye
İndirilen dosyalar PDF okuyucuda açıldığında aranabilir.
Kaynakları temizleme
Hiçbir iş zamanlanmış olmasa bile, düğümler çalışır durumda olduğunda havuz için ücretlendirilirsiniz. Havuza artık ihtiyacınız kalmadığında aşağıdaki adımları izleyerek havuzu silin:
- Batch hesabınızın Havuzlar sayfasından havuzunuzdaki diğer seçenekleri belirleyin.
- 'ı seçin,'i silin.
Havuzu sildiğinizde düğümler üzerindeki tüm görev çıkışları silinir. Ancak çıkış dosyaları depolama hesabında kalır. Artık gerekli olmadığında Batch hesabını ve depolama hesabını da silebilirsiniz.
Sonraki adımlar
Batch iş yüklerini zamanlamak ve işlemek için .NET API'sini kullanma hakkında daha fazla örnek için GitHub'da örneklere bakın.