Düzenle

Aracılığıyla paylaş


PDF form işlemeyi otomatikleştirme

Azure AI Belge Zekası
Azure AI services
Azure Logic Apps
Azure Functions

Bu makalede, uygun maliyetli ve esnek olmayan form işleme yöntemlerini uygun maliyetli ve esnek otomatik PDF işleme ile değiştirmek için kullanabileceğiniz bir Azure mimarisi açıklanmaktadır.

Mimari

PDF formları işleme mimarisinin diyagramı

Bu mimarinin PowerPoint dosyasını indirin.

İş Akışı

  1. Atanmış bir Outlook e-posta hesabı PDF dosyalarını ek olarak alır. E-postanın gelmesi, e-postayı işlemek için bir mantıksal uygulama tetikler. Mantıksal uygulama, Azure Logic Apps'in özellikleri kullanılarak oluşturulur.
  2. Mantıksal uygulama PDF dosyalarını Azure Data Lake Depolama'daki bir kapsayıcıya yükler.
  3. Pdf dosyalarını el ile veya program aracılığıyla aynı PDF kapsayıcısına da yükleyebilirsiniz.
  4. PDF dosyasının PDF kapsayıcısına gelmesi, PDF dosyasındaki PDF formlarını işlemek için başka bir mantıksal uygulamayı tetikler.
  5. Mantıksal uygulama, PDF dosyasının konumunu işlenmek üzere bir işlev uygulamasına gönderir. İşlev uygulaması, Azure İşlevleri özellikleri kullanılarak oluşturulur.
  6. İşlev uygulaması dosyanın konumunu alır ve şu eylemleri gerçekleştirir:
    1. Dosyanın birden çok sayfası varsa, dosyayı tek sayfaya böler. Her sayfada tek bir bağımsız form bulunur. Bölünmüş dosyalar Data Lake Depolama'daki ikinci bir kapsayıcıya kaydedilir.
    2. Tek sayfalı PDF dosyasının konumunu işlenmek üzere AI Belge Zekası'na göndermek için Bir Azure REST API'si olan HTTPS POST kullanır. Azure AI Belge Zekası işlemeyi tamamladığında, işlev uygulamasına geri bir yanıt gönderir ve bu da bilgileri bir veri yapısına yerleştirir.
    3. Yanıt verilerini içeren bir JSON veri dosyası oluşturur ve dosyayı Data Lake Depolama'da üçüncü bir kapsayıcıya depolar.
  7. Form işleme mantıksal uygulaması, işlenen yanıt verilerini alır.
  8. Form işleme mantıksal uygulaması işlenen verileri Azure Cosmos DB'ye gönderir ve bu da verileri bir veritabanına ve koleksiyonlara kaydeder.
  9. Power BI verileri Azure Cosmos DB'den alır ve içgörüler ile panolar sağlar.
  10. Azure Cosmos DB'deki veriler üzerinde gerektiğinde daha fazla işlem uygulayabilirsiniz.

Bileşenler

  • Azure AI hizmetleri , yaygın iş süreçleri için anahtar teslim yapay zeka hizmetleri sağlamak üzere Azure AI hizmetlerini, göreve özgü yapay zekayı ve iş mantığını kullanan bir Azure yapay zeka ürünleri kategorisidir. Bu ürünlerden biri, belgelerden anahtar-değer çiftlerini, metinleri ve tabloları ayıklamak için makine öğrenmesi modellerini kullanan Azure AI Belge Zekası'dır.
  • Azure Logic Apps , uygulamaları, verileri, hizmetleri ve sistemleri tümleştiren otomatik iş akışları oluşturmaya ve çalıştırmaya yönelik sunucusuz bir bulut hizmetidir.
  • Azure İşlevleri daha az kod yazmanızı, daha az altyapı korumanızı ve maliyetlerden tasarruf etmenizi sağlayan sunucusuz bir çözümdür.
  • Azure Data Lake Depolama, Azure'da kurumsal veri gölleri oluşturmanın temelidir.
  • Azure Cosmos DB , modern uygulama geliştirme için tam olarak yönetilen bir NoSQL ve ilişkisel veritabanıdır.
  • Power BI , ilişkili olmayan veri kaynaklarınızı tutarlı, görsel olarak çevreleyici ve etkileşimli içgörülere dönüştürebilmeniz için birlikte çalışan yazılım hizmetleri, uygulamalar ve bağlayıcılardan oluşan bir koleksiyondur.

Alternatifler

Senaryo ayrıntıları

Form işleme genellikle kritik bir iş işlevidir. Birçok şirket yine de maliyetli, zaman alan ve hataya eğilimli el ile gerçekleştirilen işlemlere güveniyor. El ile gerçekleştirilen işlemlerin değiştirilmesi maliyeti ve riski azaltır ve bir şirketi daha çevik hale getirir.

Bu makalede, el ile PDF formları işlemeyi veya PDF form işlemeyi otomatik hale getiren pahalı eski sistemleri değiştirmek için kullanabileceğiniz bir mimari açıklanmaktadır. Azure AI Belge Zekası PDF formlarını işler, Logic Apps iş akışını sağlar ve İşlevler veri işleme özellikleri sağlar.

Dağıtım bilgileri için bu makaledeki Bu senaryoya dağıtma bölümüne bakın.

Olası kullanım örnekleri

Bu makalede açıklanan çözüm, aşağıdakiler dahil olmak üzere birçok form türünü işleyebilir:

  • Faturalar
  • Ödeme kayıtları
  • Kasa ty kayıtları
  • Olay kayıtları
  • Uyumluluk kayıtları
  • Satınalma siparişleri
  • Ödeme yetkilendirme formları
  • Sistem durumu filtreleme formları
  • Anket formları

Dikkat edilmesi gereken noktalar

Bu önemli noktalar, bir iş yükünün kalitesini artırmak için kullanabileceğiniz bir dizi yol gösteren ilke olan Azure İyi Tasarlanmış Çerçeve'nin yapı taşlarını uygular. Daha fazla bilgi için bkz . Microsoft Azure İyi Tasarlanmış Çerçeve.

Güvenilirlik

Güvenilirlik, uygulamanızın müşterilerinize sağladığınız taahhütleri karşılayabilmesini sağlar. Daha fazla bilgi için bkz . Güvenilirlik sütununa genel bakış.

Güvenilir bir iş yükü hem dayanıklı hem de kullanılabilir bir iş yüküdür. Dayanıklılık , sistemin hatalardan kurtarma ve çalışmaya devam etme yeteneğidir. Dayanıklılığın hedefi, bir hatanın ardından uygulamayı tam çalışır duruma geri döndürmektir. Kullanılabilirlik , kullanıcılarınızın gerektiğinde iş yükünüzle erişip erişemeyeceğinin bir ölçüsüdür.

Bu mimari, bir iş çözümü sağlamak için hızla dağıtabileceğiniz ve prototip oluşturabileceğiniz bir başlangıç mimarisi olarak tasarlanmıştır. Prototipiniz başarılı olursa, gerekirse ek gereksinimleri karşılamak için mimariyi genişletebilir ve geliştirebilirsiniz.

Bu mimari ölçeklenebilir ve dayanıklı Azure altyapısını ve teknolojilerini kullanır. Örneğin Azure Cosmos DB, gereksinimlerinizi karşılayacak şekilde yapılandırabileceğiniz yerleşik yedekliliğe ve genel kapsama sahiptir.

Bu çözümün kullandığı Azure hizmetlerinin kullanılabilirlik garantileri için bkz . Çevrimiçi Hizmetler için hizmet düzeyi sözleşmeleri (SLA'lar).

Güvenlik

Güvenlik, kasıtlı saldırılara ve değerli verilerinizin ve sistemlerinizin kötüye kullanılmasına karşı güvence sağlar. Daha fazla bilgi için bkz . Güvenlik sütununa genel bakış.

Bu mimaride kullanılan Outlook e-posta hesabı, PDF formlarını ek olarak alan ayrılmış bir e-posta hesabıdır. Gönderenleri yalnızca güvenilir taraflarla sınırlamak ve kötü amaçlı aktörlerin e-posta hesabına istenmeyen posta göndermesini önlemek iyi bir uygulamadır.

Bu senaryoyu dağıtma bölümünde açıklanan bu mimarinin uygulanması, güvenliği artırmak için aşağıdaki önlemleri alır:

  • PowerShell ve Bicep dağıtım betikleri, terminal ekranlarında görüntülenmemesi veya dağıtım günlüklerinde depolanmaması için hassas bilgileri depolamak için Azure Key Vault kullanır.
  • Yönetilen kimlikler, uygulamaların Microsoft Entra kimlik doğrulamasını destekleyen kaynaklara bağlandığında kullanması için Microsoft Entra Id'de otomatik olarak yönetilen bir kimlik sağlar. İşlev uygulaması, kodun tek tek sorumlulara bağımlı olmaması ve hassas kimlik bilgileri içermemesi için yönetilen kimlikleri kullanır.

Maliyet iyileştirme

Maliyet iyileştirmesi, gereksiz giderleri azaltmanın ve operasyonel verimlilikleri iyileştirmenin yollarını aramaktır. Daha fazla bilgi için bkz . Maliyet iyileştirme sütununa genel bakış.

Maliyetleri iyileştirmeye yönelik bazı yönergeler şunlardır:

Performans verimliliği

Performans verimliliği, iş yükünüzün kullanıcılar tarafından talep edilen talepleri karşılayacak şekilde verimli bir şekilde ölçeklendirilebilmesidir. Daha fazla bilgi için bkz . Performans verimliliği sütununa genel bakış.

Bu mimari, performans verimliliğini artırmak için kullanabileceğiniz yerleşik ölçeklendirme özelliklerine sahip hizmetleri kullanır. Burada bazı örnekler verilmiştir:

  • Sunucusuz bir altyapıda hem Azure Logic Apps'i hem de Azure İşlevleri barındırabilirsiniz. Daha fazla bilgi için bkz. Azure sunucusuz genel bakış: Azure Logic Apps ve Azure İşlevleri ile bulut tabanlı uygulamalar ve çözümler oluşturma.
  • Azure Cosmos DB'yi aktarım hızını otomatik olarak ölçeklendirecek şekilde yapılandırabilirsiniz. Daha fazla bilgi için bkz . NoSQL için Azure Cosmos DB - API'de bir veritabanı veya kapsayıcıda otomatik ölçeklendirme aktarım hızı sağlama.

Bu senaryoyu dağıtın

Bu mimarinin temel bir sürümünü, çözüm hızlandırıcısını dağıtabilir ve kendi çözümünüzü dağıtmak için başlangıç noktası olarak kullanabilirsiniz. Hızlandırıcı için başvuru uygulaması kod, dağıtım betikleri ve dağıtım kılavuzu içerir.

Hızlandırıcı PDF formlarını alır, veri alanlarını ayıklar ve verileri Azure Cosmos DB'ye kaydeder. Power BI verileri görselleştirir. Tasarımda modüler, meta veri temelli bir metodoloji kullanılır. Sabit kodlanmış form alanı yok. Herhangi bir PDF formlarını işleyebilir.

Güvenlik formları, faturalar, olay kayıtları ve diğerleri gibi tek sayfalı PDF formlarını işlemek ve görselleştirmek için kod değişikliği yapmadan hızlandırıcıyı olduğu gibi kullanabilirsiniz. Bunu kullanmak için yalnızca örnek PDF formları toplamanız, formların düzenini öğrenmek için yeni bir model eğitmek ve modeli çözüme takmanız gerekir. Ayrıca, istediğiniz içgörüleri sağlaması için veri kümeleriniz için Power BI raporunu yeniden tasarlamanız gerekir.

Uygulama, özel modeller oluşturmak için Azure AI Document Intelligence Studio'yu kullanır. Hızlandırıcı, diğer formları işlemek için bir başvuru olarak makine öğrenmesi modeline kaydedilen alan adlarını kullanır. Özel olarak oluşturulmuş makine öğrenmesi modeli oluşturmak için yalnızca beş örnek form gerekir. Çeşitli formları işleyebilen bir bileşik makine öğrenmesi modeli oluşturmak için en fazla 100 özel olarak oluşturulmuş modeli birleştirebilirsiniz.

Dağıtım deposu

Çözüm hızlandırıcısının GitHub deposu, bu çözüm için dağıtım kılavuzunu içeren Azure PDF Form İşleme Otomasyonu Çözüm Hızlandırıcısı'ndadır.

Dağıtım önkoşulları

Dağıtmak için bir Azure aboneliğine ihtiyacınız vardır. Ücretsiz abonelikler hakkında bilgi için bkz . Ücretsiz Azure hesabıyla bulutta derleme.

Hızlandırıcıda kullanılan hizmetler hakkında bilgi edinmek için, aşağıda listelenen genel bakış ve başvuru makalelerine bakın:

Dağıtma konuları

Yeni bir PDF formu türünü işlemek için örnek PDF dosyalarını kullanarak yeni bir makine öğrenmesi modeli oluşturursunuz. Model hazır olduğunda model kimliğini çözüme takın.

Bu kapsayıcı adı, GitHub deposundan edindiğiniz dağıtım betiklerinde yapılandırılabilir.

Mimari, yüksek kullanılabilirlik (HA) veya olağanüstü durum kurtarma (DR) gereksinimlerini karşılamaz. Üretim dağıtımı için geçerli mimariyi genişletmek ve geliştirmek istiyorsanız aşağıdaki önerileri ve en iyi yöntemleri göz önünde bulundurun:

  • GEREKSINIMLERInize göre HA/DR mimarisini tasarlayın ve uygun olduğunda yerleşik yedeklilik özelliklerini kullanın.
  • İşleme birimlerinizi işleyebilen bir bilgi işlem ortamı oluşturmak için Bicep dağıtım kodunu güncelleştirin.
  • HA/DR gereksinimlerinizi karşılamak üzere mimari bileşenlerinin daha fazla örneğini oluşturmak için Bicep dağıtım kodunu güncelleştirin.
  • Depolama tasarlayıp sağlarken Azure Depolama yedekliliği yönergelerini izleyin.
  • Mantıksal uygulamaları tasarlayıp sağlarken İş sürekliliği ve olağanüstü durum kurtarma yönergelerini izleyin.
  • İşlev uygulamasını tasarlayıp sağlarken Azure İşlevleri'da Güvenilirlik yönergelerini izleyin.
  • Azure Cosmos DB kullanılarak oluşturulmuş bir veritabanı tasarlarken ve sağlarken Azure Cosmos DB ile yüksek kullanılabilirlik elde edin'deki yönergeleri izleyin.
  • Büyük hacimli PDF formlarını işlemek için bu sistemi üretime almayı düşünüyorsanız, dağıtım betiklerini değiştirerek daha fazla kaynağı olan bir Linux konağı oluşturabilirsiniz. Bunu yapmak için deploy-functionsapp.bicep içindeki kodu değiştirin

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.

Asıl yazar:

Diğer katkıda bulunanlar:

Nonpublic LinkedIn profillerini görmek için LinkedIn'de oturum açın.

Sonraki adımlar