Aracılığıyla paylaş


PDF form işlemeyi otomatikleştirme

Azure Yapay Zeka Akıllı Belge
Azure Yapay Zeka Hizmetleri
Azure Logic Apps
Azure İşlevleri

Bu makalede, uygun maliyetli ve esnek olmayan form işleme yöntemlerini uygun maliyetli ve esnek otomatik PDF işleme ile değiştirmek için kullanabileceğiniz bir Azure mimarisi açıklanmaktadır.

Mimari

PDF formları işleme mimarisinin diyagramı

Bu mimarinin PowerPoint dosyasını indirin.

İş Akışı

  1. Atanmış bir Outlook e-posta hesabı PDF dosyalarını ek olarak alır. E-postanın gelmesi, e-postayı işlemek için bir mantıksal uygulama tetikler. Mantıksal uygulama, Azure Logic Apps'in özellikleri kullanılarak oluşturulur.
  2. Mantıksal uygulama, PDF dosyalarını Azure Data Lake Storage'daki bir kapsayıcıya yükler.
  3. Pdf dosyalarını el ile veya program aracılığıyla aynı PDF kapsayıcısına da yükleyebilirsiniz.
  4. PDF dosyasının PDF kapsayıcısına gelmesi, PDF dosyasındaki PDF formlarını işlemek için başka bir mantıksal uygulamayı tetikler.
  5. Mantıksal uygulama, PDF dosyasının konumunu işlenmek üzere bir işlev uygulamasına gönderir. İşlev uygulaması, Azure İşlevleri özellikleri kullanılarak oluşturulur.
  6. İşlev uygulaması dosyanın konumunu alır ve şu eylemleri gerçekleştirir:
    1. Dosyanın birden çok sayfası varsa, dosyayı tek sayfaya böler. Her sayfada tek bir bağımsız form bulunur. Bölünmüş dosyalar Data Lake Storage'daki ikinci bir kapsayıcıya kaydedilir.
    2. Tek sayfalı PDF dosyasının konumunu işlenmek üzere AI Belge Zekası'na göndermek için Bir Azure REST API'si olan HTTPS POST kullanır. Azure AI Belge Zekası işlemeyi tamamladığında, işlev uygulamasına geri bir yanıt gönderir ve bu da bilgileri bir veri yapısına yerleştirir.
    3. Yanıt verilerini içeren bir JSON veri dosyası oluşturur ve dosyayı Data Lake Storage'da üçüncü bir kapsayıcıya depolar.
  7. Form işleme mantıksal uygulaması, işlenen yanıt verilerini alır.
  8. Form işleme mantıksal uygulaması işlenen verileri Azure Cosmos DB'ye gönderir ve bu da verileri bir veritabanına ve koleksiyonlara kaydeder.
  9. Power BI verileri Azure Cosmos DB'den alır ve içgörüler ile panolar sağlar.
  10. Azure Cosmos DB'deki veriler üzerinde gerektiğinde daha fazla işlem uygulayabilirsiniz.

Bileşenler

  • Azure AI Document Intelligence, akıllı belge işleme çözümleri oluşturmanıza olanak tanıyan bulut tabanlı bir hizmettir. Belgelerden metinleri, anahtar-değer çiftlerini, tabloları ve yapıları otomatik ve doğru bir şekilde ayıklamak için gelişmiş makine öğrenmesi uygular. Bu mimaride, PDF belgelerinden bilgi ayıklamak için kullanılan akıllı belge işleme hizmetidir.
  • Azure Logic Apps , uygulamaları, verileri, hizmetleri ve sistemleri tümleştiren otomatik iş akışları oluşturmaya ve çalıştırmaya yönelik sunucusuz bir bulut hizmetidir. Bu mimaride kullanıcı girişini, belge depolamayı, belge işlemeyi, sonuçların depolanmasını ve işlenen belgelerin analizini koordine etmek için bir düzenleyici olarak kullanılır.
  • Azure İşlevleri daha az kod yazmanızı, daha az altyapı korumanızı ve maliyetlerden tasarruf etmenizi sağlayan sunucusuz bir çözümdür. Bu mimaride, Azure AI Document Intelligencekullanmak ve çıkışı depolamak için girişi yapılandıran arka uç hizmetleridir.
  • Azure Data Lake Storage , Azure'da kurumsal veri gölleri oluşturmanın temelidir. Bu mimaride ham PDF belgelerini, makine öğrenmesi sonuçlarını ve işlenmiş çıkışı depolamak için kullanılır.
  • Azure Cosmos DB , modern uygulama geliştirme için tam olarak yönetilen bir NoSQL ve ilişkisel veritabanıdır. Bu mimaride, her PDF belgesinden ayıklanan içgörüleri depolamak için kullanılır. Bilgiler Power BI tarafından içgörüler oluşturmak için kullanılır.
  • Power BI , ilişkili olmayan veri kaynaklarınızı tutarlı, görsel olarak çevreleyici ve etkileşimli içgörülere dönüştürebilmeniz için birlikte çalışan yazılım hizmetleri, uygulamalar ve bağlayıcılardan oluşan bir koleksiyondur. Bu mimaride, belge işleme sonuçlarını analiz etmek için kullanılır.

Alternatifler

  • Power BIkullanmak yerine Microsoft Fabric kullanarak işlenen çıkışı bir Lakehouse'a alabilir ve ardından çıkış verilerinin daha fazla analiz ve işlemesini gerçekleştirebilirsiniz.

Senaryo ayrıntıları

Form işleme genellikle kritik bir iş işlevidir. Birçok şirket yine de maliyetli, zaman alan ve hataya eğilimli el ile gerçekleştirilen işlemlere güveniyor. El ile gerçekleştirilen işlemlerin değiştirilmesi maliyeti ve riski azaltır ve bir şirketi daha çevik hale getirir.

Bu makalede, el ile PDF formları işlemeyi veya PDF form işlemeyi otomatik hale getiren pahalı eski sistemleri değiştirmek için kullanabileceğiniz bir mimari açıklanmaktadır. Azure AI Belge Zekası PDF formlarını işler, Logic Apps iş akışını sağlar ve İşlevler veri işleme özellikleri sağlar.

Dağıtım bilgileri için bu makaledeki Bu senaryoya dağıtma bölümüne bakın.

Olası kullanım örnekleri

Bu makalede açıklanan çözüm, aşağıdakiler dahil olmak üzere birçok form türünü işleyebilir:

  • Faturalar ve ödeme kayıtları
  • Satınalma siparişleri
  • Güvenlik, olay ve uyumluluk kayıtları
  • Sistem durumu filtreleme formları
  • Müşteri geri bildirim formları
  • Çalışan kayıtları
  • Akademik ve araştırma makaleleri
  • El yazısı notlar içeren belgeler
  • Etki alanınızdan özel belgeler

Dikkat edilmesi gereken noktalar

Bu önemli noktalar, bir iş yükünün kalitesini artırmak için kullanabileceğiniz bir dizi yol gösteren ilke olan Azure İyi Tasarlanmış Çerçeve'nin yapı taşlarını uygular. Daha fazla bilgi için bkz . Microsoft Azure İyi Tasarlanmış Çerçeve.

Güvenilirlik

Güvenilirlik, uygulamanızın müşterilerinize sağladığınız taahhütleri karşılayabilmesini sağlar. Daha fazla bilgi için bkz . Güvenilirlik için tasarım gözden geçirme denetim listesi.

Güvenilir bir iş yükü hem dayanıklı hem de kullanılabilir bir iş yüküdür. Dayanıklılık , sistemin hatalardan kurtarma ve çalışmaya devam etme yeteneğidir. Dayanıklılığın hedefi, bir hatanın ardından uygulamayı tam çalışır duruma geri döndürmektir. Kullanılabilirlik , kullanıcılarınızın gerektiğinde iş yükünüzle erişip erişemeyeceğinin bir ölçüsüdür.

Bu mimari, bir iş çözümü sağlamak için hızla dağıtabileceğiniz ve prototip oluşturabileceğiniz bir başlangıç mimarisi olarak tasarlanmıştır. Prototipiniz başarılı olursa, gerekirse ek gereksinimleri karşılamak için mimariyi genişletebilir ve geliştirebilirsiniz.

Bu mimari ölçeklenebilir ve dayanıklı Azure altyapısını ve teknolojilerini kullanır. Örneğin Azure Cosmos DB, gereksinimlerinizi karşılayacak şekilde yapılandırabileceğiniz yerleşik yedekliliğe ve genel kapsama sahiptir.

Bu çözümün kullandığı Azure hizmetlerinin kullanılabilirlik garantileri için bkz . Çevrimiçi Hizmetler için hizmet düzeyi sözleşmeleri (SLA'lar).

Güvenlik

Güvenlik, kasıtlı saldırılara ve değerli verilerinizin ve sistemlerinizin kötüye kullanılmasına karşı güvence sağlar. Daha fazla bilgi için bkz . Güvenlik için tasarım gözden geçirme denetim listesi.

Bu mimaride kullanılan Outlook e-posta hesabı, PDF formlarını ek olarak alan ayrılmış bir e-posta hesabıdır. Gönderenleri yalnızca güvenilir taraflarla sınırlamak ve kötü amaçlı aktörlerin e-posta hesabına istenmeyen posta göndermesini önlemek iyi bir uygulamadır.

Bu senaryoyu dağıtma bölümünde açıklanan bu mimarinin uygulanması, güvenliği artırmak için aşağıdaki önlemleri alır:

  • PowerShell ve Bicep dağıtım betikleri, terminal ekranlarında görüntülenmemesi veya dağıtım günlüklerinde depolanmaması için hassas bilgileri depolamak için Azure Key Vault kullanır.
  • Yönetilen kimlikler, uygulamaların Microsoft Entra kimlik doğrulamasını destekleyen kaynaklara bağlandığında kullanması için Microsoft Entra Id'de otomatik olarak yönetilen bir kimlik sağlar. İşlev uygulaması, kodun tek tek sorumlulara bağımlı olmaması ve hassas kimlik bilgileri içermemesi için yönetilen kimlikleri kullanır.

Maliyet İyileştirmesi

Maliyet İyileştirme, gereksiz giderleri azaltmanın ve operasyonel verimlilikleri iyileştirmenin yollarını gözden geçmektir. Daha fazla bilgi için bkz . Maliyet İyileştirme için tasarım gözden geçirme denetim listesi.

Maliyetleri iyileştirmeye yönelik bazı yönergeler şunlardır:

Performans Verimliliği

Performans Verimliliği, iş yükünüzün kullanıcılar tarafından talep edilen talepleri karşılayacak şekilde verimli bir şekilde ölçeklendirilebilmesidir. Daha fazla bilgi için bkz . Performans Verimliliği için tasarım gözden geçirme denetim listesi.

Bu mimari, performans verimliliğini artırmak için kullanabileceğiniz yerleşik ölçeklendirme özelliklerine sahip hizmetleri kullanır. Burada bazı örnekler verilmiştir:

  • Sunucusuz bir altyapıda hem Azure Logic Apps'i hem de Azure İşlevleri barındırabilirsiniz. Daha fazla bilgi için bkz. Azure sunucusuz genel bakış: Azure Logic Apps ve Azure İşlevleri ile bulut tabanlı uygulamalar ve çözümler oluşturma.
  • Azure Cosmos DB'yi aktarım hızını otomatik olarak ölçeklendirecek şekilde yapılandırabilirsiniz. Daha fazla bilgi için bkz . NoSQL için Azure Cosmos DB - API'de bir veritabanı veya kapsayıcıda otomatik ölçeklendirme aktarım hızı sağlama.

Bu senaryoyu dağıtın

Bu mimarinin temel bir sürümünü dağıtabilir ve kendi çözümünüzü dağıtmak için başlangıç noktası olarak kullanabilirsiniz. Depoda kod, dağıtım betikleri ve dağıtım kılavuzu bulunur.

Örnek PDF formlarını alır, veri alanlarını ayıklar ve verileri Azure Cosmos DB'ye kaydeder. Power BI verileri görselleştirir. Tasarımda modüler, meta veri temelli bir metodoloji kullanılır. Sabit kodlanmış form alanı yok. Herhangi bir PDF formlarını işleyebilir.

Güvenlik formları, faturalar, olay kayıtları ve diğerleri gibi tek sayfalı PDF formlarını işlemek ve görselleştirmek için depoyu olduğu gibi kod değişikliği yapmadan kullanabilirsiniz. Bunu kullanmak için yalnızca örnek PDF formları toplamanız, formların düzenini öğrenmek için yeni bir model eğitmek ve modeli çözüme takmanız gerekir. Ayrıca, istediğiniz içgörüleri sağlaması için veri kümeleriniz için Power BI raporunu yeniden tasarlamanız gerekir.

Uygulama, özel modeller oluşturmak için Azure AI Document Intelligence Studio'yu kullanır. Örnek, diğer formları işlemek için bir başvuru olarak makine öğrenmesi modeline kaydedilen alan adlarını kullanır. Özel olarak oluşturulmuş makine öğrenmesi modeli oluşturmak için yalnızca beş örnek form gerekir. Çeşitli formları işleyebilen bir bileşik makine öğrenmesi modeli oluşturmak için en fazla 100 özel olarak oluşturulmuş modeli birleştirebilirsiniz.

Dağıtım deposu

Bu örneğin kodu Azure PDF Form İşleme Otomasyonu Çözümü GitHub deposundadır. Depodaki dağıtım kılavuzunu izleyin.

Dağıtma konuları

Yeni bir PDF formu türünü işlemek için örnek PDF dosyalarını kullanarak yeni bir makine öğrenmesi modeli oluşturursunuz. Model hazır olduğunda model kimliğini çözüme takın.

Bu kapsayıcı adı, GitHub deposundan edindiğiniz dağıtım betiklerinde yapılandırılabilir.

Mimari, yüksek kullanılabilirlik (HA) veya olağanüstü durum kurtarma (DR) gereksinimlerini karşılamaz. Üretim dağıtımı için geçerli mimariyi genişletmek ve geliştirmek istiyorsanız aşağıdaki önerileri ve en iyi yöntemleri göz önünde bulundurun:

  • GEREKSINIMLERInize göre HA/DR mimarisini tasarlayın ve uygun olduğunda yerleşik yedeklilik özelliklerini kullanın.
  • İşleme birimlerinizi işleyebilen bir bilgi işlem ortamı oluşturmak için Bicep dağıtım kodunu güncelleştirin.
  • HA/DR gereksinimlerinizi karşılamak üzere mimari bileşenlerinin daha fazla örneğini oluşturmak için Bicep dağıtım kodunu güncelleştirin.
  • Depolama tasarlayıp sağlarken Azure Depolama yedekliliği yönergelerini izleyin.
  • Mantıksal uygulamaları tasarlayıp sağlarken İş sürekliliği ve olağanüstü durum kurtarma yönergelerini izleyin.
  • İşlev uygulamasını tasarlayıp sağlarken Azure İşlevleri'da Güvenilirlik yönergelerini izleyin.
  • Azure Cosmos DB kullanılarak oluşturulmuş bir veritabanı tasarlarken ve sağlarken Azure Cosmos DB ile yüksek kullanılabilirlik elde edin'deki yönergeleri izleyin.
  • Büyük hacimli PDF formlarını işlemek için bu sistemi üretime almayı düşünüyorsanız, dağıtım betiklerini değiştirerek daha fazla kaynağı olan bir Linux konağı oluşturabilirsiniz. Bunu yapmak için deploy-functionsapp.bicep içindeki kodu değiştirin

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.

Asıl yazar:

Diğer katkıda bulunanlar:

Nonpublic LinkedIn profillerini görmek için LinkedIn'de oturum açın.

Sonraki adımlar