Düzenle

Aracılığıyla paylaş


Azure'da özel belge işleme modelleri

Azure AI Belge Zekası
Azure AI services
Azure Logic Apps
Azure Machine Learning Studio
Azure Storage

Bu makalede özel belge işleme modellerini oluşturmaya, eğitip dağıtmaya ve kullanmaya yönelik Azure çözümleri açıklanmaktadır. Bu Azure hizmetleri, metin işleme için etiketleme veya etiketleme yapmak için kullanıcı arabirimi (UI) özellikleri de sunar.

Mimari

Özel belge işleme modeli derleme ve dağıtım işlemi için çeşitli alternatifleri gösteren mimari diyagramı.

Bu mimarinin bir Visio dosyasını indirin.

Veri akışı

  1. Azure Logic Apps, Azure Data Factory gibi düzenleyiciler veya Azure İşlevleri e-posta sunucularından iletileri ve ekleri ve FTP sunucularından veya web uygulamalarından dosyaları alır.

    • Azure İşlevleri ve Logic Apps sunucusuz iş yüklerini etkinleştirir. Seçtiğiniz hizmet geliştirme, bağlayıcılar, yönetim ve yürütme bağlamı gibi hizmet özelliklerine yönelik tercihinize bağlıdır. Daha fazla bilgi için bkz. Azure İşlevleri ve Azure Logic Apps'i karşılaştırma.

    • Toplu veri taşıma için Azure Data Factory kullanmayı göz önünde bulundurun.

  2. Düzenleyiciler alınan verileri Azure Blob Depolama veya Data Lake Storage'a gönderir ve verileri dosya uzantıları veya müşteriler gibi özelliklere göre veri depoları arasında düzenler.

  3. Belge Intelligence Studio, Language Studio veya Azure Machine Learning stüdyosu metin verilerini etiketleyip etiketleyip özel modeller oluşturun. Bu üç hizmeti bağımsız olarak veya farklı kullanım örneklerini ele almak için çeşitli birleşimlerde kullanabilirsiniz.

    • Belge anahtar-değer çiftlerinin ayıklanması veya görüntü biçiminden veya PDF'den özel tablo oluşturulmasını gerektiriyorsa, verileri etiketlemek ve özel modeli eğitmek için Document Intelligence Studio'yu kullanın. Benzer şekilde, doğru ayıklama modelini çağırmadan önce belge türünü tanımlama gereksinimi varsa belgeleri etiketlemek için Document Intelligent Studio'yu kullanın.

    • İçeriği temel alan belge sınıflandırması veya etki alanına özgü varlık ayıklama için, Language Studio'da özel bir metin sınıflandırması veya Adlandırılmış Varlık Tanıma (NER) modeli eğitebilirsiniz.

    • Azure Machine Learning (AML) studio, PyTorch veya TensorFlow gibi açık kaynak çerçevelerle metin sınıflandırması veya varlık ayıklama için etiketleme de yapabilir. AML studio ayrıca metin sınıflandırması, soru yanıtlama, özetleme vb. gibi vaious görevler için ince ayar özelliklerine sahip Temel Model modellerinin Model Kataloğu'nu da sunar. aml studio kullanıcı arabirimi kullanılarak veya kod aracılığıyla ince ayarlama elde edilebilir.

  4. Özel modelleri dağıtmak ve çıkarım için kullanmak için:

Bileşenler

  • Logic Apps, Azure Integration Services'ın bir parçasıdır. Logic Apps uygulamaları, verileri, hizmetleri ve sistemleri tümleştiren otomatik iş akışları oluşturur. Azure Depolama ve Microsoft 365 gibi hizmetler için yönetilen bağlayıcılarla, depolama hesabına bir dosya geldiğinde veya e-posta alındığında iş akışlarını tetikleyebilirsiniz.

  • Data Factory , veri tümleştirme ve dönüştürme için yönetilen bir bulut ayıklama, dönüştürme, yükleme (ETL) hizmetidir. Data Factory, bir REST uç noktasını çağırmayı veya alınan verilerde not defterini çalıştırmayı içeren bir işlem hattına dönüştürme etkinlikleri ekleyebilir.

  • Azure İşlevleri, kısa süreli işlemlere sahip olay odaklı iş yüklerini barındırabilen sunucusuz bir işlem hizmetidir.

  • Blob Depolama , bu senaryoda ham dosyalar için nesne depolama çözümüdür. Blob Depolama .NET, Node.js ve Python gibi birden çok dil için kitaplıkları destekler. Uygulamalar Blob Depolama'da dosyalara HTTP/HTTPS aracılığıyla erişebilir. Blob Depolama, büyük miktarda veriyi depolamaya yönelik maliyet iyileştirmesini desteklemek için sık erişimli, seyrek erişimli ve arşiv erişim katmanlarına sahiptir.

  • Data Lake Storage, büyük veri analizi için Azure Blob Depolama üzerine oluşturulmuş bir özellik kümesidir. Data Lake Storage, Blob Depolama'nın maliyet verimliliğini korur ve hiyerarşik ad alanına sahip dosya düzeyi güvenlik ve dosya sistemi semantiği gibi özellikler sağlar.

  • Azure Uygulaması yapay zeka hizmetlerinin bir parçası olan Azure AI Belge Zekası, yazdırılan ve el yazısı metinleri, tabloları ve anahtar-değer çiftlerini ayıklamak için yerleşik belge analizi özelliklerine sahiptir. Belge Yönetim Bilgileri faturalardan, belgelerden, makbuzlardan, kimlik kartlarından ve kartvizitlerden veri ayıklamak için önceden oluşturulmuş modeller içerir. Belge Zekası ayrıca özel bir şablon form modeli veya özel bir sinir belgesi modeli kullanarak özel modelleri eğitebilir ve dağıtabilir.

Document Intelligence Studio , Belge Zekası özelliklerini ve modellerini keşfetmek ve özel modeller oluşturmak, etiketlemek, eğitmek ve dağıtmak için bir kullanıcı arabirimi sağlar.

Alternatifler

Belirli kullanım örneklerine göre bu senaryoya daha fazla iş akışı ekleyebilirsiniz.

  • Belge görüntü veya PDF biçimindeyse Azure Görüntü İşleme, okuma API'si Form Tanıma veya açık kaynak kitaplıkları kullanarak verileri ayıklayabilirsiniz.

  • Azure AI Dili'nde önceden oluşturulmuş modeli kullanarak belge ve konuşma özetlemesi yapabilirsiniz.

  • Belge işleme gereksinimlerine göre ayıklanan verilerde temizleme, sözcükleri kaldırmayı durdurma, lemmatizasyon, kök oluşturma ve metin özetlemesi gibi metin işleme adımlarını gerçekleştirmek için ön işleme kodunu kullanın. Kodu otomasyon için REST API'leri olarak kullanıma sunun. Bu adımları el ile uygulayın veya Logic Apps veya Azure İşlevleri alma işlemiyle tümleştirerek otomatikleştirin.

  • Azure AI Studio, temel modellerin ince ayarlanması ve dağıtılması için bir diğer seçenektir.

Senaryo ayrıntıları

Belge işleme geniş bir alandır. Azure AI Belge Zekası ve Azure AI Dili'nde bulunan önceden oluşturulmuş modellerle tüm belge işleme gereksinimlerinizi karşılamak zor olabilir. Farklı uygulamalar ve etki alanları için belge işlemeyi otomatikleştirmek için özel modeller oluşturmanız gerekebilir.

Model özelleştirmesindeki başlıca zorluklar şunlardır:

  • Metin ayıklama için sınıflandırmak için metin verilerini ilgili anahtar-değer çifti varlıklarıyla etiketleme veya etiketleme.
  • Kullanım uygulamalarıyla kolay tümleştirme için modelleri uygun ölçekte güvenli bir şekilde dağıtma.

Olası kullanım örnekleri

Aşağıdaki kullanım örnekleri, belge işleme için özel modellerden yararlanabilir:

  • Açık kaynak çerçeveleri temel alarak özel NER ve metin sınıflandırma modelleri oluşturun.
  • Sigorta ve sağlık hizmetleri gibi çeşitli sektör dikeyleri için belgelerden özel anahtar-değerleri ayıklayın.
  • Güvenlik veya finans gibi etki alanları için önceden oluşturulmuş NER modellerinin ötesinde belirli etki alanına bağımlı varlıkları etiketleyin ve ayıklayın.
  • Belgelerden özel tablolar oluşturun.
  • İmzaları ayıklayın.
  • E-postaları veya diğer belgeleri içeriğe göre etiketleyip sınıflandırabilirsiniz.

Dikkat edilmesi gereken noktalar

Bu önemli noktalar, bir iş yükünün kalitesini artırmak için kullanılabilecek bir dizi yol gösteren ilke olan Azure İyi Tasarlanmış Çerçeve'nin yapı taşlarını uygular. Daha fazla bilgi için bkz . Microsoft Azure İyi Tasarlanmış Çerçeve.

Bu örnek iş yükü için her bir sütunun uygulanması, her bir bileşen Azure hizmetini en iyi şekilde yapılandırmaya ve kullanmaya bağlıdır.

Güvenilirlik

Güvenilirlik, uygulamanızın müşterilerinize sağladığınız taahhütleri karşılayabilmesini sağlar. Daha fazla bilgi için bkz . Güvenilirlik sütununa genel bakış.

Kullanılabilirlik

Dayanıklılık

  • Bu senaryoda işlem hizmetlerinin ve veri depolarının dayanıklılığını sağlamak için Azure İşlevleri ve Azure Depolama gibi tek tek hizmetlerin hata modlarını işleyebilirsiniz. Daha fazla bilgi için bkz . Belirli Azure hizmetleri için dayanıklılık denetim listesi.

  • Belge Yönetim Bilgileri için Form Tanıma modellerinizi yedekleyin ve kurtarın.

  • Azure AI Dili ile özel metin sınıflandırması için özel metin sınıflandırma modellerinizi yedekleyin ve kurtarın.

  • Azure AI Dili'ndeki özel NER için özel NER modellerinizi yedekleyin ve kurtarın.

  • Azure Machine Learning, Blob Depolama, işlem hizmetleri ve Azure Kubernetes Service (AKS) gibi bağlı hizmetlere bağlıdır. Azure Machine Learning'e dayanıklılık sağlamak için bu hizmetlerin her birini dayanıklı olacak şekilde yapılandırın. Daha fazla bilgi için bkz . İş sürekliliği ve olağanüstü durum kurtarma için yük devretme.

Güvenlik

Güvenlik, kasıtlı saldırılara ve değerli verilerinizin ve sistemlerinizin kötüye kullanılmasına karşı güvence sağlar. Daha fazla bilgi için bkz . Güvenlik sütununa genel bakış.

Maliyet iyileştirme

Maliyet iyileştirmesi, gereksiz giderleri azaltmanın ve operasyonel verimlilikleri iyileştirmenin yollarını aramaktır. Daha fazla bilgi için bkz . Maliyet iyileştirme sütununa genel bakış.

Bu çözümü uygulamanın toplam maliyeti, seçtiğiniz hizmetlerin fiyatlarına bağlıdır.

Bu çözümün başlıca maliyetleri şunlardır:

Belirli bileşenlerin fiyatlandırması hakkında daha fazla bilgi için aşağıdaki kaynaklara bakın:

Seçtiğiniz bileşen seçeneklerini eklemek ve genel çözüm maliyetini tahmin etmek için Azure fiyatlandırma hesaplayıcısını kullanın.

Performans verimliliği

Performans verimliliği, kullanıcılar tarafından anlamlı bir şekilde yerleştirilen talepleri karşılamak amacıyla iş yükünüzü ölçeklendirme becerisidir. Daha fazla bilgi için bkz . Performans verimliliği sütununa genel bakış.

Ölçeklenebilirlik

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunan tarafından yazılmıştır.

Asıl yazar:

Genel olmayan LinkedIn profillerini görmek için LinkedIn'de oturum açın.

Sonraki adımlar