Kullanmaya başlama: Document Intelligence Studio

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)

Document Intelligence Studio , Uygulamalarınızda Belge Zekası hizmetindeki özellikleri görsel olarak keşfetmeye, anlamaya ve tümleştirmeye yönelik çevrimiçi bir araçtır. Örnek veya kendi belgelerinizle önceden eğitilmiş modelleri inceleyerek başlayabilirsiniz. Ayrıca Python SDK'sını ve diğer hızlı başlangıçları kullanarak özel şablon modelleri oluşturmak ve uygulamalarınızdaki modellere başvurmak için projeler oluşturabilirsiniz.

Yeni kullanıcılar için önkoşullar

İpucu

Tek bir uç nokta/anahtar altında birden çok Azure AI hizmetine erişmeyi planlıyorsanız bir Azure AI hizmetleri kaynağı oluşturun. Yalnızca Belge Yönetim Bilgileri erişimi için bir Belge Yönetim Bilgileri kaynağı oluşturun. Şu anda Belge Zekası hizmeti API'lerine erişmek için Document Intelligence Studio'da Microsoft Entra kimlik doğrulaması desteklenmez. Document Intelligence Studio'yu kullanmak için anahtar tabanlı kimlik doğrulamasına/yerel kimlik doğrulamasına erişimin etkinleştirilmesi gerekir.

Azure rol atamaları

Belge analizi ve önceden oluşturulmuş modeller için farklı senaryolar için aşağıdaki rol atamaları gereklidir.

  • Temel
    • Bilişsel Hizmetler Kullanıcısı: Analiz sayfasına girmek için Belge Zekası veya Azure AI hizmetleri kaynağı için bu role ihtiyacınız vardır.
  • Gelişmiş
    • Katkıda bulunan: Kaynak grubu, Belge Zekası hizmeti veya Azure AI hizmetleri kaynağı oluşturmak için bu role ihtiyacınız vardır.

Modeller

Önceden oluşturulmuş modeller, kendi modellerinizi oluşturmak, eğitmek ve yayımlamak zorunda kalmadan uygulamalarınıza Belge Zekası özellikleri eklemenize yardımcı olur. Her biri kendi desteklenen veri alanları kümesine sahip olan önceden oluşturulmuş birkaç model arasından seçim yapabilirsiniz. Analiz işlemi için kullanılacak modelin seçimi, analiz edilecek belgenin türüne bağlıdır. Belge Zekası şu anda aşağıdaki önceden oluşturulmuş modelleri destekler:

Belge analizi

  • Düzen: Belgelerden (PDF, TIFF) ve görüntülerden (JPG, PNG, BMP) metin, tablo, seçim işareti ve yapı bilgilerini ayıklayın.
  • Okuma: Belgelerden (PDF, TIFF) ve görüntülerden (JPG, PNG, BMP) algılanırsa metin çizgilerini, sözcükleri, konumlarını, algılanan dilleri ve el yazısı stilini ayıklayın.

Önceden oluşturulmuş

  • Fatura: Faturalardan metin, seçim işaretleri, tablolar, anahtar-değer çiftleri ve anahtar bilgilerini ayıklayın.
  • Alındı bilgisi: alındı bilgilerinden metin ve anahtar bilgilerini ayıklayın.
  • Sağlık sigortası kartı: ABD sağlık sigortası kartlarından sigortacı, üye, reçete, grup numarası ve diğer önemli bilgileri ayıklayın.
  • W-2: W-2 vergi formlarından metin ve anahtar bilgilerini ayıklayın.
  • Kimlik belgesi: Sürücü belgelerinden ve uluslararası pasaportlardan metin ve anahtar bilgilerini ayıklayın.

Özel

Önkoşulları tamamladıktan sonra Document Intelligence Studio'ya gidin.

  1. Studio giriş sayfasından bir Belge Yönetim Bilgileri hizmeti özelliği seçin.

  2. Bu adım, hizmet kaynağını önceden kullanımdan seçmediğiniz sürece tek seferlik bir işlemdir. Azure aboneliğinizi, kaynak grubunuzu ve kaynağınızı seçin. (Kaynakları istediğiniz zaman üstteki menüden "Ayarlar" olarak değiştirebilirsiniz.) Seçimlerinizi gözden geçirin ve onaylayın.

  3. Örnek belgede çözümleme çalıştırmak için Çözümle düğmesini seçin veya Ekle komutunu kullanarak belgenizi deneyin.

  4. Belge görünümünü yakınlaştırmak ve uzaklaştırmak ve döndürmek için ekranın alt kısmındaki denetimleri kullanın.

  5. Belge görünümünde vurgulanan ayıklanan içeriği gözlemleyin. Ayrıntıları görmek için farenizi tuşların ve değerlerin üzerine getirin.

  6. Hizmet yanıt biçimini anlamak için çıkış bölümünün Sonuç sekmesinde JSON çıkışına göz atın.

  7. Kod sekmesinde tümleştirme için örnek koda göz atın. Başlamak için kopyalayıp indirin.

Özel projeler için önkoşullar eklendi

Azure hesabı ve Belge Zekası veya Azure AI hizmetleri kaynağına ek olarak şunlara ihtiyacınız vardır:

kapsayıcı Azure Blob Depolama

Standart performans Azure Blob Depolama hesabı. Eğitim belgelerinizi depolama hesabınızda depolamak ve düzenlemek için kapsayıcılar oluşturursunuz. Kapsayıcıyla Azure depolama hesabı oluşturmayı bilmiyorsanız, aşağıdaki hızlı başlangıçları izleyin:

  • Depolama hesabı oluşturma. Depolama hesabınızı oluştururken Örnek ayrıntıları → Performans alanında Standart performans'ı seçtiğinizden emin olun.
  • Kapsayıcı oluşturma. Kapsayıcınızı oluştururken, Yeni Kapsayıcı penceresinde Genel erişim düzeyi alanını Kapsayıcı (kapsayıcılar ve bloblar için anonim okuma erişimi) olarak ayarlayın.

Azure rol atamaları

Özel projeler için aşağıdaki rol atamaları farklı senaryolar için gereklidir.

  • Temel
    • Bilişsel Hizmetler Kullanıcısı: Özel modeli eğitmek veya eğitilen modellerle analiz yapmak için Belge Zekası veya Azure AI hizmetleri kaynağı için bu role ihtiyacınız vardır.
    • Depolama Blob Veri Katkıda Bulunanı: Proje oluşturmak ve verileri etiketlemek için Depolama Hesabı için bu role ihtiyacınız vardır.
  • Gelişmiş
    • Depolama Hesap Katkıda Bulunanı: Depolama Hesabının CORS ayarlarını ayarlaması için bu role ihtiyacınız vardır (aynı depolama hesabı yeniden kullanılırsa bu tek seferlik bir çabadır).
    • Katkıda Bulunan: Kaynak grubu ve kaynak oluşturmak için bu role ihtiyacınız vardır.

CORS Yapılandırma

CorS'nin (Çıkış Noktaları Arası Kaynak Paylaşımı) Document Intelligence Studio'dan erişilebilir olması için Azure depolama hesabınızda yapılandırılması gerekir. Azure portalında CORS'yi yapılandırmak için depolama hesabınızın CORS sekmesine erişmeniz gerekir.

  1. Depolama hesabı için CORS sekmesini seçin.

    Azure portalındaki CORS ayar menüsünün ekran görüntüsü.

  2. Blob hizmetinde yeni bir CORS girdisi oluşturarak başlayın.

  3. İzin verilen çıkış noktaları olarak https://documentintelligence.ai.azure.comayarlayın.

    Depolama hesabı için CORS yapılandırmasını gösteren ekran görüntüsü.

    İpucu

    Tüm kaynak etki alanlarının CORS aracılığıyla istekte bulunmalarına izin vermek için belirtilen etki alanı yerine '*' joker karakterini kullanabilirsiniz.

  4. İzin verilen yöntemler için tüm kullanılabilir 8 seçeneği belirleyin.

  5. Her alana * girerek tüm İzin verilen üst bilgileri ve Kullanıma Sunulan üst bilgileri onaylayın.

  6. Maksimum Yaş değerini 120 saniye veya kabul edilebilir bir değer olarak ayarlayın.

  7. Değişiklikleri kaydetmek için sayfanın üst kısmındaki kaydet düğmesini seçin.

CORS artık Document Intelligence Studio'dan depolama hesabını kullanacak şekilde yapılandırılmalıdır.

Örnek belge kümesi

  1. Azure portalında oturum açın ve Depolama hesabınız>Veri depolama>Kapsayıcıları'na gidin.

    Azure portalında Veri depolama menüsünün ekran görüntüsü.

  2. Listeden bir kapsayıcı seçin.

  3. Sayfanın üst kısmındaki menüden Karşıya Yükle'yi seçin.

    Azure portalında kapsayıcı karşıya yükleme düğmesinin ekran görüntüsü.

  4. Blobu karşıya yükle penceresi görüntülenir.

  5. Karşıya yüklenecek dosyalarınızı seçin.

    Azure portalında blobu karşıya yükleme penceresinin ekran görüntüsü.

Not

Varsayılan olarak, Studio kapsayıcınızın kökünde bulunan belgeleri kullanır. Ancak, Özel form projesi oluşturma adımlarında klasör yolunu belirterek klasörler halinde düzenlenmiş verileri kullanabilirsiniz. Bkz.Verilerinizi alt klasörlerde düzenleme

Özel modeller

Özel modeller oluşturmak için projenizi yapılandırmayla başlarsınız:

  1. Studio giriş sayfasında Özel model kartını seçerek Özel modeller sayfasını açın.

  2. Yeni proje yapılandırma sihirbazını başlatmak için "Proje oluştur" komutunu kullanın.

  3. Proje ayrıntılarını girin, Azure aboneliğini ve kaynağını ve verilerinizi içeren Azure Blob depolama kapsayıcısını seçin.

  4. Projeyi oluşturmak için ayarlarınızı gözden geçirin ve gönderin.

  5. Etiketleme işlemine hızlı bir başlangıç yapmak için otomatik etiketleme özelliğini kullanarak önceden eğitilmiş modeli veya önceden oluşturulmuş modellerimizden birini kullanarak etiketleyin.

  6. Sıfırdan el ile etiketleme için, ayıklamak istediğiniz etiketleri ve bunların türlerini tanımlayın.

  7. Belgedeki metni seçin ve açılan listeden veya etiketler bölmesinden etiketi seçin.

  8. Etiketlenmiş en az beş belgeyi almak için dört belgeyi daha etiketle.

  9. Eğit komutunu seçin ve model adını girin, sinir (önerilen) veya şablon modelinin özel modelinizi eğitmeye başlamasını isteyip istemediğinizi seçin.

  10. Model hazır olduğunda Test komutunu kullanarak test belgelerinizle doğrulayın ve sonuçları gözlemleyin.

Belge Yönetim Bilgileri Özel model tanıtımı

Tablo olarak etiketleme

Not

  • API sürüm 2022-06-30-preview ve üzeri sürümlerle birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler.
  • API sürüm 2022-06-30-preview ve üzeri sürümlerle, özel sinir modelleri tablo alanlarını (tabloları) destekleyecek ve API sürüm 2022-08-31 ile eğitilen modeller tablosal alan etiketlerini kabul edecektir.
  1. Gerekli olmayan modelleri silmek için Sil komutunu kullanın.

  2. Çevrimdışı görüntüleme için model ayrıntılarını indirin.

  3. Birden çok model seçin ve bunları uygulamalarınızda kullanılacak yeni bir modelde oluşturun.

Tabloları görsel desen olarak kullanma:

Özel form modellerinde, özel modellerinizi oluştururken belgelerinizden veri koleksiyonlarını ayıklamanız gerekebilir. Veri koleksiyonları birkaç biçimde görünebilir. Tabloları görsel desen olarak kullanma:

  • Belirli bir alan kümesi (sütunlar) için dinamik veya değişken değer sayısı (satırlar)

  • Belirli bir alan kümesi için belirli bir değer koleksiyonu (sütunlar ve/veya satırlar)

Dinamik tablo olarak etiketle

Belirli bir alan kümesinin (sütun) değişken değer sayısını (satırlar) ayıklamak için dinamik tabloları kullanın:

  1. Yeni bir "Tablo" türü etiketi ekleyin, "Dinamik tablo" türü'nü seçin ve etiketinizi adlandırabilirsiniz.

  2. İhtiyacınız olan sütun (alan) ve satır sayısını (veriler için) ekleyin.

  3. Sayfanızdaki metni seçin ve sonra metne atanacak hücreyi seçin. Tüm belgelerdeki tüm sayfalardaki tüm satırlar ve sütunlar için yineleyin.

Dinamik tablo örneği olarak Belge Yönetim Bilgileri etiketlemesi

Sabit tablo olarak etiketle

Belirli bir alan kümesinin (sütunlar ve/veya satırlar) belirli bir değer koleksiyonunu ayıklamak için sabit tabloları kullanın:

  1. Yeni bir "Tablo" türü etiketi oluşturun, "Sabit tablo" türü'nü seçin ve adlandırabilirsiniz.

  2. İki alan kümesine karşılık gelen ihtiyacınız olan sütun ve satır sayısını ekleyin.

  3. Sayfanızdaki metni seçin ve sonra metni atamak için hücreyi seçin. Diğer belgeler için yineleyin.

Sabit tablo örneği olarak Belge Yönetim Bilgileri Etiketleme

İmza algılama

Not

İmza alanları şu anda yalnızca özel şablon modelleri için desteklenmektedir. Özel bir sinir modeli eğitilirken etiketlenmiş imza alanları yoksayılır.

İmza algılama için etiketlemek için: (Yalnızca özel form)

  1. Etiketleme görünümünde yeni bir "İmza" türü etiketi oluşturun ve etiketi adlandırın.

  2. İmzanın beklenen konumunda dikdörtgen bir bölge oluşturmak için Region komutunu kullanın.

  3. Çizilmiş bölgeyi seçin ve çizilmiş bölgenize atamak için İmza türü etiketini seçin. Diğer belgeler için yineleyin.

İmza algılama için Belge Yönetim Bilgileri etiketleme örneği

Sonraki adımlar

Document Intelligence Studio'yu kullanmaya başlayın.