Azure AI Belge Zekası hakkında SSS

Bu içerik şunlar için geçerlidir:Checkmark v4.0 (önizleme)Checkmarkv3.1 (GA)Checkmarkv3.0 (GA)Checkmarkv2.1 (GA)

Genel kavramlar

Azure Yapay Zeka Belge Zekası nedir ve Azure yapay zeka Form Tanıma ne oldu?

Azure AI Belge Zekası, belgelerinizden anahtar/değer çiftlerini, metinleri ve tabloları ayıklamak için makine öğrenmesi modellerini kullanan bulut tabanlı bir hizmettir. Döndürülen sonuç yapılandırılmış bir JSON çıkışıdır. Belge Zekası kullanım örnekleri arasında otomatik veri işleme, gelişmiş veri odaklı stratejiler ve zenginleştirilmiş belge arama özellikleri bulunur.

Belge Zekası, Azure yapay zeka hizmetlerinin bir parçasıdır. Azure yapay zeka hizmetleri, daha önce Azure Bilişsel Hizmetler ve Azure Uygulaması yapay zeka hizmetleri olarak bilinen tüm hizmetleri kapsar.

Belge Zekası'nın önceki adı Azure AI Form Tanıma'ydi. Form Tanıma, Temmuz 2023'te resmi olarak Belge Zekası oldu.

Fiyatlandırmada değişiklik yoktur. Bilişsel Hizmetler ve Uygulanan Yapay Zeka Hizmetleri adları Azure faturalama, maliyet analizi, fiyat listeleri ve fiyat API'lerinde kullanılmaya devam ediyor.

API'lerde veya istemci kitaplıklarında (SDK) hataya neden olan bir değişiklik yoktur. REST API'leri ve SDK sürümleri 2024-02-29-preview, 2023-10-31-preview ve üzeri sürümleri yeniden adlandırılır document intelligence.

Bazı platformlar hala yeniden adlandırma güncelleştirmesini bekliyor. Microsoft belgelerinde, Form Tanıma ve Belge Zekası ile ilgili tüm bahsetmeler aynı Azure hizmetine başvurur.

Belge Zekası'nın belge oluşturma yapay zekası ile ilişkisi nedir?

Belgelerinizle sohbet etmek, bu belgelerden etkileyici içerik oluşturmak ve verilerinizde Azure OpenAI Hizmeti modellerine erişmek için belge oluşturucu yapay zeka çözümünü kullanabilirsiniz. Azure AI Belge Zekası ve Azure OpenAI bir araya getirildiğinde, doğal dilleri kullanarak belgelerinizle sorunsuz bir şekilde etkileşim kurmak, kolayca yanıtlar bulmak ve değerli içgörüler elde etmek ve mevcut belgelerinizden yeni ve ilgi çekici içerik oluşturmak için kurumsal bir uygulama oluşturabilirsiniz. Teknik topluluk blogunda daha fazla ayrıntı bulabilirsiniz.

Belge Zekası' nın alma artırılmış oluşturma ile ilişkisi nedir?

Anlamsal öbekleme, verimli bir depolama ve alma sağlamak için alma artırılmış oluşturma (RAG) için önemli bir adımdır. Belge Yönetim Bilgileri düzen modeli , gelişmiş içerik ayıklama ve belge yapısı analizi özellikleri için kapsamlı bir çözüm sunar.

Düzen modeliyle, büyük metin gövdelerini rastgele bölmeler yerine anlamsal içeriğe göre daha küçük, anlamlı öbeklere bölmek için metni ve yapısal öğeleri kolayca ayıklayabilirsiniz. Ardından, sağlanan yapı taşları temelinde anlamsal öbekleme stratejinizi tanımlayabileceğiniz şekilde ayıklanan bilgileri Markdown biçimine kolayca çıkarabilirsiniz. Belge Zekası'nda RAG'e genel bakış bölümünde daha fazla ayrıntı bulabilirsiniz.

Hangi Belge Zekası kullanım örnekleri dikkate alınmasını gerektirir?

Finansal verileri, korunan sağlık verilerini, kişisel verileri veya son derece hassas verileri kapsayan belge işleme projelerini dikkatle dikkate alın.

Ulusal/bölgesel ve sektöre özgü tüm gereksinimlere uyladığınızdan emin olun.

Belge Zekası hangi dilleri destekler?

Belge Zekası'ndaki derin öğrenme tabanlı evrensel modeller, karma dillere sahip metin satırları da dahil olmak üzere resimlerinizden ve belgelerinizden çok dilli metin ayıklayan birçok dili destekler.

Dil desteği, Belge Zekası hizmeti işlevselliğine göre değişir. Belge Zekası'nın desteklediği el yazısı ve yazdırılan metnin tam listesi için bkz . Dil desteği.

Belge Zekası Azure bölgemde kullanılabilir mi?

Belge Zekası genel olarak 60'ın üzeri Azure genel altyapı bölgesinde kullanılabilir.

Sizin ve müşterileriniz için en uygun bölgeyi seçin.

Belge Zekası diğer Microsoft hizmetleri ile tümleşir mi?

Evet, Document Intelligence aşağıdaki hizmetlerle tümleştirilir:

Belge Zekası optik karakter tanıma ile nasıl ilişkilidir?

Belge Zekası, Azure AI hizmetlerinden optik karakter tanıma (OCR), metin analizi ve özel metin sınıflandırması içeren bulut tabanlı bir hizmettir.

Belge Zekası, metin ayıklamaya daha fazla yapı ve bilgi sağlamak amacıyla yapay zeka tarafından desteklenen yazı tipi ve el yazısı metin belgelerinden bilgileri algılamak ve ayıklamak için OCR kullanır.

Özel modelim ne kadar süre kullanılabilir?

Model, eğitmek için kullandığınız API sürümüyle aynı yaşam döngüsüne sahiptir. API'nin genel kullanılabilirlik (GA) sürümüyle eğitilen özel modeller, API sürümüyle aynı yaşam döngüsüne sahiptir. API sürümü kullanım dışı bırakıldığında, model artık çıkarım için kullanılamaz. API'nin önizleme sürümüyle eğitilen modeller de önizleme API'siyle aynı yaşam döngüsüne sahiptir.

Önizleme API'sinin güncelleştirilmiş bir önizleme API sürümünü veya daha yeni bir GA API sürümünü izleyen üç ay içinde kullanımdan kaldırılmasını bekleyebilirsiniz.

Doğruluk puanı nedir ve nasıl hesaplanır?

(v3.0 ve sonraki sürümler) veya train (v2.1) özel model işleminin çıkışı build tahmini doğruluk puanını içerir. Bu puan, modelin görsel olarak benzer bir belgedeki etiketlenmiş değeri doğru tahmin etme özelliğini temsil eder.

Doğruluk, %0 (düşük) ile %100 (yüksek) arasında bir yüzde değeri aralığında ölçülür.

Daha fazla bilgi için bkz . Doğruluk ve güvenilirlik puanları.

Doğruluk puanlarını nasıl geliştirebilirim?

Belgelerinizin görsel yapısındaki farklar modelin doğruluğunu etkileyebilir. Bazı ipuçları şunlardır:

  • Bir belgenin tüm çeşitlemelerini eğitim veri kümesine ekleyin. Çeşitlemeler farklı biçimler içerir; örneğin, dijital ve taranmış PDF'ler.

  • Görsel olarak ayrı belge türlerini ayırın ve farklı modelleri eğitin.

  • Gereksiz etiketleriniz olmadığından emin olun.

  • İmza ve bölge etiketleme için çevreleyen metni dahil etmeyin.

Daha fazla bilgi için bkz . Doğruluk ve güvenilirlik puanları.

Güvenilirlik puanı nedir ve nasıl hesaplanır?

Güvenilirlik puanı, elde edilen sonucun doğru algılandığı istatistiksel kesinlik derecesini ölçerek olasılığı gösterir.

Güvenilirlik değeri aralığı %0 (düşük) ile %100 (yüksek) arasında bir yüzdedir. En iyisi %80 veya daha yüksek bir puan hedeflemektir. Finansal veya tıbbi kayıtlar gibi daha hassas vakalar için %100'e yakın bir puan öneririz. Ayrıca, insan incelemesi de gerektirebilirsiniz.

Daha fazla bilgi için bkz . Doğruluk ve güvenilirlik puanları.

Güvenilirlik puanlarını nasıl geliştirebilirim?

Analiz işleminden sonra JSON çıkışını gözden geçirin. Düğümün confidence altındaki her anahtar/değer sonucunun pageResults değerlerini inceleyin. Ayrıca, metin okuma işlemine karşılık gelen düğümdeki readResults güvenilirlik puanına da bakmalısınız. Okuma sonuçlarının güvenilirliği anahtar/değer ayıklama sonuçlarının güvenilirliğini etkilemez, bu nedenle her ikisini de denetlemeniz gerekir. Bazı ipuçları şunlardır:

  • Nesnenin readResults güvenilirlik puanı düşükse, giriş belgelerinizin kalitesini artırın.

  • Nesnenin pageResults güvenilirlik puanı düşükse, analiz ettiğiniz belgelerin aynı türde olduğundan emin olun.

  • İş akışlarınıza insan incelemesi eklemeyi göz önünde bulundurun.

  • Her alanda farklı değerlere sahip formları kullanın.

  • Özel modeller için daha büyük bir eğitim belgesi kümesi kullanın. Daha fazla belgenin etiketlenmesi, modelinize alanları daha yüksek doğrulukla tanımayı öğretir.

Daha fazla bilgi için bkz . Doğruluk ve güvenilirlik puanları.

Sınırlayıcı kutu nedir?

Sınırlayıcı kutu (polygon v3.0 ve sonraki sürümlerde), belge veya formdaki metin öğelerini çevreleyen soyut bir dikdörtgendir. Nesne algılama için başvuru noktası olarak kullanılır.

Sınırlayıcı kutu, dört sayısal çiftten oluşan bir dizide sunulan x ve y koordinat düzlemi kullanılarak konumu belirtir. Her çift, kutunun bir köşesini şu sırayla temsil eder: sol üst, sağ üst, sağ alt, sol alt.

Bir görüntü için koordinatlar piksel cinsindendir. PDF için koordinatlar inç şeklindedir.

Belge Zekası belgeleri sınıflandırmama yardımcı olabilir mi?

Belge Yönetim Bilgileri, bir giriş dosyasının eğitilen belge türlerinden herhangi birini içerip içermediğini belirlemek için tek dosyalı veya çok dosyalı belgeleri çözümleyebilecek özel sınıflandırma modelleri sağlar. Hizmet aşağıdaki senaryoları destekler:

  • Kredi başvuru formu gibi tek bir belge türü içeren tek bir dosya.

  • Birden çok belge içeren tek bir dosya. Örnek olarak, kredi başvuru formu, ödeme ve banka ekstresi içeren bir kredi uygulama paketi verilmiştir.

  • Aynı belgenin birden çok örneğini içeren tek bir dosya. Taranan faturaların koleksiyonu örnek olarak verilmiştir.

Daha fazla bilgi için bkz . Özel sınıflandırma modellerine genel bakış.

Uygulama geliştirme

Belge Zekası için geliştirme seçenekleri nelerdir?

Belge Zekası aşağıdaki platformlarda en son geliştirme seçeneklerini sunar:

En son programlama dili SDK'ları için desteklenen API sürümünü nerede bulabilirim?

Bu tablo en son SDK sürümlerine bağlantılar sağlar ve desteklenen Belge Zekası SDK'sı ile API sürümleri arasındaki ilişkiyi gösterir:

Desteklenen dil Azure SDK başvurusu Desteklenen API sürümleri
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-önizleme
v3.0 v2.1
v2.0

Daha fazla bilgi için bkz . v4.0 için desteklenen istemciler ve v3.1 için desteklenen istemciler.

Belge Zekası v3.0 ve v2.1 arasındaki fark nedir ve en son sürüme nasıl geçiş yapabilirim?

Daha iyi kullanılabilirlik için, Document Intelligence v3.0 tamamen yeniden tasarlanmış bir istemci kitaplığı sunar. En son Belge Zekası API'sinin özelliklerini başarıyla kullanmak için en son SDK'ya ihtiyacınız vardır ve uygulama kodunuz yeni istemcileri kullanacak şekilde güncelleştirilmelidir.

Bu tablo, Belge Zekası'nın en yeni sürümüne geçiş için ayrıntılı yönergelerin bağlantılarını sağlar:

Dil/API Geçiş kılavuzu
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Belge Zekası hangi dosya biçimlerini destekler? Giriş belgeleri için boyut sınırlamaları var mı?

En iyi sonuçları almak için giriş gereksinimlerine bakın.

Belgede analiz edilecek bir sayfa aralığını nasıl belirtebilirim?

Birden çok sayfalı PDF ve TIFF belgelerinin pages sayfalarını belirtmek için parametresini (REST API'nin v2.1, v3.0 ve sonraki sürümlerinde desteklenir) kullanın. Kabul edilen giriş aşağıdaki aralıkları içerir:

  • Tek sayfalar. Örneğin, belirtirseniz 1, 2, 1. ve 2. sayfalar işlenir.
  • Sonlu aralıklar. Örneğin, belirtirseniz 2-5, 2- 5 sayfaları işlenir.
  • Açık uçlu aralıklar. Örneğin, belirtirseniz 5-, 5. sayfadaki tüm sayfalar işlenir. belirtirseniz -10, 1- 10 sayfaları işlenir.

Bu parametreleri birlikte karıştırabilirsiniz ve aralıklar çakışabilir. Örneğin, belirtirseniz -5, 1, 3, 5-10, 1- 10 sayfaları işlenir.

Hizmet, belgenin en az bir sayfasını işleyebiliyorsa isteği kabul eder. Örneğin, beş sayfalık bir belgede kullanmak 5-100 , 5. sayfanın işlendiği anlamına gelen geçerli bir giriştir.

Sayfa aralığı sağlamazsanız, belgenin tamamı işlenir.

Hem Document Intelligence Studio hem de FOTT Örnek Etiketleme aracı kullanılabilir. Hangisini kullanmalıyım?

Çoğu zaman, Belge Yönetim Bilgileri kaynaklarını ve depolama hizmetlerini yapılandırma sürenizi azaltabileceğinden, Document Intelligence Studio'yu öneririz.

Aşağıdaki senaryolar için Form OCR Test Aracı'nı (FOTT) kullanmayı göz önünde bulundurun:

Hizmet sınırları ve fiyatlandırma

Azure, Belge Zekası'nı kullanmanın fiyatını nasıl hesaplar?

Belge Yönetim Bilgileri faturalaması, model türüne ve analiz edilen sayfa sayısına göre aylık olarak hesaplanır. Bazı ayrıntılar şunlardır:

  • Analiz için bir belge gönderdiğinizde, isteğinizdeki parametresini kullanarak pages bir sayfa aralığı belirtmediğiniz sürece hizmet tüm sayfaları analiz eder. Hizmet okuma, OCR veya düzen modeli aracılığıyla Microsoft Excel ve PowerPoint belgelerini analiz ettiğinde, her Excel çalışma sayfasını ve PowerPoint slaydını tek sayfa olarak sayar.

  • Hizmet PDF ve TIFF dosyalarını çözümlediğinde, PDF dosyasındaki her sayfayı veya TIFF dosyasındaki her görüntüyü maksimum karakter sınırı olmayan bir sayfa olarak sayar.

  • Hizmet, okuma ve düzen modellerinin desteklediği Microsoft Word ve HTML dosyalarını analiz ettiğinde, sayfaları her biri 3.000 karakterden oluşan bloklar halinde sayar. Örneğin, belgeniz 7.000 karakter içeriyorsa, her biri 3.000 karakterli iki sayfa ve 1.000 karakterli bir sayfa toplam üç sayfaya kadar eklenir.

  • Microsoft Word, Excel, PowerPoint ve HTML dosyalarını analiz etmek için okuma veya düzen modelini kullanırken, eklenmiş veya bağlı görüntüler desteklenmez. Bu nedenle hizmet bunları eklenen görüntüler olarak saymaz.

  • Belge Zekası ile özel bir modelin eğitimi her zaman ücretsizdir. Yalnızca hizmet bir belgeyi analiz etmek için bir model kullandığında ücretlendirilirsiniz.

  • Kapsayıcı fiyatlandırması, bulut hizmeti fiyatlandırması ile aynıdır.

  • Belge Zekası, tüm Belge Zekası özelliklerini testebileceğiniz ücretsiz bir katman (F0) sunar.

  • Belge Zekası, büyük iş yükleri için taahhüt tabanlı bir fiyatlandırma modeline sahiptir.

Azure AI Belge Zekası fiyatlandırma seçenekleri hakkında daha fazla bilgi edinin.

Belge Zekası kullanımımı nasıl denetleyebilirim ve fiyatı nasıl tahmin ederim?

Kullanım ölçümlerini Azure portalındaki ölçümler panosunda bulabilirsiniz. Pano, Azure AI Belge Zekası'nın işlediği sayfa sayısını görüntüler. Azure fiyatlandırma hesaplayıcısını kullanarak kaynak için harcanan tahmini maliyeti de kontrol edebilirsiniz. Ayrıntılı yönergeler için bkz . Kullanımı denetleme ve maliyeti tahmin etme.

Azaltmayı azaltmak için en iyi yöntemler nelerdir?

Belge Yönetim Bilgileri, gerekli hesaplama kaynaklarını isteğe bağlı olarak sağlamak ve müşteri maliyetlerini düşük tutmak için otomatik ölçeklendirmeyi kullanır. Otomatik ölçeklendirme sırasında azaltmayı azaltmak için aşağıdaki yaklaşımı öneririz:

Belge Yönetim Bilgileri hizmeti kotaları ve sınırları hakkında daha fazla bilgi edinin.

Belgeyi analiz etmek ne kadar sürer?

Belgeyi analiz etme süresi, her sayfadaki boyuta (örneğin, sayfa sayısı) ve ilişkili içeriğe bağlıdır.

Belge Zekası, benzer belgeler için gecikme süresinin karşılaştırılabilir olduğu ancak her zaman aynı olmadığı çok kiracılı bir hizmettir. Gecikme süresi, bir API sunucusunun gelen isteği işlemesi ve işlemesi ve giden yanıtı istemciye teslim etme süresidir. Gecikme süresi ve performansta zaman zaman değişkenlik, görüntüleri ve büyük belgeleri büyük ölçekte işleyen mikro hizmet tabanlı, durum bilgisi olmayan, zaman uyumsuz hizmetlerde geçerlidir.

Donanım ve kapasite ile ölçeklendirme özelliklerini sürekli olarak artırıyor olsak da, çalışma zamanında gecikme sorunları yaşamaya devam edebilirsiniz.

Özel modeller

En iyi eğitim verilerini bir araya Nasıl yaparım??

Belge Zekası özel modelini kullandığınızda, kendi eğitim verilerinizi sağlarsınız. Modellerinizi etkili bir şekilde eğitmeye yardımcı olacak birkaç ipucu aşağıdadır:

  • Mümkün olduğunda görüntü tabanlı PDF'ler yerine metin tabanlı kullanın. Görüntü tabanlı PDF'yi tanımlamanın bir yolu, belgedeki belirli bir metni seçmeyi denemektir. Metnin yalnızca tüm görüntüsünü seçebiliyorsanız, belge metin tabanlı değil görüntü tabanlıdır.

  • Eğitim belgelerinizi her biçim için bir alt klasör (JPEG/JPG, PNG, BMP, PDF veya TIFF) kullanarak düzenleyin.

  • Tüm kullanılabilir alanların tamamlandığı formları kullanın.

  • Her alanda farklı değerlere sahip formlar kullanın.

  • Resimleriniz düşük kaliteliyse daha büyük bir veri kümesi (beşten fazla eğitim belgesi) kullanın.

Eğitim veri kümesi oluşturma hakkında daha fazla bilgi edinin.

Son derece doğru bir özel modeli eğiten en iyi yöntemler nelerdir?

Modelinizin doğruluk düzeyi, eğitim malzemelerinizin kalitesine bağlıdır. Bazı ipuçları şunlardır:

  • Tek bir model mi yoksa tek bir modelde oluşturulmuş birden çok model mi kullanmanız gerektiğini belirleyin.

  • Tek bir modelle analiz edilen farklı biçimlere sahip olduğunuzda model doğruluğu düşebilir. Veri kümenizi, her klasörün benzersiz bir şablon olduğu klasörler halinde segmentlere ayırmayı planlayın. Klasör başına bir model eğitin ve elde edilen modelleri tek bir uç noktada oluşturun.

  • Özel formlar tutarlı bir görsel şablonu kullanır. Formunuzda biçimler ve sayfa sonları içeren çeşitlemeler varsa, birden çok modeli eğitmek için veri kümenizi segmentlere ayırmayı göz önünde bulundurun.

  • Biçimleri, belge türlerini ve yapıyı hesaplayarak dengeli bir veri kümeniz olduğundan emin olun.

Oluşturulan modeller hakkında daha fazla bilgi edinin.

Özel modeli yeniden eğitebilir miyim?

Belge Yönetim Bilgileri'nin açık bir yeniden eğitme işlemi yoktur. Her tren işlemi yeni bir model oluşturur.

Modelinizin yeniden eğitilmesi gerektiğini fark ederseniz, eğitim veri kümenize daha fazla örnek ekleyin ve yeni bir model eğitin.

Tek bir özel modelde kaç özel model oluşturabilirim?

Model Oluşturma işlemiyle, tek bir model kimliğine en fazla 200 model atayabilirsiniz. Oluşturulan model kimliğiyle istek yaptığınızda Analyze Document , Belge Gösterimi gönderilen formu sınıflandırır, en iyi modeli seçer ve sonuçları döndürür. Model Oluşturma şu anda yalnızca etiketlerle eğitilen özel modeller için kullanılabilir.

Oluşturulan modelleri kullanarak belgeyi çözümlemek, tek bir model kullanarak belgeyi çözümlemekle aynıdır. Sonuç, Analyze Document belgeyi analiz etmek için hangi bileşen modellerini seçtiğinizi gösteren bir docType özellik döndürür. Tek bir özel model veya oluşturulmuş bir özel model kullanarak belgeyi analiz etmek için fiyatlandırmada bir değişiklik yoktur.

Oluşturulan modeller hakkında daha fazla bilgi edinin.

Oluşturmak istediğim model sayısı oluşturulan modelin üst sınırını aşarsa alternatifler nelerdir?

Şu alternatiflerden birini kullanabilirsiniz:

  • Özel modeli çağırmadan önce belgeleri sınıflandırın. Kod, normal ifadeler veya arama gibi kaynakları kullanarak okuma modelini kullanabilir ve belgelerden ayıklanan metinleri ve belirli tümcecikleri temel alan bir sınıflandırma oluşturabilirsiniz.

  • Aynı alanları çeşitli yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış belgelerden ayıklamak istiyorsanız, derin öğrenme özel sinir modelini kullanmayı göz önünde bulundurun. Özel şablon modeli ile özel sinir modeli arasındaki farklar hakkında daha fazla bilgi edinin.

modeli ilk eğitimin ötesinde Nasıl yaparım? daraltın?

Her eğitim işlemi yeni bir model oluşturur.

  1. Yeni şablonunuz için bir veri kümesi oluşturun.

  2. Yeni bir modeli etiketleyip eğitin.

  3. Yeni modelin belirli belge türleriniz için iyi performans sergilediğini doğrulayın.

  4. Mevcut modelle yeni modelinizi tek bir uç noktada oluşturma. Daha sonra Belge Zekası, analiz edilecek her belge için en iyi modeli belirleyebilir.

Oluşturulan modeller hakkında daha fazla bilgi edinin.

Özel bir model oluşturuyorum. İmza algılama etiketi ne döndürür?

İmza algılama , belgeyi imzalayan kişinin kimliğini değil, imzanın varlığını arar.

Model imza algılama için imzasız döndürürse, model tanımlı alanda imza bulamadı.

Neleri dikkate almalı ve belgelerden tablo ayıklamaya yönelik en iyi yöntemler nelerdir?

Belgelerden ve görüntülerden metinleri, tabloları, seçim işaretlerini ve yapı bilgilerini ayıklamak için Belge Yönetim Bilgileri düzen modeliyle başlayabilirsiniz. Aşağıdaki faktörleri de göz önünde bulundurabilirsiniz:

  • Ayıklamak istediğiniz veriler tablo olarak sunuluyor mu ve tablo yapısı anlamlı mı?

  • Veriler tablo biçiminde değilse, veriler iki boyutlu bir kılavuza sığabilir mi?

  • Tablolarınız birden çok sayfaya yayılsın mı? Bu durumda, tüm sayfaları etiketlemek zorunda kalmamak için Belge Yönetim Bilgileri'ne göndermeden önce PDF'yi sayfalara bölün. Analizden sonra sayfaları tek bir tabloya işleyin.

  • Özel modeller oluşturuyorsanız Tablo olarak etiketleme bölümüne bakın. Dinamik tabloların her sütun için değişken sayıda satırı vardır. Sabit tabloların her sütun için sabit sayıda satırı vardır.

Eğitilen modellerimi bir ortamdan (beta gibi) başka bir ortama (üretim gibi) nasıl taşıyabilirim?

Bir Belge Yönetim Bilgileri hesabından desteklenen herhangi bir coğrafi bölgede bulunan diğer kişilere özel modelleri kopyalamak için Kopyalama API'sini kullanabilirsiniz. Ayrıntılı yönergeler için bkz . Olağanüstü durum kurtarma.

Kopyalama işlemi, modeli eğittiğiniz belirli bir bulut ortamındaki modelleri kopyalamayla sınırlıdır. Örneğin, modellerin genel buluttan Azure Kamu buluta kopyalanması desteklenmez.

Özel eğitim çalıştırılırken neden düzen için ücretlendirildim?

Veri kümeniz için etiket oluşturmak için düzen gereklidir. Özel eğitim için kullandığınız veri kümesinde kullanılabilir etiket dosyaları yoksa, hizmet bunları sizin için oluşturur.

Storage account

Birkaç gün önce depolama hesabıma erişebildim. Neden şimdi yeniden bağlanırken sorun yaşıyorum?

Paylaşılan erişim imzası oluşturduğunuzda varsayılan süre 48 saattir. 48 saat sonra yeni bir belirteç oluşturmanız gerekir.

Belge Yönetim Bilgileri ile depolama hesabınızı kullandığınız süre için daha uzun bir süre ayarlamayı göz önünde bulundurun.

Depolama hesabım bir sanal ağın veya güvenlik duvarının arkasındaysa, verilerde Belge Zekası'na nasıl erişim verebilirim?

Sanal ağ veya güvenlik duvarı tarafından korunan bir Azure depolama hesabınız varsa, Belge Zekası depolama hesabınıza doğrudan erişemez. Ancak özel Azure depolama hesabı erişimi ve kimlik doğrulaması, Azure kaynakları için yönetilen kimlikleri destekler. Yönetilen kimlik kullandığınızda, Belge Yönetim Bilgileri hizmeti atanmış kimlik bilgilerini kullanarak depolama hesabınıza erişebilir.

FoTT kullanarak özel depolama hesabı verilerinizi analiz etmek istiyorsanız, aracı sanal ağın veya güvenlik duvarının arkasına dağıtmanız gerekir.

Belge Yönetim Bilgileri kaynağınız için yönetilen kimlik oluşturmayı ve kullanmayı öğrenin.

Belge Makine Zekası Stüdyosu

Document Intelligence Studio'ya erişmek için hangi izinlere ihtiyacım var?

Document Intelligence Studio'ya erişmek için en az Okuyucu rolüne sahip etkin bir Azure hesabınız ve aboneliğiniz olmalıdır.

Belge analizi ve önceden oluşturulmuş modeller için kullanıcı senaryoları için rol gereksinimleri şunlardır:

  • Temel

  • Gelişmiş

    • Katkıda Bulunan: Kaynak grubu veya Belge Yönetim Bilgileri kaynağı oluşturmak için bu role ihtiyacınız vardır. Katkıda Bulunan rolü Bilişsel Hizmetler anahtarlarını listelemenize izin vermez. Document Intelligence Studio'yu kullanmak için Bilişsel Hizmetler Kullanıcı rolüne sahip olmanız gerekir.

Özel model projeleri için, kullanıcı senaryoları için rol gereksinimleri şunlardır:

  • Temel

  • Gelişmiş

    • Depolama Hesap Katkıda Bulunanı: Depolama hesabının çıkış noktaları arası kaynak paylaşımı (CORS) ayarlarını ayarlaması için bu role ihtiyacınız vardır. Aynı depolama hesabını yeniden kullanırsanız bu tek seferlik bir çabadır.

      Katkıda Bulunan rolü blobunuzdaki verilere erişmenize izin vermez. Document Intelligence Studio'yu kullanmak için Depolama Blob Verileri Katkıda Bulunanı rolüne sahip olmanız gerekir.

    • Katkıda Bulunan: Kaynak grubu ve kaynak oluşturmak için bu role ihtiyacınız vardır. Katkıda Bulunan rolü, oluşturulan kaynakları veya depolama alanını kullanmanıza izin vermez. Document Intelligence Studio'yu kullanmak için temel rollere ihtiyacınız vardır.

Daha fazla bilgi için Bkz. Microsoft Entra yerleşik rolleri ve Document Intelligence Studio hızlı başlangıcındaki Azure rol atamaları hakkındaki bölümler.

Bir belgede birden çok sayfam var. Document Intelligence Studio'da neden yalnızca iki sayfa analiz edilir?

Serbest katmanlı (F0) kaynaklar için, Document Intelligence Studio, REST API veya SDK'ları kullanmanız fark etmeksizin yalnızca ilk iki sayfa analiz edilir.

Document Intelligence Studio'da Ayarlar (dişli) düğmesini seçin, Kaynaklar sekmesini seçin ve belgeleri analiz etmek için kullandığınız fiyat katmanını denetleyin. Belgedeki tüm sayfaları analiz etmek istiyorsanız, ücretli (S0) bir kaynağa geçin.

Document Intelligence Studio'da dizinleri veya abonelikleri nasıl değiştirebilirim?

Document Intelligence Studio'da bir dizini değiştirmek için Ayarlar (dişli) düğmesini seçin. Dizin'in altında listeden dizini seçin ve ardından Dizini Değiştir'i seçin. Dizini değiştirdikten sonra yeniden oturum açmanız istenir.

Aboneliği veya kaynağı değiştirmek için Ayarlar altındaki Kaynak sekmesine gidin.

Depolama hesabı kaynağım bir güvenlik duvarı veya sanal ağ ile yapılandırıldığında proje paylaşımı, otomatik etiketleme veya OCR yükseltme işleminde neden depolama hatası alıyorum?

Azure kaynaklarınızı ayarlamak için Belge Zekası için yönetilen kimlikler bölümüne bakın.

Belge Yönetim Bilgileri kaynağım bir güvenlik duvarı veya sanal ağ ile yapılandırıldığında otomatik etiketleme veya OCR yükseltme işleminde neden "Sanal Ağ/Güvenlik duvarı kuralları nedeniyle erişim reddedildi" hatasını alıyorum?

Belge Yönetim Bilgileri kaynağınızın güvenlik duvarı izin verilenler listesine 20.3.165.95 ayrılmış IP adresini eklemeniz gerekir.

Document Intelligence Studio'dan etiketleme deneyimini yeniden kullanabilir veya özelleştirebilir ve kendi uygulamamda oluşturabilir miyim?

Evet. Document Intelligence Studio'daki etiketleme deneyimi Toolkit deposunda açık kaynak.

Özel projemi açarken neden "Form Tanıma Bulunamadı" hatasını alıyorum?

Bu özel projeye bağlı Belge Yönetim Bilgileri kaynağınız silindi veya başka bir kaynak grubuna taşındı. Bu sorunu çözmenin iki yolu vardır:

  • Belge Yönetim Bilgileri kaynağını aynı abonelik ve kaynak grubu altında aynı ada sahip yeniden oluşturun.

  • Geçirilen Belge Yönetim Bilgileri kaynağıyla özel bir projeyi yeniden oluşturun ve aynı depolama hesabını belirtin.

Kapsayıcılar

Belge Yönetim Bilgileri kapsayıcılarını kullanmak için İnternet bağlantısına ihtiyacım var mı?

Evet. Belge Yönetim Bilgileri kapsayıcıları, faturalama bilgilerini Azure'a göndermek için İnternet bağlantısı gerektirir. Azure kapsayıcı güvenliği hakkında daha fazla bilgi edinin.

Bağlantısı kesilmiş ve bağlı kapsayıcılar arasındaki fark nedir?

Bağlan kapsayıcılar, Azure hesabınızda bir Belge Yönetim Bilgileri kaynağı kullanarak faturalama bilgilerini Azure'a gönderir. Bağlı kapsayıcılarda faturalama bilgilerini Azure'a göndermek için İnternet bağlantısı gerekir.

Bağlantısı kesilmiş kapsayıcılar , İnternet bağlantısı kesilmiş API'leri kullanmanıza olanak tanır. Fatura bilgileri internet üzerinden gönderilmez. Bunun yerine satın alınan taahhüt katmanına göre ücretlendirilirsiniz. Şu anda, belge yönetim bilgileri özel ve fatura modellerinde bağlantısız kapsayıcı kullanımı kullanılabilir.

Bağlı ve bağlantısı kesilmiş kapsayıcılarda sağlanan model özellikleri aynıdır ve Document Intelligence v2.1 tarafından desteklenir.

Bağlı kapsayıcılar buluta hangi verileri gönderir?

Document Intelligence bağlı kapsayıcıları, Azure hesabınızda bir Belge Yönetim Bilgileri kaynağı kullanarak faturalama bilgilerini Azure'a gönderir. Bağlan kapsayıcılar, analiz edilen görüntü veya metin gibi müşteri verilerini Microsoft'a göndermez.

Bağlı kapsayıcıların faturalama için Microsoft'a gönderdiği bilgilere bir örnek için bkz. Azure AI kapsayıcısı hakkında SSS.

Neden şu hatayı alıyorum: "Kapsayıcı geçerli durumda değil. Abonelik doğrulaması 'OutOfQuota' API anahtarı kota dışında" durumuyla başarısız oldu mu?

Document Intelligence bağlı kapsayıcıları, Azure hesabınızda bir Belge Yönetim Bilgileri kaynağı kullanarak faturalama bilgilerini Azure'a gönderir. Kapsayıcılar faturalama uç noktasıyla iletişim kuramıyorsa bu iletiyi alabilirsiniz.

Belge Yönetim Bilgileri Örnek Etiketleme Aracı (FOTT) kapsayıcısı için yerel depolama kullanabilir miyim?

FOTT,yerel depolama kullanan bir sürüme sahiptir. Sürümün bir Windows makinesine yüklenmesi gerekir. Bu konumdan yükleyebilirsiniz.

Proje sayfasında, etiket dosyalarınız bir alt dizindeyse etiket klasörü URI'sini /shared veya /shared/sub-dir olarak belirtin. Diğer tüm Belge Yönetim Bilgileri Örnek Etiketleme Aracı davranışı barındırılan hizmetle aynıdır.

Ölçeği artırmak için en iyi yöntem hangisidir?

Zaman uyumsuz çağrılar için paylaşılan depolama ile birden çok kapsayıcı çalıştırabilirsiniz. Analiz çağrısını POST işleyen kapsayıcı çıktıyı depolama alanında depolar. Daha sonra, diğer tüm kapsayıcılar depolamadan sonuçları getirebilir ve çağrıları GET sunar. İstek kimliği bir kapsayıcıya bağlı değil.

Zaman uyumlu çağrılar için birden çok kapsayıcı çalıştırabilirsiniz, ancak yalnızca bir kapsayıcı bir isteğe hizmet eder. Engelleyici bir çağrı olduğundan, havuzdaki herhangi bir kapsayıcı isteğe hizmet edebilir ve yanıtı gönderebilir. Burada, aynı anda bir isteğe yalnızca bir kapsayıcı bağlanır ve yoklama gerekmez.

Paylaşılan depolama ile kapsayıcıları nasıl ayarlayabilirim?

Kapsayıcılar, işlem dosyalarını depolamak Mounts:Shared üzere paylaşılan depolamayı belirtmek için başlatılırken özelliğini kullanır. Bu özelliğin kullanımını görmek için kapsayıcı belgelerine bakın.

Güvenlik ve gizlilik

Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama yöntemleri ve gereksinimleri nelerdir?

Bir Azure hizmetine yapılan her istek bir kimlik doğrulama üst bilgisi içermelidir. Birkaç yöntem kullanarak isteğin kimliğini doğrulayabilirsiniz:

Belge Yönetim Bilgileri verilerimi depolar mı?

Tüm özellikler için, Belge Zekası verileri ve sonuçları azure Depolama istekle aynı bölgede geçici olarak depolar. Ardından verileriniz, analiz isteği gönderdiğiniz tarihten itibaren 24 saat içinde silinir.

Belge Zekası için veriler, gizlilik ve güvenlik hakkında daha fazla bilgi edinin.

Eğitilen özel modellerim Belge Zekası'nda nasıl depolanır ve kullanılır?

Analiz ve etiketlemeden sonraki ara çıkışlar, eğitim verilerinizi depoladığınız Azure Depolama konumunda depolanır. Eğitilen özel modeller azure Depolama aynı bölgede depolanır ve Azure aboneliğiniz ve API kimlik bilgilerinizle mantıksal olarak yalıtılır.

Daha fazla yardım ve destek

Azure AI Belge Zekası sorularım için daha fazla çözümü nereden bulabilirim?

Microsoft Soru-Cevap , Microsoft'ta teknik sorulara ve yanıtlara ev sahipliği yaptı. Belge Yönetim Bilgileri'ne özgü sorguları filtreleyebilirsiniz.

Belgeleri etiketlerken hizmet belirli bir metni tanımıyorsa veya yanlış algılarsa ne yapmalıyım?

Belge Zekası OCR modelini sürekli güncelleştirip geliştiriyoruz. Belge Zekası ekibine e-posta gönderebilirsiniz. Mümkünse, sorunun vurgulandığı bir örnek belge paylaşın.