Aracılığıyla paylaş


Besin - PDF'den Ayıklama (Önizleme)

Besin Belgesi Dönüştürücü Ayıklama eylemleriyle güçlü PDF metin ve veri ayıklamanın kilidini açın. Metni, verileri sorunsuz bir şekilde alın, anahtar-değer çiftlerini ayıklayın ve taranan belgeleri işlemek için OCR teknolojisinden yararlanın. Dizin oluşturma, arama, içerik analizi ve yapılandırılmış veri iş akışları için idealdir.

Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:

Hizmet Class Bölgeler
Copilot Studio Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Logic Apps Standart Aşağıdakiler dışında tüm Logic Apps bölgeleri :
     - Azure Kamu bölgeleri
     - Azure Çin bölgeleri
     - ABD Savunma Bakanlığı (DoD)
Power Apps Premium Aşağıdakiler dışında tüm Power Apps bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Power Automate Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
İletişim
İsim Besin (eski adıyla Muhimbi) Desteği
URL https://support.nutrient.io/hc/en-us/requests/new
E-posta support+low-code@nutrient.io
Bağlayıcı Meta Verileri
Publisher Muhimbi besin olarak ticaret
Web sitesi https://www.nutrient.io/low-code/
Gizlilik ilkesi https://www.nutrient.io/legal/privacy/
Kategoriler Işbirliği; İçerik ve Dosyalar

PDF'lerden metin ve veri ayıklama

Besin Belgesi Dönüştürücüsü, Power Automate'teki otomatik iş akışlarının bir parçası olarak PDF dosyalarından metin, veri veya belirli sayfaları ayıklamanıza olanak tanır. Ayrıca OCR kullanarak görüntülerden metin ayıklayabilirsiniz.

Kullanılabilir eylemler

İş akışlarınızda bu eylemleri uygulamayla ilgili adım adım yönergeler için bağlantılı kılavuzlara bakın.

Önkoşullar

Besin Belgesi Dönüştürücüsü'nü kullanmak için ücretsiz veya deneme hesabınız olmalıdır. Bu hesap türleri arasındaki farkları anlamak için karşılaştırma kılavuzuna bakın.

Başlangıç Yapmak

Besin Belgesi Dönüştürücüsü bağlayıcısını kullanmaya başlamak için aşağıdaki adımları izleyin:

Bilinen sorunlar ve sınırlamalar

IRM, DRM, RMS veya AIP çözümleriyle korunan belgeler güvenlik kısıtlamaları nedeniyle işlenemez.

Sorular veya yardım için Destek ekibimize başvurun.

Azaltma Sınırları

Name Çağrılar Yenileme Dönemi
Bağlantı başına API çağrıları 100 60 saniye

Eylemler

OCR kullanarak PDF dosyasından metin ayıklama

Taranan belgelerden veya görüntülerden OCR teknolojisini kullanarak metin ayıklayarak aranabilir ve düzenlenebilir olmasını sağlayın.

PDF belgesinden anahtar değer çiftlerini ayıklama

Formları veya yapılandırılmış veri iş akışlarını işlemek için belgelerden anahtar-değer çiftlerini belirleyin ve ayıklayın.

PDF belgesinden metin ayıklama

Kolay dizin oluşturma, arama veya içerik analizi için PDF belgelerinden metin içeriği alın.

OCR kullanarak PDF dosyasından metin ayıklama

Taranan belgelerden veya görüntülerden OCR teknolojisini kullanarak metin ayıklayarak aranabilir ve düzenlenebilir olmasını sağlayın.

Parametreler

Name Anahtar Gerekli Tür Description
Kaynak dosya adı
source_file_name True string

Uzantı da dahil olmak üzere kaynak dosyanın adı

Kaynak dosya içeriği
source_file_content True byte

Dosyanın OCR'ye içeriği

Language
language enum

Language

X Koordinatı
x string

X Koordinatı (Pts'de, bir inçin 1/72'sinde)

Y Koordinatı
y string

Y Koordinatı (Pts'de, bir inçin 1/72'sinde)

Genişlik
width string

OCR alanının genişliği (Pts cinsinden, bir inçin 1/72'si)

Yükseklik
height string

OCR alanının yüksekliği (Pts cinsinden, bir inçin 1/72'sinde)

Sayfa numarası
page_number string

Sayfa numarası (OCR tüm sayfalarda boş bırakın)

Performance
performance enum

Performans ()

Kara Liste / beyaz liste
characters_option enum

Karakterler seçeneği

Karakter
characters string

Kara listeye veya beyaz listeye alınacak karakterler

Sayfalandırmayı kullanma
paginate boolean

Ilerlemek

Hatada başarısız oldu
fail_on_error boolean

Hatada başarısız oldu

Döndürülenler

OCRText işlemi için yanıt verileri

PDF belgesinden anahtar değer çiftlerini ayıklama

Formları veya yapılandırılmış veri iş akışlarını işlemek için belgelerden anahtar-değer çiftlerini belirleyin ve ayıklayın.

Parametreler

Name Anahtar Gerekli Tür Description
Kaynak dosya adı
source_file_name True string

Uzantı da dahil olmak üzere kaynak dosyanın adı

Kaynak dosya içeriği
source_file_content True byte

Dönüştürülecek dosyanın içeriği

OCR Dili
ocr_language string

OCR ve KVP ayıklama için '+' ile ayrılmış dil kodları. Örneğin, 'eng+deu+fra' İngilizce, Almanca ve Fransızca ekler.

DPİ
dpi enum

PDF'deki boş sayfaları kaldırma

KVP Çıkış Biçimi
kvp_format enum

Çıkış biçimleri virgülle ayrılmıştır. KVP verileri JSON, CSV ve XML'de çıkış olabilir. e.g. json,csv,xml

Sayfa Aralığı
page_range string

KVP tarafından işlenecek sayfalar. 1 ile 5 arası sayfalar için '1 - 5' dizesini kullanın veya 1. ve 5. ve 6. sayfaları belirtmek için '1, 5, 6' dizesini kullanın.

Autorotate
autorotate enum

Metin doğru yönlendirmeye sahip değilse, bunu 'Evet' olarak ayarlamak sayfaları otomatik olarak döndürür.

Simgeleri Kırp
trim_symbols enum

Bunu 'Evet' olarak ayarlamak, '#' karması veya nokta '.' simgeleri hariç olmak üzere değerlerin başlangıcından/sonundan tüm simgeleri kaldırır.

Anahtar Sınırlama Kutusu Ekle
include_key_bounding_box enum

Çıkışa anahtarın sınırlayıcı kutu değerlerini ekleyin

Değer Sınırlama Kutusu Ekle
include_value_bounding_box enum

Değer için sınırlayıcı kutu değerlerini çıkışa ekleyin

Sayfa Numarası Ekle
include_page_number enum

Çıkışa anahtar değer çifti için sayfa numarasını ekleyin

Güveni Dahil Et
include_confidence enum

Çıkışa anahtar değer çifti için güvenilirlik puanını ekleyin. Güvenilirlik 0 (güven yok) ile 100 (tam güven) arasında ölçülür.

Güvenilirlik Eşiği
confidence_threshold integer

Bir anahtar değer çiftinin çıkışa dahil edilmesi için ulaşması gereken güvenilirlik eşiği. Eşik altındaki sonuçlar atılır.

Ekleme Türü
include_type enum

Çıkışa anahtar değer çifti için veri türünü ekleyin

Beklenen Anahtarlar
expected_keys string

Beklenen anahtarları ve eş anlamlıları içeren JSON dizesi

Hatada başarısız oldu
fail_on_error boolean

Hatada başarısız oldu

Döndürülenler

Tüm işlemler için yanıt verileri

PDF belgesinden metin ayıklama

Kolay dizin oluşturma, arama veya içerik analizi için PDF belgelerinden metin içeriği alın.

Parametreler

Name Anahtar Gerekli Tür Description
Kaynak dosya adı
source_file_name True string

Uzantı da dahil olmak üzere kaynak dosyanın adı

Kaynak dosya içeriği
source_file_content True byte

Dönüştürülecek dosyanın içeriği

Sayfa Aralığı
page_range string

1,5,8-12 gibi bir kaynaktan metin ayıklamak için sayfa aralığı

Hatada başarısız oldu
fail_on_error boolean

Hatada başarısız oldu

Döndürülenler

Tüm işlemler için yanıt verileri

Tanımlar

ocr_operation_response

OCRText işlemi için yanıt verileri

Name Yol Tür Description
Dış metin
out_text string

Düz metinde ayıklanan OCRed metni.

Temel dosya adı
base_file_name string

Uzantı olmadan giriş dosyasının adı.

Sonuç kodu
result_code enum

İşlem sonuç kodu.

Sonuç ayrıntıları
result_details string

İşlem sonucu ayrıntıları.

operation_response

Tüm işlemler için yanıt verileri

Name Yol Tür Description
İşlenen dosya içeriği
processed_file_content byte

Muhimbi dönüştürücüsü tarafından oluşturulan dosya.

Temel dosya adı
base_file_name string

Uzantı olmadan giriş dosyasının adı.

Sonuç kodu
result_code enum

İşlem sonuç kodu.

Sonuç ayrıntıları
result_details string

İşlem sonucu ayrıntıları.