Besin - PDF'den Ayıklama (Önizleme)
Besin Belgesi Dönüştürücü Ayıklama eylemleriyle güçlü PDF metin ve veri ayıklamanın kilidini açın. Metni, verileri sorunsuz bir şekilde alın, anahtar-değer çiftlerini ayıklayın ve taranan belgeleri işlemek için OCR teknolojisinden yararlanın. Dizin oluşturma, arama, içerik analizi ve yapılandırılmış veri iş akışları için idealdir.
Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:
| Hizmet | Class | Bölgeler |
|---|---|---|
| Copilot Studio | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Logic Apps | Standart | Aşağıdakiler dışında tüm Logic Apps bölgeleri : - Azure Kamu bölgeleri - Azure Çin bölgeleri - ABD Savunma Bakanlığı (DoD) |
| Power Apps | Premium | Aşağıdakiler dışında tüm Power Apps bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| Power Automate | Premium | Aşağıdakiler dışında tüm Power Automate bölgeleri : - ABD Kamu (GCC) - US Government (GCC High) - 21Vianet tarafından işletilen Çin Bulutu - ABD Savunma Bakanlığı (DoD) |
| İletişim | |
|---|---|
| İsim | Besin (eski adıyla Muhimbi) Desteği |
| URL | https://support.nutrient.io/hc/en-us/requests/new |
| E-posta | support+low-code@nutrient.io |
| Bağlayıcı Meta Verileri | |
|---|---|
| Publisher | Muhimbi besin olarak ticaret |
| Web sitesi | https://www.nutrient.io/low-code/ |
| Gizlilik ilkesi | https://www.nutrient.io/legal/privacy/ |
| Kategoriler | Işbirliği; İçerik ve Dosyalar |
PDF'lerden metin ve veri ayıklama
Besin Belgesi Dönüştürücüsü, Power Automate'teki otomatik iş akışlarının bir parçası olarak PDF dosyalarından metin, veri veya belirli sayfaları ayıklamanıza olanak tanır. Ayrıca OCR kullanarak görüntülerden metin ayıklayabilirsiniz.
Kullanılabilir eylemler
- Anahtar-değer çiftlerini ayıklama
- OCR kullanarak metin ayıklama
- PDF'lerden veri ayıklama
- PDF sayfalarını ayıklama
- Resimlerden metin ayıklama
- Power Automate kullanarak PDF'lerden metin ayıklama
İş akışlarınızda bu eylemleri uygulamayla ilgili adım adım yönergeler için bağlantılı kılavuzlara bakın.
Önkoşullar
Besin Belgesi Dönüştürücüsü'nü kullanmak için ücretsiz veya deneme hesabınız olmalıdır. Bu hesap türleri arasındaki farkları anlamak için karşılaştırma kılavuzuna bakın.
Başlangıç Yapmak
Besin Belgesi Dönüştürücüsü bağlayıcısını kullanmaya başlamak için aşağıdaki adımları izleyin:
- Bu formu doldurarak 30 günlük deneme için kaydolun.
- Formu gönderdikten sonra, deneme etkinleştirme ayrıntılarınızı içeren bir e-posta alırsınız.
- İşlemin izlenecek yolu için başlangıç videosuna bakın.
- Ayrıntılı yönergeler için Power Automate için Belge Dönüştürücüsü kılavuzunu okuyun.
- Pratik örnekler için Power Automate ve Logic Apps öğreticilerini keşfedin.
Bilinen sorunlar ve sınırlamalar
IRM, DRM, RMS veya AIP çözümleriyle korunan belgeler güvenlik kısıtlamaları nedeniyle işlenemez.
Sorular veya yardım için Destek ekibimize başvurun.
Azaltma Sınırları
| Name | Çağrılar | Yenileme Dönemi |
|---|---|---|
| Bağlantı başına API çağrıları | 100 | 60 saniye |
Eylemler
| OCR kullanarak PDF dosyasından metin ayıklama |
Taranan belgelerden veya görüntülerden OCR teknolojisini kullanarak metin ayıklayarak aranabilir ve düzenlenebilir olmasını sağlayın. |
| PDF belgesinden anahtar değer çiftlerini ayıklama |
Formları veya yapılandırılmış veri iş akışlarını işlemek için belgelerden anahtar-değer çiftlerini belirleyin ve ayıklayın. |
| PDF belgesinden metin ayıklama |
Kolay dizin oluşturma, arama veya içerik analizi için PDF belgelerinden metin içeriği alın. |
OCR kullanarak PDF dosyasından metin ayıklama
Taranan belgelerden veya görüntülerden OCR teknolojisini kullanarak metin ayıklayarak aranabilir ve düzenlenebilir olmasını sağlayın.
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
Kaynak dosya adı
|
source_file_name | True | string |
Uzantı da dahil olmak üzere kaynak dosyanın adı |
|
Kaynak dosya içeriği
|
source_file_content | True | byte |
Dosyanın OCR'ye içeriği |
|
Language
|
language | enum |
Language |
|
|
X Koordinatı
|
x | string |
X Koordinatı (Pts'de, bir inçin 1/72'sinde) |
|
|
Y Koordinatı
|
y | string |
Y Koordinatı (Pts'de, bir inçin 1/72'sinde) |
|
|
Genişlik
|
width | string |
OCR alanının genişliği (Pts cinsinden, bir inçin 1/72'si) |
|
|
Yükseklik
|
height | string |
OCR alanının yüksekliği (Pts cinsinden, bir inçin 1/72'sinde) |
|
|
Sayfa numarası
|
page_number | string |
Sayfa numarası (OCR tüm sayfalarda boş bırakın) |
|
|
Performance
|
performance | enum |
Performans () |
|
|
Kara Liste / beyaz liste
|
characters_option | enum |
Karakterler seçeneği |
|
|
Karakter
|
characters | string |
Kara listeye veya beyaz listeye alınacak karakterler |
|
|
Sayfalandırmayı kullanma
|
paginate | boolean |
Ilerlemek |
|
|
Hatada başarısız oldu
|
fail_on_error | boolean |
Hatada başarısız oldu |
Döndürülenler
OCRText işlemi için yanıt verileri
PDF belgesinden anahtar değer çiftlerini ayıklama
Formları veya yapılandırılmış veri iş akışlarını işlemek için belgelerden anahtar-değer çiftlerini belirleyin ve ayıklayın.
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
Kaynak dosya adı
|
source_file_name | True | string |
Uzantı da dahil olmak üzere kaynak dosyanın adı |
|
Kaynak dosya içeriği
|
source_file_content | True | byte |
Dönüştürülecek dosyanın içeriği |
|
OCR Dili
|
ocr_language | string |
OCR ve KVP ayıklama için '+' ile ayrılmış dil kodları. Örneğin, 'eng+deu+fra' İngilizce, Almanca ve Fransızca ekler. |
|
|
DPİ
|
dpi | enum |
PDF'deki boş sayfaları kaldırma |
|
|
KVP Çıkış Biçimi
|
kvp_format | enum |
Çıkış biçimleri virgülle ayrılmıştır. KVP verileri JSON, CSV ve XML'de çıkış olabilir. e.g. json,csv,xml |
|
|
Sayfa Aralığı
|
page_range | string |
KVP tarafından işlenecek sayfalar. 1 ile 5 arası sayfalar için '1 - 5' dizesini kullanın veya 1. ve 5. ve 6. sayfaları belirtmek için '1, 5, 6' dizesini kullanın. |
|
|
Autorotate
|
autorotate | enum |
Metin doğru yönlendirmeye sahip değilse, bunu 'Evet' olarak ayarlamak sayfaları otomatik olarak döndürür. |
|
|
Simgeleri Kırp
|
trim_symbols | enum |
Bunu 'Evet' olarak ayarlamak, '#' karması veya nokta '.' simgeleri hariç olmak üzere değerlerin başlangıcından/sonundan tüm simgeleri kaldırır. |
|
|
Anahtar Sınırlama Kutusu Ekle
|
include_key_bounding_box | enum |
Çıkışa anahtarın sınırlayıcı kutu değerlerini ekleyin |
|
|
Değer Sınırlama Kutusu Ekle
|
include_value_bounding_box | enum |
Değer için sınırlayıcı kutu değerlerini çıkışa ekleyin |
|
|
Sayfa Numarası Ekle
|
include_page_number | enum |
Çıkışa anahtar değer çifti için sayfa numarasını ekleyin |
|
|
Güveni Dahil Et
|
include_confidence | enum |
Çıkışa anahtar değer çifti için güvenilirlik puanını ekleyin. Güvenilirlik 0 (güven yok) ile 100 (tam güven) arasında ölçülür. |
|
|
Güvenilirlik Eşiği
|
confidence_threshold | integer |
Bir anahtar değer çiftinin çıkışa dahil edilmesi için ulaşması gereken güvenilirlik eşiği. Eşik altındaki sonuçlar atılır. |
|
|
Ekleme Türü
|
include_type | enum |
Çıkışa anahtar değer çifti için veri türünü ekleyin |
|
|
Beklenen Anahtarlar
|
expected_keys | string |
Beklenen anahtarları ve eş anlamlıları içeren JSON dizesi |
|
|
Hatada başarısız oldu
|
fail_on_error | boolean |
Hatada başarısız oldu |
Döndürülenler
Tüm işlemler için yanıt verileri
- Body
- operation_response
PDF belgesinden metin ayıklama
Kolay dizin oluşturma, arama veya içerik analizi için PDF belgelerinden metin içeriği alın.
Parametreler
| Name | Anahtar | Gerekli | Tür | Description |
|---|---|---|---|---|
|
Kaynak dosya adı
|
source_file_name | True | string |
Uzantı da dahil olmak üzere kaynak dosyanın adı |
|
Kaynak dosya içeriği
|
source_file_content | True | byte |
Dönüştürülecek dosyanın içeriği |
|
Sayfa Aralığı
|
page_range | string |
1,5,8-12 gibi bir kaynaktan metin ayıklamak için sayfa aralığı |
|
|
Hatada başarısız oldu
|
fail_on_error | boolean |
Hatada başarısız oldu |
Döndürülenler
Tüm işlemler için yanıt verileri
- Body
- operation_response
Tanımlar
ocr_operation_response
OCRText işlemi için yanıt verileri
| Name | Yol | Tür | Description |
|---|---|---|---|
|
Dış metin
|
out_text | string |
Düz metinde ayıklanan OCRed metni. |
|
Temel dosya adı
|
base_file_name | string |
Uzantı olmadan giriş dosyasının adı. |
|
Sonuç kodu
|
result_code | enum |
İşlem sonuç kodu. |
|
Sonuç ayrıntıları
|
result_details | string |
İşlem sonucu ayrıntıları. |
operation_response
Tüm işlemler için yanıt verileri
| Name | Yol | Tür | Description |
|---|---|---|---|
|
İşlenen dosya içeriği
|
processed_file_content | byte |
Muhimbi dönüştürücüsü tarafından oluşturulan dosya. |
|
Temel dosya adı
|
base_file_name | string |
Uzantı olmadan giriş dosyasının adı. |
|
Sonuç kodu
|
result_code | enum |
İşlem sonuç kodu. |
|
Sonuç ayrıntıları
|
result_details | string |
İşlem sonucu ayrıntıları. |