Aracılığıyla paylaş


Aquaforest PDF

Aquaforest PDF bağlayıcısı, Office 365 ve Power Automate için bölme, metin ayıklama, barkod ayıklama ve OCR işlemleri gibi farklı PDF işlemleri gerçekleştiren bir grup eylem içerir.

Bu bağlayıcı aşağıdaki ürün ve bölgelerde kullanılabilir:

Hizmet Class Bölgeler
Copilot Studio Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Logic Apps Standart Aşağıdakiler dışında tüm Logic Apps bölgeleri :
     - Azure Kamu bölgeleri
     - Azure Çin bölgeleri
     - ABD Savunma Bakanlığı (DoD)
Power Apps Premium Aşağıdakiler dışında tüm Power Apps bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
Power Automate Premium Aşağıdakiler dışında tüm Power Automate bölgeleri :
     - ABD Kamu (GCC)
     - US Government (GCC High)
     - 21Vianet tarafından işletilen Çin Bulutu
     - ABD Savunma Bakanlığı (DoD)
İletişim
İsim Aquaforest Desteği
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
E-posta support@aquaforest.com
Bağlayıcı Meta Verileri
Publisher Aquaforest Limited
Web sitesi https://www.aquaforest.com/en/aquaforest-connector.asp
Gizlilik ilkesi https://www.aquaforest.com/en/privacy policy.pdf
Kategoriler İçerik ve Dosyalar; Veri

Aquaforest PDF bağlayıcısı, Office 365 ve Flow için bölme, metin ayıklama, barkod ayıklama ve OCR işlemleri gibi farklı PDF işlemleri gerçekleştiren bir grup eylem içerir.

Önkoşullar

Her şeyden önce, bir Aquaforest PDF API Hesabı oluşturmanız gerekir. Bu hesap Aquaforest PDF Actions ve Aquaforest PDF API'sini yönetmek için kullanılır. Abonelik bu adrese bağlanacağından etkin e-posta adresinizi kullanın. Zaten bir hesabınız varsa burada oturum açmanız gerekir.

Kimlik bilgilerini alma

  1. Geliştirici portalında oturum açın, Ürünler sayfasına gidin ve abone olmak istediğiniz ürünü seçin.

  2. Abone ol düğmesine tıklayın

  3. Abonelik isteğinizi onaylamak için Onayla düğmesine tıklayın

  4. API anahtarlarınıza Profil sayfanızdan erişebilirsiniz

Bağlantı oluşturma

Bağlayıcı aşağıdaki kimlik doğrulama türlerini destekler:

Varsayılan Bağlantı oluşturmak için parametreler. Tüm bölgeler Paylaşılamaz

Temerrüt

Geçerli: Tüm bölgeler

Bağlantı oluşturmak için parametreler.

Bu, paylaşılabilir bir bağlantı değildir. Power app başka bir kullanıcıyla paylaşılıyorsa, başka bir kullanıcıdan açıkça yeni bağlantı oluşturması istenir.

İsim Türü Description Gerekli
API Anahtarı securestring Bu API için API Anahtarı Doğru

Azaltma Sınırları

Name Çağrılar Yenileme Dönemi
Bağlantı başına API çağrıları 100 60 saniye

Eylemler

Barkod değerini alma

PDF'den barkod alın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

OCR PDF veya resimler

Resim PDF'sinden veya taranmış görüntülerden aranabilir PDF oluşturun. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

PDF'den metin alma

Metin konumuna ve normal ifadelere göre PDF dosyalarından Metin Alma. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

PDF'den veri alma

Bu eylem, PDF dosyalarındaki önemli verileri Anahtar/Değer çiftleri biçiminde ayıklar.

PDF'i barkoda göre bölme

PDF dosyalarını kullanıcı tarafından tanımlanan barkod eşleşmelerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin. Buna ek olarak Aquaforest Zonal Extraction Tool [https://www.aquaforest.com/en/zone/get-pdf-zone.html] adresinde mevcuttur.

PDF'i metin eşleştirmeye göre bölme

PDF dosyalarını kullanıcı tarafından tanımlanan metin eşleşmelerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin. Buna ek olarak Aquaforest Zonal Extraction Tool [https://www.aquaforest.com/en/zone/get-pdf-zone.html] adresinde mevcuttur.

PDF'i sayfaya bölme

PDF dosyalarını, kullanıcı tarafından tanımlanan bölme seçeneklerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

PDF sayfalarını barkoda göre ayıklama

Kullanıcı tarafından tanımlanan barkod eşleşmelerine göre PDF dosyalarını ayıklayın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

PDF sayfalarını metne göre ayıklama

Kullanıcı tarafından tanımlanan metin eşleşmelerine göre PDF dosyalarını ayıklayın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

PDF özelliklerini alma

PDF dosyası hakkındaki bilgileri alır

Barkod değerini alma

PDF'den barkod alın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
Barkod Sonuç Şablonu
barcodeResultTemplate True string

Barkod bulunursa çıktı metin sonucu şablonu

Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Barkod Şablonu Yok
noBarcodeTemplate True string

Barkod bulunamazsa çıktı metin sonucu şablonu

Sayfa Ayırıcı
pageSeparator string

Sayfa sonlarının nerede olduğunu öğrenebilmeniz için bir sayfa ayırıcı sağlayın.

Sayfalar
pagerange string

Metin ayıklamak istediğiniz sayfa aralığını sağlayın; bu tek bir sayfa numarası (1), virgülle ayrılmış birden çok sayfa numarası (1,2,3), sayfa aralığı (1-4) veya tümünün (1,2,4-7) karışımı olabilir.

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Türü
barcodeFormats array of string

Tanımlamak istediğiniz Barkod türlerini belirtin

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Sayfa (Kullanım Dışı)
pagenumber integer

Bu özellik kullanım dışı bırakıldı, Pages özelliğini kullanmanızı öneririz. Pages özelliği tüm bölgelere uygulanır ve işlemek istediğiniz sayfaları seçmenize olanak tanır.

Desen
regex string

Burada normal bir ifade sağlanırsa, ayıklanan tüm metinleri bununla eşleştirip eşleşmeyi döndürüriz.

Döndürülenler

OCR PDF veya resimler

Resim PDF'sinden veya taranmış görüntülerden aranabilir PDF oluşturun. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
AquaforestImageTimeout
aquaforestImageTimeout integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Yazar
author string

Çıktı PDF belgesi özelliklerinde özel bir Yazar ayarlayın.

Otomatik döndürme
autorotate boolean

Resmi otomatik olarak döndür – bu, tüm metinlerin normal şekilde yönlendirilmesini sağlar

Binarize
binarize integer

Bu değer genellikle yalnızca teknik desteğin rehberliğinde kullanılmalıdır. Renkli görüntülerin işlenme şeklini denetleyebilir ve belirli bir eşikle binarizasyona zorlayabilir. 200 değerinin testlerde genel olarak iyi sonuçlar vereceği gösterilmiştir, ancak bunun "tipik" müşteri belgeleriyle doğrulanması gerekir. Bunu -1 olarak ayarlayarak, metni herhangi bir arka plan görüntüsünden veya renginden ayırmaya çalışacak alternatif bir yöntem kullanılır. Bu, gazete ve dergi sayfaları gibi belirli belgeler için geliştirilmiş OCR sonuçları verebilir.

Siyah piksel sınırı
blackPixelLimit float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Boş sayfa eşiği
blankPageThreshold integer

Bir sayfanın boş olarak kabul edilmemesi için görüntüde bulunması gereken en az "Piksellerde" sayısını ayarlamak için bunu kullanın. -1 değeri boş sayfa algılamayı kapatır.

Kutu boyutu
boxSize integer

Bu seçenek, bazen metnin etrafındaki kutuların bir alanın grafik olarak tanımlanmasına neden olabileceği formlar için idealdir. Bu seçenek, OCR altyapısı tarafından kullanılan görüntünün geçici kopyasından kutuları kaldırır. Son görüntüdeki kutuları kaldırmaz. Teknik olarak, bu seçenek en düşük alana (piksel cinsinden ve bu özellik tarafından tanımlanan) bağlı öğeleri kaldırır. Bu seçenek şu anda yalnızca çift tonlu görüntüler için uygulanmaktadır.

ConvertToTiff
convertToTiff boolean

PDF belgesindeki her sayfa bir TIFF görüntüsüne rasterleştirilir.

CreateProcess
createProcess boolean

pinvoke aracılığıyla işlemi başlatmak istiyorsanız bunu true olarak ayarlayın.

Oluşturma Tarihi
creationDate string

Çıktı PDF belgesi özelliklerinde özel oluşturma tarihi ayarlayın. Tarih dizesi 'yyyy-MM-dd HH:mm:ss' biçiminde olmalıdır.

Masa başı
deskew boolean

Görüntüyü düzeltin (düzeltin).

Despeckle
despeckle integer

Bu, görüntüde belirtilen şekilden daha küçük piksel cinsinden yükseklik veya genişlik içeren tüm bağlantısı kesilmiş öğeleri kaldırır. En yüksek değer 9, varsayılan değer ise 0'dır.

DictionaryLookup
dictionaryLookup integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Dotmatrix
dotmatrix boolean

Nokta vuruşlu yazı tiplerinin tanınmasını geliştirmek için bunu true olarak ayarlayın. Varsayılan değer yanlış'tır. Noktalı matris olmayan yazı tipleri için true olarak ayarlanırsa tanıma zayıf olabilir.

Hata ayıklama çıkışını etkinleştirme
enableDebugOutput boolean

Hata ayıklama çıkışını etkinleştirir.

PDF'i (MRC) Sıkıştırma
enableMrc boolean

Bu, renk taramalarından oluşan PDF'lerin çıkış boyutunu önemli ölçüde azaltabilen Karma Raster Sıkıştırmasını etkinleştirir. Bu seçeneğin yalnızca kaynak PDF olmadığında veya ConvertToTiff kullanıldığında uygun olduğunu unutmayın.

PDF/A Çıkışı
enablePDFAOutput boolean

PDF/A olarak çıkış yapılıp yapılmaması.

Hata modu
errorMode integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Kaynak dosya içeriği
fileContent True byte

Dosyanın OCR'ye içeriği

Uzantılı kaynak dosya adı
fileNameWithExtension True string

Uzantılı kaynak dosya adı veya yalnızca uzantı (başında '.' dönemi olan)

Çevirme algılama
flipDetect integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Gri tonlamalı kalite
grayscaleQuality integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Buluşsal yöntemler
heuristics integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Jbig2EncFlags
jbig2EncFlags string

Bunlar, PDF oluşturmada kullanılan görüntülerin JBIG2 sürümlerini oluşturmak için kullanılan uygulamaya geçirilecek bayraklardır (bu sıkıştırmanın etkinleştirildiği varsayılarak). Bu seçenek genellikle yalnızca teknik desteğin rehberliğinde kullanılmalıdır.

Language
language enum

Aşağıdaki seçeneklerden birinin seçilmesi, OCR işleme için kullanılacak dili ayarlar. Varsayılan dil İngilizce'dir.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

Bazen 1bpp olan ve LZW sıkıştırması olan bir görüntü varsa, ön işleme görüntünün renginin ters çevrilmesine (siyah-beyaz ve beyazdan siyaha) neden olabilir. Bundan kaçınmak için bunu true olarak ayarlayın.

En fazla masa dikme
maxDeskew float

Bir sayfanın masa üstü dikileceği maksimum açı. Bu seçenek genellikle yalnızca teknik destek (support@aquaforest.com ) yönergeleri altında kullanılmalıdır.

Minimum masaüstü güvenilirliği
minDeskewConfidence float

Bu seçenek genellikle yalnızca teknik destek (support@aquaforest.com ) yönergeleri altında kullanılmalıdır.

Değiştirme Tarihi
modifiedDate string

Çıktı PDF belgesi özelliklerinde özel bir değiştirme tarihi ayarlayın. Tarih dizesi 'yyyy-MM-dd HH:mm:ss' biçiminde olmalıdır.

Morph
morph string

OCR'nin önüne binarized görüntüye uygulanacak morfolojik seçenekler. Boş olarak ayarlanırsa hiçbiri uygulanmaz. Yaygın seçenekler arasında aşağıda listelenenler bulunur, ancak daha fazla seçenek için lütfen ile iletişime geçin support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Görüntünün arka plan kısmı için örnekleme boyutu. Sayı ne kadar yüksek olursa, ortalama için kullanılan görüntü bloklarının boyutu o kadar büyük olur ve bu da boyutun hem de kalitenin azalmasına neden olur. Varsayılan değer 3'dür

MrcForegroundFactor
mrcForegroundFactor integer

Görüntünün ön plan kısmı için örnekleme boyutu. Sayı ne kadar yüksek olursa, ortalama için kullanılan görüntü bloklarının boyutu o kadar büyük olur ve bu da boyutun hem de kalitenin azalmasına neden olur. Varsayılan değer 3'dür

MrcQuality
mrcQuality integer

Arka plan ve ön plan görüntülerini kaydederken kullanılan JPEG kalite ayarı (yüzde değeri 1 - 100). Varsayılan değer 75'tir

MrcTimeout
mrcTimeout integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

NoPictures
noPictures boolean

Varsayılan olarak, belgenin bir alanı grafik alanı olarak tanımlanırsa bu alanda OCR işlemi çalıştırilmez. Ancak, bazı belgeler "grafik" veya "resim" alanları olarak tanımlanan ancak aslında yararlı metinler içeren alanlar veya kutular içerebilir. NoPictures değerinin True olarak ayarlanması, resim olarak tanımlanan alanları yoksaymasına neden olurken, Resim olarak tanımlanan alanların OCR'sini Yanlış olarak ayarlamaya zorlar.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

OcrTimeout
ocrTimeout integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Şifre
password string

Kaynak PDF dosyasını açma parolası

PdfToImageBpp
pdfToImageBpp enum

1. altyapı kullanılırken rasterleştirilmiş PDF sayfası için kullanılacak Piksel Başına Bit sayısı. Bu yalnızca ConvertToTiff kullanılarak işlenen belgeler için geçerlidir. Bu özelliğin varsayılan değeri PDF sayfasından alınır.

PdfToImageCompression
pdfToImageCompression enum

Kaynak PDF dosyasının her sayfasından ayıklanan veya rasterleştirilmiş görüntülere ayarlamak için sıkıştırma. Bu görüntüler daha sonra aranabilir PDF'yi oluşturmak için OCRed olur. Bu özelliğin varsayılan değeri, kaynak PDF dosyasındaki her sayfadan alınır.

PdfToImageDpi
pdfToImageDpi enum

Kaynak PDF dosyasının her sayfasından rasterleştirilmiş görüntülere ayarlanacağı DPI. Bu görüntüler daha sonra aranabilir PDF'yi oluşturmak için OCRed olur. Bu özelliğin varsayılan değeri, kaynak PDF dosyasındaki her sayfadan alınır.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

Bu ayar, vektör nesneleri (ör. CAD çizimleri) içeren belgelerle ilgilenirken kullanışlıdır. Varsayılan olarak, yalnızca vektör nesneleri içeren sayfalar rasterleştirilir. Görüntü içermeyen ancak vektör nesneleri içeren sayfaların yanı sıra elektronik metinler rasterleştirmeden atlanır. Ancak, bazen vektör nesneleri (CAD çizimleri) içeren bir sayfa olabilir, ancak başlığı elektronik metinde olabilir. Bu gibi sayfaları taramaya zorlamak için bu özelliği true olarak ayarlayın.

PdfToImageIncludeText
pdfToImageIncludeText boolean

False olarak ayarlandığında, gerçek metnin (taranmış görüntünün parçası olan metnin aksine elektronik olarak oluşturulmuş) PDF'den ayıklanan sayfa görüntülerinde işlenmesini engeller. Bunun nedeni, metnin zaten aranabilir olması ve bu nedenle genellikle OCR gerektirmemesidir. Ancak bu gerçek metinde OCR gerekiyorsa değer True olarak ayarlanabilir.

PdfToImageMaxRes
pdfToImageMaxRes integer

Rasterleştirilmiş görüntülerin maksimum çözünürlüğü. PDF sayfasından alınan çözünürlük bu değerden büyükse, bu değere ayarlanır. Bu özelliğin varsayılan değeri 600'dür.

PdfToImageMinRes
pdfToImageMinRes integer

Rasterleştirilmiş görüntülerin minimum çözünürlüğü. PDF sayfasından alınan çözünürlük bu değerden düşükse, bu değere ayarlanır. Bu özelliğin varsayılan değeri 200'dür.

PDF/A Sürümü
pdfaVersion enum

PDF/A sürümü.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

RemoveBlankPage
removeBlankPage boolean

BlankPageThreshold -1'den büyük olduğunda ve ConvertToTiff doğru olduğunda boş sayfaları kaldırın.

RemoveLines
removeLines boolean

Görüntülerden satırları kaldırma daha iyi tanıma.

RestartEngineEvery
restartEngineEvery integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Yer işaretlerini tutma
retainBookmarks boolean

ConvertToTiff kullanılırken çıkıştaki kaynak dosyadaki yer işaretlerini korur.

Oluşturma tarihini koru
retainCreationDate boolean

Çıkış PDF belgesi özelliklerinde kaynak dosyanın oluşturma tarihini korur.

Meta verileri saklama
retainMetadata boolean

ConvertToTiff kullanılırken çıkıştaki kaynak dosyadaki tüm meta verileri korur.

Değiştirme tarihini koru
retainModifiedDate boolean

Çıktı PDF belgesi özelliklerinde kaynak dosyanın değiştirme tarihini korur.

Görüntüleyici tercihlerini koruma
retainViewerPreferences boolean

ConvertToTiff kullanılırken çıkıştaki kaynak dosyadaki PDF Görüntüleyici Tercihlerini, Sayfa Modunu ve Sayfa Düzenini korur.

SavePredespeckle
savePredespeckle boolean

Bu, çıktı PDF'sinde özgün görüntüyü (ön işleme uygulamadan önce) kullanır.

Tables
tables boolean

True olarak ayarlandığında bu seçenek, tablo hücreleri içinde OCR'yi dener.

TextLayerFilterHeight
textLayerFilterHeight integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterPercentage
textLayerFilterPercentage float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterRatio
textLayerFilterRatio float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterWidth
textLayerFilterWidth integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Düzenli mod
tidyUpMode integer

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

PDF/A'yı doğrulama
validatePDFA boolean

Dönüştürmeden sonra PDF/A belgesinin doğrulanıp doğrulanmayacağı

Sözcük eşleştirme eşiği
wordMatchThreshold float

Bu özelliği kullanma konusunda rehberlik için teknik desteğe (support@aquaforest.com) başvurun.

Döndürülenler

OCR işlemi için yanıt verileri

PDF'den metin alma

Metin konumuna ve normal ifadelere göre PDF dosyalarından Metin Alma. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Metin Eşleştirme Şablonu Yok
noTextTemplate True string

Eşleşme bulunamazsa döndürülecek metin şablonu

Sayfa Ayırıcı
pageSeparator string

Sayfa sonlarının nerede olduğunu öğrenebilmeniz için bir sayfa ayırıcı sağlayın.

Sayfalar
pagerange string

Metin ayıklamak istediğiniz sayfa aralığını sağlayın; bu tek bir sayfa numarası (1), virgülle ayrılmış birden çok sayfa numarası (1,2,3), sayfa aralığı (1-4) veya tümünün (1,2,4-7) karışımı olabilir.

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Metin Sonuç Şablonu
textResultTemplate True string

Eşleşme bulunursa döndürülecek metin şablonu

Değer
expression array of string

Yukarıdaki özellik ile kullanılacak bir veya daha fazla değeri buraya sağlayın, yukarıda belirtilen kuralla eşleşen ilk metin değerini döndüreceğiz.

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Sayfa (Kullanım Dışı)
pagenumber integer

Bu özellik kullanım dışı bırakıldı, Pages özelliğini kullanmanızı öneririz. Pages özelliği tüm bölgelere uygulanır ve işlemek istediğiniz sayfaları seçmenize olanak tanır.

Seç
position string

Daha fazla ayıkladığınız metni daraltmak için bunu kullanın, gereksinimlerinize uygun bir seçenek belirleyin

Desen
regex string

Burada normal bir ifade sağlanırsa, ayıklanan tüm metinleri bununla eşleştirip eşleşmeyi döndürüriz.

Döndürülenler

PDF'den veri alma

Bu eylem, PDF dosyalarındaki önemli verileri Anahtar/Değer çiftleri biçiminde ayıklar.

Parametreler

Name Anahtar Gerekli Tür Description
İsim
settingName True string

Ayarın adını buraya girin

Değer
settingValue True string

Ayarın değerini buraya girin.

Güvenilirlik Puanı
confidenceScore number

Değerleri daha düşük güvenle filtrelemek için daha yüksek bir güvenilirlik puanı ayarlayın. 0 ile 1 arasında herhangi bir değer ayarlayabilirsiniz. 0,5'ten başlamanızı öneririz

Tarih Dönüştürme
dateAsISO string

Tarih değerinin döndürüleceği biçimi seçin

Beklenen Anahtarlar
expectedKeys string

Değerleri JSON ayrıştırmadan sonraki eylemlerde kullanılabilir hale getirmek için satır başına bir anahtar adı sağlayın.

Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Sayfa Sınırı
pageLimit integer

İşlenecek en fazla sayfa sayısı

Sayfa Aralığı
pageRange string

İşlemek istediğiniz sayfa numaralarının dize gösterimi. Örneğin 1,3-4

Şerit Para Birimi Simgesi
stripCurrencySymbol boolean

Para birimi değerlerini döndürmeden önce simgelerin ve dizelerin kaldırılmasını istiyorsanız bunu true olarak ayarlayın

Eş Anlamlıyı Eşleştir
synonym boolean

Eş anlamlı olan tüm anahtarları beklenen anahtara döndürmemizi istiyorsanız bunu true olarak ayarlayın.

Eş Anlamlı Sözlüğü
synonymDictionary string

Her nesnenin bir dizideki eş anlamlıların listesini içerdiği "entry" nesnelerinden oluşan bir JSON dizisi sağlayabilirsiniz. Örneğin, "Fatura No" ve "Fatura Numarası" (büyük/küçük harfe duyarlı olmayan) öğelerinin aynı anahtar olarak yorumlanmasını istiyorsanız şu JSON'yi kullanın: [{'entry': [ 'Fatura No', 'fatura numarası' ]}]

Simgeleri Kırp
trimSymbols boolean

Bunları beklenen bir anahtarla eşleştirmeden önce bulunan tüm baştaki ve sondaki simgeleri anahtarlardan kaldırmamızı istiyorsanız bunu true olarak ayarlayın.

Döndürülenler

Bu işlemin çıkışları dinamiktir.

PDF'i barkoda göre bölme

PDF dosyalarını kullanıcı tarafından tanımlanan barkod eşleşmelerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin. Buna ek olarak Aquaforest Zonal Extraction Tool [https://www.aquaforest.com/en/zone/get-pdf-zone.html] adresinde mevcuttur.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Dosya Adı Şablonu
fileNameTemplate True string

Barkod bulunursa çıkış dosyası şablonu

Eşleşme olmayan sayfalar
noMatch string

Yukarıda seçtiğiniz bölme seçeneğine bağlı olarak, bazı sayfaların barkod değeri olmaz. Bu sayfaların ne yapacağını seçin.

Barkod Eşleştirme Şablonu Yok
noTextFileName True string

Barkod bulunamazsa çıkış dosyası şablonu

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Çıktı Dosyası Seçenekleri
splitOption string

Daha fazla ayıkladığınız metni daraltmak için bunu kullanın, gereksinimlerinize uygun bir seçenek belirleyin

Türü
barcodeFormats array of string

Tanımlamak istediğiniz Barkod türlerini belirtin

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Desen
regex string

Burada normal bir ifade sağlanıyorsa, ayıklanan tüm barkodları bu barkodla eşleştirip eşleşmeyi döndüreceğiz.

Döndürülenler

PDF'i metin eşleştirmeye göre bölme

PDF dosyalarını kullanıcı tarafından tanımlanan metin eşleşmelerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin. Buna ek olarak Aquaforest Zonal Extraction Tool [https://www.aquaforest.com/en/zone/get-pdf-zone.html] adresinde mevcuttur.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Dosya Adı Şablonu
fileNameTemplate True string

Metin eşleşmeleri bulunursa çıkış dosyası şablonu

Eşleşme olmayan sayfalar
noMatch string

Yukarıda seçtiğiniz bölme seçeneğine bağlı olarak, bazı sayfalarda ayıklanan metin değeri yoktur. Bu sayfaların ne yapacağını seçin.

Dosya Şablonu Yok
noTextFileName True string

Metin eşleşmesi bulunamazsa çıkış dosyası şablonu

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Çıktı Dosyası Seçenekleri
splitOption string

Bölme işleminden çıkış dosyalarında barkodun bulunduğu sayfanın konumunu seçin.

Değer
expression array of string

Yukarıdaki özellik ile kullanılacak bir veya daha fazla değeri buraya sağlayın, yukarıda belirtilen kuralla eşleşen ilk metin değerini döndüreceğiz.

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seç
position string

Daha fazla ayıkladığınız metni daraltmak için bunu kullanın, gereksinimlerinize uygun bir seçenek belirleyin

Desen
regex string

Burada normal bir ifade sağlanırsa, ayıklanan tüm metinleri bununla eşleştirip eşleşmeyi döndürüriz.

Döndürülenler

PDF'i sayfaya bölme

PDF dosyalarını, kullanıcı tarafından tanımlanan bölme seçeneklerine göre böler. Belgeler için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği.

Çıkış Dosyası Adı
fileNameTemplate True string

%UNIQUEn (1 ile başlayan benzersiz sayı, n basamağı sıfır) ve %FILENAME (uzantı olmadan özgün dosya adı) içerebilen hedef dosya şablonu.

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı.

Bölme Türü
splitOption True string

Her dosya için kullanılacak bölme işlemini seçin.

Sayfa Aralığı
pageRange string

Özgün sayfadan hangi sayfaların ayıklanması gerektiğini tanımlayan virgüllerle ayrılmış sayfa aralıkları kümesi.

Her
repeatEvery integer

Sayfa aralığını belgedeki her Sayfa Aralığı sayfası kümesine uygulayın. Örneğin, sayfa aralıkları için 2-4 belirtilirse ve yinelenen aralık olarak 4 belirtilirse, aralık 4 sayfada bir yeniden uygulanır.

Yer işaretlerini tutma
retainBookmarks boolean

Oluşturulan dosyalar özgün dosyadaki yer işaretlerini içerir.

Meta verileri saklama
retainMetadata boolean

Oluşturulan dosyalar özgün dosyadan meta verileri (Yazar ve Başlık gibi) içerir.

Döndürülenler

PDF sayfalarını barkoda göre ayıklama

Kullanıcı tarafından tanımlanan barkod eşleşmelerine göre PDF dosyalarını ayıklayın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Dosya Adı Şablonu
fileNameTemplate True string

Barkod bulunursa çıkış dosyası şablonu

Dosya Şablonu Yok
noTextFileName True string

Barkod bulunamazsa çıkış dosyası şablonu

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Türü
barcodeFormats array of string

Tanımlamak istediğiniz Barkod türlerini belirtin

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Desen
regex string

Burada normal bir ifade sağlanıyorsa, ayıklanan tüm barkodları bu barkodla eşleştirip eşleşmeyi döndüreceğiz.

Döndürülenler

PDF sayfalarını metne göre ayıklama

Kullanıcı tarafından tanımlanan metin eşleşmelerine göre PDF dosyalarını ayıklayın. Daha fazla bilgi için [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] adresini ziyaret edin.

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Dosya Adı Şablonu
fileNameTemplate True string

Metin eşleşmeleri bulunursa çıkış dosyası şablonu

Dosya Şablonu Yok
noTextFileName True string

Metin eşleşmesi bulunamazsa çıkış dosyası şablonu

Dosya Adı
sourceFileName True string

Kaynak dosyanın adı

Değer
expression array of string

Yukarıdaki özellik ile kullanılacak bir veya daha fazla değeri buraya sağlayın, yukarıda belirtilen kuralla eşleşen ilk metin değerini döndüreceğiz.

Yer
location True string

Sayfanın alanı - Koordinatları elde etmek için Bölgesel aracını kullanın: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Seç
position string

Daha fazla ayıkladığınız metni daraltmak için bunu kullanın, gereksinimlerinize uygun bir seçenek belirleyin

Desen
regex string

Burada normal bir ifade sağlanırsa, ayıklanan tüm metinleri bununla eşleştirip eşleşmeyi döndürüriz.

Döndürülenler

PDF özelliklerini alma

PDF dosyası hakkındaki bilgileri alır

Parametreler

Name Anahtar Gerekli Tür Description
Dosya İçeriği
fileContent True byte

Kaynak dosyanın içeriği

Sayfa Sınırı
pageLimit integer

İşlenecek en fazla sayfa sayısı, bu yalnızca sayfaların gizli metin içerip içermediğini denetlemek veya PDF'nin aranabilir olup olmadığını denetlemek için kullanılır

Döndürülenler

Tanımlar

ApiExtractPost200ApplicationJsonResponse

Name Yol Tür Description
Hata
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Başarılı
IsSuccessful boolean

En az bir sayfa ayıklandıysa bu true değerini döndürür

Lisans Bilgileri
LicenceInfo string

API abonelik anahtarınız hakkında bilgi

Çıkış Dosyalarını Ayıklama
SplittedFile array of object

Ayıklanan Dosya Dizisi

(Dosya İçeriği)
SplittedFile.SplitFileContent byte

Dosya İçeriğini temsil eden temel 64 dize

(Dosya Adı)
SplittedFile.SplitFileName string

Oluşturulan Dosya Adını içeren bir dize

(Sayfa Numarası)
SplittedFile.pageNumber string

Ayıklamanın gerçekleştiği sayfa numarasını içeren sayfa aralığı

ApiGetTextValueJsonResponse

Name Yol Tür Description
Hata mesajı
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Başarılı
IsSuccessful boolean

Metin başarıyla eşleştirildiyse

Lisans Bilgileri
LicenceInfo string

API abonelik anahtarınız hakkında bilgi

Metin Sonucu
TextResult string

Sağlanan Metin Sonucu Şablonuna ayıklanan metin uygulanarak oluşturulan bir dize. Sayfa sayısının birden büyük olup olmadığının Sayfa Ayırıcısı'nı kullanarak tüm sayfaları birleştirir.

Results
TextResults array of object

Sayfaların listesini ve ayıklanan metin değerlerini içeren bir dizi

(Sayfa Numarası)
TextResults.pageNumber string

Metnin bulunduğu sayfa

(Sayfa Metni)
TextResults.valueExtracted string

Sağlanan Metin Sonucu Şablonuna ayıklanan metin uygulanarak oluşturulan bir dize.

(Bölge Değerleri)
TextResults.zoneValues array of string

Her bölgeden ayıklanan metni içeren bir dizi.

ApiRenameByBarcodePost200ApplicationJsonResponse

Name Yol Tür Description
Barkod
BarcodeResult string

Sağlanan barkod Sonuç Şablonuna ayıklanan metin uygulanarak oluşturulan bir dize. Sayfa sayısının birden büyük olup olmadığının Sayfa Ayırıcısı'nı kullanarak tüm sayfaları birleştirir.

Results
BarcodeResults array of object

Sayfaların listesini ve ayıklanan barkod değerlerini içeren bir dizi

(Sayfa Numarası)
BarcodeResults.pageNumber string

Barkod bulunan sayfa

(Sayfa Barkodu)
BarcodeResults.valueExtracted string

Sağlanan barkod Sonuç Şablonuna ayıklanan barkod değeri uygulanarak oluşturulan bir dize.

(Bölge Değerleri)
BarcodeResults.zoneValues array of string

Her bölgeden ayıklanan barkodu içeren bir dizi.

Hata mesajı
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Başarılı
IsSuccessful boolean

Bir barkod algılandıysa

Lisans Bilgileri
LicenceInfo string

API abonelik anahtarınız hakkında bilgi

ApiSplitPost200ApplicationJsonResponse

Name Yol Tür Description
Hata mesajı
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Başarılı
IsSuccessful boolean

En az bir bölünmüş sayfa eşleştirildiyse bu durum true değerini döndürür.

Lisans Bilgileri
LicenceInfo string

API abonelik anahtarınız hakkında bilgi

Çıkış Dosyalarını Böl
SplittedFile array of object

Oluşturulan dosya adı ve sayfa numarası gibi ayrıntılarla birlikte bölünmüş dosyaların her birini içeren dizi.

(Dosya İçeriği)
SplittedFile.SplitFileContent byte

Dosya İçeriğini temsil eden temel 64 dize

(Dosya Adı)
SplittedFile.SplitFileName string

Oluşturulan Dosya Adını içeren bir dize

(Sayfa Aralığı)
SplittedFile.pageNumber string

Bölme işleminin sayfa numaralarını içeren sayfa aralığı

GetPDFInfoResponse

Name Yol Tür Description
Derlemeye İzin Ver
AllowAssembly boolean

Sayfaları döndürmeye, eklemeye veya silmeye izin verin.

Düzeyi Düşürülmüş Yazdırmaya İzin Ver
AllowDegradedPrinting boolean

Düşük kaliteli yazdırmaya izin verin.

İçeriği Ayıklamaya İzin Ver
AllowExtractContents boolean

Metin ve grafik ayıklamasına izin verin.

Erişilebilirlik için Ayıklamaya İzin Ver
AllowExtractForAccessibility boolean

Erişilebilirliği desteklemek için metin ve grafik ayıklamasına izin verin.

Form Doldurmaya İzin Ver
AllowFillInForm boolean

Form alanlarının doldurulmasına izin ver.

Ek Açıklamaları Değiştirmeye İzin Ver
AllowModifyAnnotations boolean

Ek açıklamaların değiştirilmesine izin verin.

İçeriği Değiştirmeye İzin Ver
AllowModifyContents boolean

İçeriğin değiştirilmesine izin ver.

Yazdırmaya İzin Ver
AllowPrinting boolean

Yüksek kaliteli yazdırmaya izin verin.

Yazar
Author string

Belgeyi oluşturan kişi.

Oluşturma Tarihi
CreationDate string

Bu, PDF'nin oluşturulduğu tarih ve saattir.

Oluşturan
Creator string

Kaynak uygulama veya kitaplık.

Hata mesajı
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Dosya Boyutu (bayt)
FileSize number

Dosyanın bayt cinsinden boyutu

Gizli Metin Var
HasHiddenText boolean

PDF dosyasının bir OCR katmanı varsa bu durum true değerini döndürür.

Is Encrypted
IsEncrypted boolean

Bu belge şifrelenirse veya şifrelenmezse bu durum true değerini döndürür.

Aranabilir Mi?
IsSearchable boolean

PDF dosyasında arama yapılabilirse bu durum true değerini döndürür.

Başarılı
IsSuccessful boolean

Eylem başarılı olursa true döndürür.

Anahtar sözcükler
Keywords string

Anahtar sözcükler virgülle ayrılabilir.

Lisans Bilgileri
LicenceInfo string

Abonelik kotanızın Json özeti.

Değiştirme Tarihi
ModifiedDate string

Bu özellik, PDF'nin son değiştirildiği tarihi ve saati temsil eder

Sayfa Sayısı
NumberofPages integer

PDF dosyasındaki sayfa sayısı.

PDF Sürümü
PDFversion number

Belgenin oluşturulduğu PDF belirtiminin sürümü.

Producer
Producer string

PDF'yi oluşturan ürün. PDF'nin ilk günlerinde insanlar belge yazmak, PostScript dosyasına yazdırmak için Microsoft Word gibi bir Creator uygulamasını kullanır ve ardından Yapımcı, PostScript dosyasını PDF'ye dönüştüren uygulama acrobat Distiller olur. Günümüzde Oluşturucu ve Yapımcı genellikle aynı veya bir alan boş bırakılıyor.

Konu
Subject string

Belgenin konusu nedir?

Başlık
Title string

Belgenin başlığı.

Sıkışıp
Trapped string

Bu özellik, belgenin tuzağa düşürüldüğünü gösteren bir Boole değeridir. Yakalama, olası yazmaç hatalarını gizleyebilmek için renk alanlarını renk ayrımlarına dönüştüren bir pre-press işlemidir.

XMP Meta Verileri
XmpMetadata string

Genişletilebilir Meta Veri Platformu (XMP), dijital belgeler ve veri kümeleri için standartlaştırılmış ve özel meta verilerin oluşturulması, işlenmesi ve değişimi için başlangıçta Adobe Systems Inc. tarafından oluşturulan bir ISO standardıdır.

ocr_response

OCR işlemi için yanıt verileri

Name Yol Tür Description
Hata mesajı
ErrorMessage string

Başarılı değeri false ise Hata İletisi döndüreceğiz

Başarılı
IsSuccessful boolean

OCR başarılı olursa true döndürür.

Lisans Bilgileri
LicenceInfo string

API abonelik anahtarınız hakkında bilgi

Günlük dosyası içeriği
LogFileContent byte

İşlemin günlük içeriği

İşlenen dosya içeriği
OutputFileContent byte

Aquaforest PDF dönüştürücüsü tarafından oluşturulan dosya.