Aquaforest PDF

Aquaforest PDF コネクタには、Office 365 と Power Automate の分割、テキスト抽出、バーコード抽出、OCR 操作など、さまざまな PDF 操作を実行するアクションのグループが含まれています。

このコネクタは、次の製品とリージョンで使用できます。

サービス	クラス	リージョン
コピロットスタジオ	Premium	次を除くすべての Power Automate リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)
ロジックアプリ	Standard	次を除くすべての Logic Apps リージョン : - Azure Government リージョン - Azure China リージョン - 米国国防総省 (DoD)
Power Apps	Premium	次を除くすべての Power Apps リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)
Power Automate	Premium	次を除くすべての Power Automate リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)

お問い合わせ
名前	Aquaforest のサポート
URL	https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email	support@aquaforest.com

コネクタメタデータ
Publisher	Aquaforest Limited
Website	https://www.aquaforest.com/en/aquaforest-connector.asp
プライバシーポリシー	https://www.aquaforest.com/en/privacy policy.pdf
カテゴリ	コンテンツとファイル。データ

Aquaforest PDF コネクタには、Office 365 と Flow の分割、テキスト抽出、バーコード抽出、OCR 操作など、さまざまな PDF 操作を実行するアクションのグループが含まれています。

[前提条件]

まず、 Aquaforest PDF API アカウントを作成する必要があります。このアカウントは、Aquaforest PDF Actions と Aquaforest PDF API を管理するために使用されます。サブスクリプションがこのアドレスにリンクされるため、アクティブな電子メールアドレスを使用します。既にアカウントをお持ちの場合は、ここでサインインするだけです。

資格情報を取得する方法

開発者ポータルにログインし、[製品] ページに移動し、サブスクライブする製品を選択します。
[ サブスクライブ ] ボタンをクリックする
[ 確認 ] ボタンをクリックしてサブスクリプション要求を確認します
[プロファイル] ページで API キーにアクセスできます

接続を作成する

コネクタでは、次の認証の種類がサポートされています。


デフォルト	接続を作成するためのパラメーター。	すべてのリージョン	共有不可

デフォルト

適用対象: すべてのリージョン

接続を作成するためのパラメーター。

これは共有可能な接続ではありません。電源アプリが別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

名前	タイプ	Description	必須
API キー	securestring	この API の API キー	正しい

調整制限

名前	呼び出し	更新期間
接続ごとの API 呼び出し	100	60 秒

アクション

OCR PDF または画像	画像 PDF またはスキャンした画像から検索可能な PDF を生成します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。
PDF からテキストを取得する	テキストの場所と正規表現に基づいて PDF ファイルからテキストを取得します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。
PDF からデータを取得する	このアクションにより、キーと値のペアの形式で PDF ファイルから重要なデータが抽出されます。
PDF をページごとに分割する	ユーザーが定義した分割オプションに基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。
PDF プロパティを取得する	PDF ファイルに関する情報を取得します
PDF ページをテキストで抽出する	ユーザーが定義したテキストの一致に基づいて PDF ファイルを抽出します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。
テキスト一致による PDF の分割	ユーザーが定義したテキストの一致に基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。また、アクアフォレストゾーン抽出ツールは[https://www.aquaforest.com/en/zone/get-pdf-zone.html]で入手できます。
バーコードで PDF を分割する	ユーザーが定義したバーコードの一致に基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。また、アクアフォレストゾーン抽出ツールは[https://www.aquaforest.com/en/zone/get-pdf-zone.html]で入手できます。
バーコードで PDF ページを抽出する	ユーザーが定義したバーコードの一致に基づいて PDF ファイルを抽出します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。
バーコード値を取得する	PDF からバーコードを取得します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

OCR PDF または画像

操作 ID:: Ocr-file-to-pdf

画像 PDF またはスキャンした画像から検索可能な PDF を生成します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
AquaforestImageTimeout	aquaforestImageTimeout		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
Author	author		string	出力 PDF ドキュメントのプロパティでカスタム作成者を設定します。
自動回転	autorotate		boolean	画像を自動的に回転させる - これにより、すべてのテキストが正常に向くようになります
バイナリ化	binarize		integer	この値は、通常、テクニカルサポートからのガイダンスの下でのみ使用する必要があります。カラーイメージの処理方法を制御し、特定のしきい値で二値化を強制できます。通常、テストで良好な結果を得るために値 200 が示されていますが、これは "一般的な" 顧客ドキュメントで確認する必要があります。これを -1 に設定することで、テキストを背景画像や色から分離しようとする別の方法が使用されます。これにより、新聞や雑誌のページなどの特定のドキュメントの OCR 結果が改善される可能性があります。
黒のピクセル制限	blackPixelLimit		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
空白ページのしきい値	blankPageThreshold		integer	これを使用して、空白と見なされないページの画像に存在する必要がある最小数の "On Pixels" を設定します。 -1 値を指定すると、空白のページ検出が無効になります。
ボックスサイズ	boxSize		integer	このオプションは、テキストの周囲のボックスによって領域がグラフィックスとして識別される場合があるフォームに最適です。このオプションは、OCR エンジンによって使用されるイメージの一時コピーからボックスを削除します。最終的なイメージからボックスは削除されません。技術的には、このオプションは、(ピクセル単位で、このプロパティによって定義された) 最小領域を持つ接続された要素を削除します。このオプションは、現在、バイトーン画像にのみ適用されます。
ConvertToTiff	convertToTiff		boolean	PDF ドキュメント内の各ページは、TIFF イメージにラスター化されます。
CreateProcess	createProcess		boolean	pinvoke を使用してプロセスを起動する場合は、これを true に設定します。
[作成日付]	creationDate		string	出力 PDF ドキュメントのプロパティでカスタム作成日を設定します。日付文字列は、'yyyy-MM-dd HH:mm:ss' の形式にする必要があります。
Deskew	deskew		boolean	画像をスキュー (まっすぐに) します。
Despeckle	despeckle		integer	これにより、指定した図よりも高さまたは幅 (ピクセル単位) の画像内で切断されたすべての要素が削除されます。最大値は 9 で、既定値は 0 です。
DictionaryLookup	dictionaryLookup		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
Dotmatrix	dotmatrix		boolean	ドットマトリックスフォントの認識を向上させるには、これを true に設定します。既定値は false です。ドットマトリックス以外のフォントに対して true に設定すると、認識が不適切になる可能性があります。
デバッグ出力を有効にする	enableDebugOutput		boolean	デバッグ出力を有効にします。
PDF の圧縮 (MRC)	enableMrc		boolean	これにより、混合ラスター圧縮が可能になり、カラースキャンで構成される PDF の出力サイズを大幅に削減できます。このオプションは、ソースが PDF ではない場合や ConvertToTiff を使用している場合にのみ適しています。
PDF/A 出力	enablePDFAOutput		boolean	PDF/A として出力するかどうか。
エラーモード	errorMode		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
ソースファイルの内容	fileContent	True	byte	OCR に対するファイルの内容
拡張子付きのソースファイル名	fileNameWithExtension	True	string	拡張子付きのソースファイル名、または拡張子 (先頭のピリオド '.')
フリップ検出	flipDetect		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
グレースケールの品質	grayscaleQuality		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
ヒューリスティック	heuristics		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
Jbig2EncFlags	jbig2EncFlags		string	これらは、PDF 生成で使用される JBIG2 バージョンの画像を生成するために使用されるアプリケーションに渡されるフラグです (この圧縮が有効になっていると仮定します)。このオプションは、通常、テクニカルサポートからのガイダンスの下でのみ使用する必要があります。
Language	language		enum	次のいずれかのオプションを選択すると、OCR 処理に使用する言語が設定されます。既定の言語は English (英語) です。
LibTiffSavePageAsBmp	libTiffSavePageAsBmp		boolean	1bpp の画像があり、LZW 圧縮がある場合、前処理によってイメージの色が反転する (黒から白、白から黒) 場合があります。これを回避するには、これを true に設定します。
最大スキュー	maxDeskew		float	ページがデスクに並べて表示される最大角度。通常、このオプションは、テクニカルサポート (support@aquaforest.com) からのガイダンスでのみ使用する必要があります。
最小スキュー信頼度	minDeskewConfidence		float	通常、このオプションは、テクニカルサポート (support@aquaforest.com) からのガイダンスでのみ使用する必要があります。
変更日	modifiedDate		string	PDF ドキュメントの出力プロパティで、カスタムの変更日を設定します。日付文字列は、'yyyy-MM-dd HH:mm:ss' の形式にする必要があります。
モーフ	morph		string	OCR の前にバイナリ化されたイメージに適用される形態的オプション。空に設定すると、何も適用されません。一般的なオプションは以下のとおりですが、その他のオプションについては support@aquaforest.comにお問い合わせください。
MrcBackgroundFactor	mrcBackgroundFactor		integer	画像の背景部分のサンプリングサイズ。数値が大きいほど、平均化に使用されるイメージブロックのサイズが大きくなり、サイズが減少しますが、品質も低下します。既定値は 3 です
MrcForegroundFactor	mrcForegroundFactor		integer	イメージの前景部分のサンプリングサイズ。数値が大きいほど、平均化に使用されるイメージブロックのサイズが大きくなり、サイズが減少しますが、品質も低下します。既定値は 3 です
MrcQuality	mrcQuality		integer	背景と前景の画像を保存する際に使用する JPEG 品質設定 (パーセンテージ値 1 ~ 100)。既定値は 75 です
MrcTimeout	mrcTimeout		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
NoPictures	noPictures		boolean	既定では、ドキュメントの領域がグラフィック領域として識別された場合、その領域に対して OCR 処理は実行されません。ただし、特定のドキュメントには、"グラフィック" または "画像" 領域として識別される領域またはボックスが含まれている場合がありますが、実際には便利なテキストが含まれています。 NoPictures を True に設定すると、画像として識別された領域が無視され、False に設定すると、画像として識別された領域の OCR が強制されます。
OcrProcessSetupTimeout	ocrProcessSetupTimeout		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
OcrTimeout	ocrTimeout		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
パスワード	password		string	ソース PDF ファイルを開くパスワード
PdfToImageBpp	pdfToImageBpp		enum	エンジン 1 を使用するときにラスター化された PDF ページに使用するピクセルあたりのビット数。これは、ConvertToTiff を使用して処理されるドキュメントにのみ適用されます。このプロパティの既定値は PDF ページから取得されます。
PdfToImageCompression	pdfToImageCompression		enum	ソース PDF ファイルの各ページから抽出またはラスター化された画像に設定する圧縮。次に、これらの画像が OCRed され、検索可能な PDF が作成されます。このプロパティの既定値は、ソース PDF ファイルの各ページから取得されます。
PdfToImageDpi	pdfToImageDpi		enum	ソース PDF ファイルの各ページからラスター化されたイメージに設定する DPI。次に、これらの画像が OCRed され、検索可能な PDF が作成されます。このプロパティの既定値は、ソース PDF ファイルの各ページから取得されます。
PdfToImageForceVectorCheck	pdfToImageForceVectorCheck		boolean	この設定は、ベクトルオブジェクト (CAD 図面など) を含むドキュメントを処理する場合に便利です。既定では、ベクターオブジェクトのみを含むページはラスター化されます。画像を含まないが、ベクターオブジェクトと電子テキストを含むページは、ラスタライズからスキップされます。ただし、ベクターオブジェクト (CAD 図面) を含むページが存在する可能性がありますが、そのタイトルは電子テキストである可能性があります。このようなページを強制的にラスター化するには、このプロパティを true に設定します。
PdfToImageIncludeText	pdfToImageIncludeText		boolean	False に設定すると、PDF から抽出されたページ画像に実際のテキスト (スキャンされた画像の一部であるテキストではなく、電子的に生成される) の変換ができなくなります。これは、テキストは既に検索可能であるため、通常は OCR を必要としないためです。ただし、この実際のテキストに OCR が必要な場合は、値を True に設定できます。
PdfToImageMaxRes	pdfToImageMaxRes		integer	ラスター化されたイメージの最大解像度。 PDF ページから取得した解像度がこの値より大きい場合は、この値に設定されます。このプロパティの既定値は 600 です。
PdfToImageMinRes	pdfToImageMinRes		integer	ラスター化されたイメージの最小解像度。 PDF ページから取得した解像度がこの値より小さい場合は、この値に設定されます。このプロパティの既定値は 200 です。
PDF/A バージョン	pdfaVersion		enum	PDF/A バージョン。
PipeClientConnectionTimeout	pipeClientConnectionTimeout		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
RemoveBlankPage	removeBlankPage		boolean	BlankPageThreshold が -1 より大きく、ConvertToTiff が true の場合は、空白ページを削除します。
RemoveLines	removeLines		boolean	画像から線を削除すると、認識が向上します。
RestartEngineEvery	restartEngineEvery		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
ブックマークを保持する	retainBookmarks		boolean	ConvertToTiff を使用するときに、ソースファイルのブックマークを出力に保持します。
作成日を保持する	retainCreationDate		boolean	出力 PDF ドキュメントのプロパティにソースファイルの作成日を保持します。
メタデータを保持する	retainMetadata		boolean	ConvertToTiff を使用するときに、ソースファイルのメタデータを出力に保持します。
変更日を保持する	retainModifiedDate		boolean	出力 PDF ドキュメントのプロパティにソースファイルの変更日を保持します。
ビューアーの設定を保持する	retainViewerPreferences		boolean	ConvertToTiff を使用するときに、ソースファイルから PDF ビューアーの基本設定、ページモード、およびページレイアウトを出力に保持します。
SavePredespeckle	savePredespeckle		boolean	これにより、出力 PDF の元の画像 (つまり、前処理を適用する前) が使用されます。
Tables	tables		boolean	このオプションを true に設定すると、テーブルセル内で OCR が試行されます。
TextLayerFilterHeight	textLayerFilterHeight		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterHeightInverted	textLayerFilterHeightInverted		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterPercentage	textLayerFilterPercentage		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterPercentageInverted	textLayerFilterPercentageInverted		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterRatio	textLayerFilterRatio		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterRatioInverted	textLayerFilterRatioInverted		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterWidth	textLayerFilterWidth		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerFilterWidthInverted	textLayerFilterWidthInverted		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
TextLayerMaxBoxes	textLayerMaxBoxes		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
片付けモード	tidyUpMode		integer	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。
PDF/A の検証	validatePDFA		boolean	変換後に PDF/A ドキュメントを検証するかどうか
Word の一致のしきい値	wordMatchThreshold		float	このプロパティの使用に関するガイダンスについては、テクニカルサポート (support@aquaforest.com) にお問い合わせください。

戻り値

OCR 操作の応答データ

Body: ocr_response

PDF からテキストを取得する

操作 ID:: Get-text-value

テキストの場所と正規表現に基づいて PDF ファイルからテキストを取得します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
テキスト一致テンプレートなし	noTextTemplate	True	string	一致するものが見つからない場合に返されるテキストのテンプレート
ページ区切り記号	pageSeparator		string	改ページの場所を把握できるように、ページ区切り記号を指定します。
ページ	pagerange		string	テキストを抽出するページ範囲を指定します。これには、1 つのページ番号 (1)、コンマ (1,2,3) で区切られた複数のページ番号、ページ範囲 (1 ~ 4)、またはすべて (1,2,4- 7) の組み合わせを指定できます。
ファイル名	sourceFileName	True	string	ソースファイルの名前
テキスト結果テンプレート	textResultTemplate	True	string	一致が見つかった場合に返されるテキストのテンプレート
価値	expression		array of string	上記のプロパティで使用する 1 つ以上の値をここで指定すると、上記のルールに一致する最初のテキスト値が返されます。
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
ページ (非推奨)	pagenumber		integer	このプロパティは非推奨です。Pages プロパティを使用することをお勧めします。 Pages プロパティはすべてのゾーンに適用され、処理するページを選択できます。
選択する	position		string	これを使用して、抽出するテキストをさらに絞り込み、要件に一致するオプションを選択します
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたテキストを照合し、一致を返します。

戻り値

Body: ApiGetTextValueJsonResponse

PDF からデータを取得する

操作 ID:: Get-data-from-pdf

このアクションにより、キーと値のペアの形式で PDF ファイルから重要なデータが抽出されます。

パラメーター

名前	キー	必須	型	説明
名前	settingName	True	string	設定の名前をここに入力します
価値	settingValue	True	string	設定の値をここに入力します。
信頼度スコア	confidenceScore		number	信頼度スコアを高く設定して、信頼度が低い値を除外します。 0 ~ 1 の任意の値を設定できます。 0.5 以降をお勧めします
日付変換	dateAsISO		string	日付値を返す形式を選択します。
必要なキー	expectedKeys		string	JSON を解析せずに後のアクションで値を使用できるように、1 行に 1 つのキー名を指定します。
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ページ制限	pageLimit		integer	処理するページの最大数
ページ範囲	pageRange		string	処理するページ番号の文字列表現。例: 1,3-4
ストリップ通貨記号	stripCurrencySymbol		boolean	通貨値を返す前にシンボルと文字列を削除する場合は、これを true に設定します。
一致シノニム	synonym		boolean	シノニムであるすべてのキーを予期されるキーに返す場合は、これを true に設定します。
シノニム辞書	synonymDictionary		string	"entry" オブジェクトの JSON 配列を指定できます。各オブジェクトには、配列内のシノニムのリストが含まれています。たとえば、"請求書番号" と "請求書番号" (大文字と小文字を区別しない) を同じキーとして解釈する場合は、次の JSON を使用します。 [{'entry': [ 'Invoice No', 'invoice number' ]}]
シンボルのトリミング	trimSymbols		boolean	予期されるキーに一致する前に見つかったキーからすべての先頭と末尾のシンボルを削除する場合は、これを true に設定します。

戻り値

この操作の出力は状況に応じて変わります。

PDF をページごとに分割する

操作 ID:: Split-by-page-range

ユーザーが定義した分割オプションに基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容。
出力ファイル名	fileNameTemplate	True	string	ターゲットファイルテンプレート。%UNIQUEn (1 から始まる一意の番号、n 桁に埋め込まれたゼロ) と %FILENAME (拡張子のない元のファイル名) を含めることができます。
ファイル名	sourceFileName	True	string	ソースファイルの名前。
分割の種類	splitOption	True	string	各ファイルに使用する分割操作を選択します。
ページ範囲	pageRange		string	元のページから抽出するページを定義するコンマで区切られたページ範囲のセット。
すべて繰り返し	repeatEvery		integer	文書内のページ範囲ページの各セットにページ範囲を適用します。たとえば、ページ範囲に 2 ~ 4 を指定し、4 を繰り返し範囲として指定した場合、範囲は 4 ページごとに再適用されます。
ブックマークを保持する	retainBookmarks		boolean	生成されたファイルには、元のファイルのブックマークが含まれます。
メタデータを保持する	retainMetadata		boolean	生成されたファイルには、元のファイルのメタデータ (作成者やタイトルなど) が含まれます。

戻り値

Body: ApiSplitPost200ApplicationJsonResponse

PDF プロパティを取得する

操作 ID:: Get-pdf-information

PDF ファイルに関する情報を取得します

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ページ制限	pageLimit		integer	処理するページの最大数。これは、ページに非表示のテキストが含まれているかどうかを確認したり、PDF が検索可能かどうかを確認したりするためにのみ使用されます

戻り値

Body: GetPDFInfoResponse

PDF ページをテキストで抽出する

操作 ID:: Extract-by-text

ユーザーが定義したテキストの一致に基づいて PDF ファイルを抽出します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ファイル名テンプレート	fileNameTemplate	True	string	テキストの一致が見つかった場合の出力ファイルのテンプレート
ファイルテンプレートなし	noTextFileName	True	string	一致するテキストが見つからない場合の出力ファイルのテンプレート
ファイル名	sourceFileName	True	string	ソースファイルの名前
価値	expression		array of string	上記のプロパティで使用する 1 つ以上の値をここで指定すると、上記のルールに一致する最初のテキスト値が返されます。
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
選択する	position		string	これを使用して、抽出するテキストをさらに絞り込み、要件に一致するオプションを選択します
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたテキストを照合し、一致を返します。

戻り値

Body: ApiExtractPost200ApplicationJsonResponse

テキスト一致による PDF の分割

操作 ID:: Split-by-text

ユーザーが定義したテキストの一致に基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。また、アクアフォレストゾーン抽出ツールは[https://www.aquaforest.com/en/zone/get-pdf-zone.html]で入手できます。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ファイル名テンプレート	fileNameTemplate	True	string	テキストの一致が見つかった場合の出力ファイルのテンプレート
一致しないページ	noMatch		string	上記で選択した分割オプションに応じて、一部のページではテキスト値が抽出されません。これらのページの実行内容を選択します。
ファイルテンプレートなし	noTextFileName	True	string	一致するテキストが見つからない場合の出力ファイルのテンプレート
ファイル名	sourceFileName	True	string	ソースファイルの名前
出力ファイルオプション	splitOption		string	分割操作から、出力ファイル内のバーコードを含むページの場所を選択します。
価値	expression		array of string	上記のプロパティで使用する 1 つ以上の値をここで指定すると、上記のルールに一致する最初のテキスト値が返されます。
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
選択する	position		string	これを使用して、抽出するテキストをさらに絞り込み、要件に一致するオプションを選択します
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたテキストを照合し、一致を返します。

戻り値

Body: ApiSplitPost200ApplicationJsonResponse

バーコードで PDF を分割する

操作 ID:: Split-by-barcode

ユーザーが定義したバーコードの一致に基づいて PDF ファイルを分割します。ドキュメントについては、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。また、アクアフォレストゾーン抽出ツールは[https://www.aquaforest.com/en/zone/get-pdf-zone.html]で入手できます。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ファイル名テンプレート	fileNameTemplate	True	string	バーコードが見つかった場合の出力ファイルのテンプレート
一致しないページ	noMatch		string	上記で選択した分割オプションに応じて、一部のページにはバーコード値がありません。これらのページの実行内容を選択します。
バーコード一致テンプレートなし	noTextFileName	True	string	バーコードが見つからない場合の出力ファイルのテンプレート
ファイル名	sourceFileName	True	string	ソースファイルの名前
出力ファイルオプション	splitOption		string	これを使用して、抽出するテキストをさらに絞り込み、要件に一致するオプションを選択します
タイプ	barcodeFormats		array of string	識別するバーコードの種類を指定する
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたバーコードを照合し、一致を返します。

戻り値

Body: ApiSplitPost200ApplicationJsonResponse

バーコードで PDF ページを抽出する

操作 ID:: Extract-by-barcode

ユーザーが定義したバーコードの一致に基づいて PDF ファイルを抽出します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
ファイル名テンプレート	fileNameTemplate	True	string	バーコードが見つかった場合の出力ファイルのテンプレート
ファイルテンプレートなし	noTextFileName	True	string	バーコードが見つからない場合の出力ファイルのテンプレート
ファイル名	sourceFileName	True	string	ソースファイルの名前
タイプ	barcodeFormats		array of string	識別するバーコードの種類を指定する
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたバーコードを照合し、一致を返します。

戻り値

Body: ApiExtractPost200ApplicationJsonResponse

バーコード値を取得する

操作 ID:: Get-barcode-value

PDF からバーコードを取得します。詳細については、[https://www.aquaforest.com/en/aquaforest-flow-doc.asp] を参照してください。

パラメーター

名前	キー	必須	型	説明
バーコードの結果テンプレート	barcodeResultTemplate	True	string	バーコードが見つかった場合の出力テキスト結果のテンプレート
ファイルコンテンツ	fileContent	True	byte	ソースファイルの内容
バーコードテンプレートなし	noBarcodeTemplate	True	string	バーコードが見つからない場合の出力テキスト結果のテンプレート
ページ区切り記号	pageSeparator		string	改ページの場所を把握できるように、ページ区切り記号を指定します。
ページ	pagerange		string	テキストを抽出するページ範囲を指定します。これには、1 つのページ番号 (1)、コンマ (1,2,3) で区切られた複数のページ番号、ページ範囲 (1 ~ 4)、またはすべて (1,2,4- 7) の組み合わせを指定できます。
ファイル名	sourceFileName	True	string	ソースファイルの名前
タイプ	barcodeFormats		array of string	識別するバーコードの種類を指定する
ロケーション	location	True	string	ページの領域 - ゾーンツールを使用して座標を取得する: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
ページ (非推奨)	pagenumber		integer	このプロパティは非推奨です。Pages プロパティを使用することをお勧めします。 Pages プロパティはすべてのゾーンに適用され、処理するページを選択できます。
パターン	regex		string	ここで正規表現が指定されている場合は、抽出されたテキストを照合し、一致を返します。

戻り値

Body: ApiRenameByBarcodePost200ApplicationJsonResponse

定義

ApiExtractPost200ApplicationJsonResponse

名前	パス	型	説明
エラー	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
成功しました	IsSuccessful	boolean	これは、少なくとも 1 つのページが抽出された場合に true を返します
ライセンス情報	LicenceInfo	string	API サブスクリプションキーに関する情報
出力ファイルの抽出	SplittedFile	array of object	抽出されたファイルの配列
(ファイルコンテンツ)	SplittedFile.SplitFileContent	byte	ファイルコンテンツを表す Base 64 文字列
(ファイル名)	SplittedFile.SplitFileName	string	生成されたファイル名を含む文字列
(ページ番号)	SplittedFile.pageNumber	string	抽出が行われたページ番号を含むページ範囲

ApiGetTextValueJsonResponse

名前	パス	型	説明
エラーメッセージ	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
成功しました	IsSuccessful	boolean	テキストが正常に一致した場合
ライセンス情報	LicenceInfo	string	API サブスクリプションキーに関する情報
テキストの結果	TextResult	string	指定されたテキスト結果テンプレートに抽出されたテキストを適用することによって生成される文字列。ページ数が 1 より大きい場合、ページ区切り記号を使用してすべてのページが連結されることに注意してください。
結果	TextResults	array of object	ページのリストと抽出されたテキスト値を含む配列
(ページ番号)	TextResults.pageNumber	string	テキストが見つかったページ
(ページテキスト)	TextResults.valueExtracted	string	指定されたテキスト結果テンプレートに抽出されたテキストを適用することによって生成される文字列。
(ゾーン値)	TextResults.zoneValues	array of string	各ゾーンから抽出されたテキストを含む配列。

ApiRenameByBarcodePost200ApplicationJsonResponse

名前	パス	型	説明
バーコード	BarcodeResult	string	指定されたバーコード結果テンプレートに抽出されたテキストを適用して生成された文字列。ページ数が 1 より大きい場合、ページ区切り記号を使用してすべてのページが連結されることに注意してください。
結果	BarcodeResults	array of object	ページのリストと抽出されたバーコード値を含む配列
(ページ番号)	BarcodeResults.pageNumber	string	バーコードが見つかったページ
(ページバーコード)	BarcodeResults.valueExtracted	string	抽出されたバーコード値を提供されたバーコード結果テンプレートに適用して生成された文字列。
(ゾーン値)	BarcodeResults.zoneValues	array of string	各ゾーンから抽出されたバーコードを含む配列。
エラーメッセージ	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
成功しました	IsSuccessful	boolean	バーコードが検出された場合
ライセンス情報	LicenceInfo	string	API サブスクリプションキーに関する情報

ApiSplitPost200ApplicationJsonResponse

名前	パス	型	説明
エラーメッセージ	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
成功しました	IsSuccessful	boolean	これは、少なくとも 1 つの分割ページが一致した場合に true を返します。
ライセンス情報	LicenceInfo	string	API サブスクリプションキーに関する情報
出力ファイルの分割	SplittedFile	array of object	各分割ファイルと、生成されたファイル名やページ番号などの詳細を含む配列。
(ファイルコンテンツ)	SplittedFile.SplitFileContent	byte	ファイルコンテンツを表す Base 64 文字列
(ファイル名)	SplittedFile.SplitFileName	string	生成されたファイル名を含む文字列
(ページ範囲)	SplittedFile.pageNumber	string	分割操作のページ番号を含むページ範囲

GetPDFInfoResponse

名前	パス	型	説明
アセンブリの許可	AllowAssembly	boolean	ページの回転、挿入、または削除を許可します。
機能低下印刷を許可する	AllowDegradedPrinting	boolean	低品質の印刷を許可します。
コンテンツの抽出を許可する	AllowExtractContents	boolean	テキストとグラフィックスの抽出を許可します。
アクセシビリティの抽出を許可する	AllowExtractForAccessibility	boolean	アクセシビリティをサポートするテキストとグラフィックスの抽出を許可します。
フォームへの入力を許可する	AllowFillInForm	boolean	フォームフィールドの入力を許可します。
注釈の変更を許可する	AllowModifyAnnotations	boolean	注釈の変更を許可します。
コンテンツの変更を許可する	AllowModifyContents	boolean	コンテンツの変更を許可します。
印刷を許可する	AllowPrinting	boolean	高品質の印刷を許可します。
Author	Author	string	ドキュメントを作成したユーザー。
[作成日付]	CreationDate	string	これは、PDF が作成された日時です。
Creator	Creator	string	元のアプリケーションまたはライブラリ。
エラーメッセージ	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
ファイルサイズ (バイト)	FileSize	number	ファイルのサイズ (バイト単位)
非表示のテキストがある	HasHiddenText	boolean	PDF ファイルに OCR レイヤーがある場合は true が返されます。
Is Encrypted	IsEncrypted	boolean	このドキュメントが暗号化されている場合は true が返されます。
検索可能	IsSearchable	boolean	PDF ファイルが検索可能な場合は true が返されます。
成功しました	IsSuccessful	boolean	アクションが成功した場合は true を返します。
キーワード	Keywords	string	キーワードはコンマ区切りで指定できます。
ライセンス情報	LicenceInfo	string	サブスクリプションクォータの Json の概要。
変更日	ModifiedDate	string	このプロパティは、PDF が最後に変更された日時を表します。
ページ数	NumberofPages	integer	PDF ファイル内のページ数。
PDF バージョン	PDFversion	number	ドキュメントが作成された PDF 仕様のバージョン。
Producer	Producer	string	PDF を作成した製品。 PDFの初期の時代には、Microsoft Wordのようなクリエーターアプリケーションを使用して文書を書き、PostScriptファイルに印刷し、プロデューサーはPostScriptファイルをPDFに変換したアクロバット蒸留器になります。今日のクリエイターとプロデューサーは、多くの場合、同じであるか、1つのフィールドが空白のままです。
サブジェクト	Subject	string	ドキュメントとは何ですか。
Title	Title	string	ドキュメントのタイトル。
閉じ込められた	Trapped	string	このプロパティは、ドキュメントがトラップされているかどうかを示すブール値です。トラッピングは、潜在的なレジスタエラーを隠すために色の分離に色領域を導入するプレス前プロセスです。
XMP メタデータ	XmpMetadata	string	Extensible Metadata Platform (XMP) は、デジタルドキュメントとデータセットの標準化されたカスタムメタデータの作成、処理、および交換のために、Adobe Systems Inc. によって最初に作成された ISO 標準です。

ocr_response

OCR 操作の応答データ

名前	パス	型	説明
エラーメッセージ	ErrorMessage	string	[成功] の値が false の場合は、エラーメッセージが返されます
成功しました	IsSuccessful	boolean	OCR が成功した場合は true を返します。
ライセンス情報	LicenceInfo	string	API サブスクリプションキーに関する情報
ログファイルの内容	LogFileContent	byte	操作のログの内容
処理されたファイルの内容	OutputFileContent	byte	Aquaforest PDF コンバーターによって生成されたファイル。

次の方法で共有

Aquaforest PDF

[前提条件]

資格情報を取得する方法

接続を作成する

デフォルト

調整制限

アクション

OCR PDF または画像

パラメーター

戻り値

PDF からテキストを取得する

パラメーター

戻り値

PDF からデータを取得する

パラメーター

戻り値

PDF をページごとに分割する

パラメーター

戻り値

PDF プロパティを取得する

パラメーター

戻り値

PDF ページをテキストで抽出する

パラメーター

戻り値

テキスト一致による PDF の分割

パラメーター

戻り値

バーコードで PDF を分割する

パラメーター

戻り値

バーコードで PDF ページを抽出する

パラメーター

戻り値

バーコード値を取得する

パラメーター

戻り値

定義

ApiExtractPost200ApplicationJsonResponse

ApiGetTextValueJsonResponse

ApiRenameByBarcodePost200ApplicationJsonResponse

ApiSplitPost200ApplicationJsonResponse

GetPDFInfoResponse

ocr_response