ドキュメント AI (プレビュー)

AI を使用して、一般的なドキュメント形式、スキャンされたドキュメント、ドキュメントの写真から、名前付きフィールド、テーブル、バーコード、分類、および概要を含む構造化データを抽出します。また、手書きと低品質の写真やスキャン、デジタルドキュメント入力もサポートしています。さまざまな言語をサポートし、ドキュメントのビジュアルレイアウトからセマンティック構造を分析および推論できます。

このコネクタは、次の製品とリージョンで使用できます。

サービス	クラス	リージョン
Copilot Studio	Premium	次を除くすべてのPower Automateリージョン: - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)
ロジックアプリ	Standard	次を除くすべての Logic Apps リージョン : - Azure Government リージョン - 中国リージョンAzure - 米国国防総省 (DoD)
Power Apps	Premium	次を除くすべてのPower Appsリージョン: - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)
Power Automate	Premium	次を除くすべてのPower Automateリージョン: - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD)

お問い合わせ
名前	Cloudmersive
URL	https://www.cloudmersive.com
Email	support@cloudmersive.com

コネクタメタデータ
パブリッシャー	Cloudmersive、LLC
Web サイト	https://www.cloudmersive.com
プライバシーポリシー	https://www.cloudmersive.com/privacy-policy
カテゴリ	人工知能;コンテンツとファイル

Cloudmersive Document AI Connector

Cloudmersive Document AI API を使用すると、次世代 AI を使用して、ドキュメントからデータ、フィールド、分析情報、テキストを抽出できます。

[前提条件]

続行するには、次のものが必要です。

Microsoft Power Apps、Power Automate、または Premium コネクタのサポートを備えたAzure Logic Apps
Cloudmersive API キー

資格情報を取得する方法

このコネクタを使用するには、Cloudmersive アカウントが必要です。 Microsoft アカウントでサインアップするか、Cloudmersive アカウントを作成できます。 API キーを取得するには、次の手順に従います。

API キーとシークレットを取得する

Cloudmersive アカウントに登録する
[API キー] をクリックします

ここでは、[API キー] ページに表示されている API キーを作成して確認できます。この API キーをコピーして Cloudmersive Document AI Connector に貼り付けるだけです。

これで、Cloudmersive CDR コネクタの使用を開始する準備ができました。

サポートされている操作

コネクタは、次の操作をサポートしています。

Enforce Policies to a Document to allow or block it using Advanced AI: ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックします。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Answer Questions about a Document in a structured way using Advanced AI:高度な AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数選択の質問、自由回答の質問に回答します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Text from a Document using AI: AI を使用してドキュメントから生テキストを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。さまざまな言語をサポートします。ページあたり 100 個の API 呼び出しを使用します。
Extract Field Values from a Document using AI: AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Field Values from a Document using Advanced AI: 高度な AI を使用して、ドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Tables of Data from a Document using AI: AI を使用してドキュメントから、データの行と列で構成されるテーブルを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Barcodes of from a Document using AI: AI を使用してドキュメントからすべてのバーコードを抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。ページあたり 100 個の API 呼び出しを使用します。
Extract All Fields and Tables of Data from a Document using AI: AI を使用してドキュメントから、データの行と列で構成されるすべてのフィールドとテーブルを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Classification or Category from a Document using AI: AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Classification or Category from a Document using Advanced AI: 高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Summary from a Document using AI: 人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
Extract Text from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。さまざまな言語をサポートします。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
Extract Field Values from a Document using Advanced AI as a Batch Job: 大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
Extract All Fields and Tables of Data from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
Extract Classification or Category from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
Get the status and result of an Extract Document Batch Job: 非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。この API は、Cloudmersive Managed Instance とプライベートクラウドのデプロイでのみ使用できます。

接続を作成する

コネクタでは、次の認証の種類がサポートされています。


デフォルト	接続を作成するためのパラメーター。	すべてのリージョン	共有不可

デフォルト

適用対象: すべてのリージョン

接続を作成するためのパラメーター。

これは共有可能な接続ではありません。電源アプリが別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。

名前	タイプ	Description	必須
Apikey	securestring	この API の Apikey	正しい

調整制限

名前	呼び出し	更新期間
接続ごとの API 呼び出し	100	60 秒

アクション

AI をバッチジョブとして使用してドキュメントからすべてのフィールドとデータテーブルを抽出する	大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
AI をバッチジョブとして使用してドキュメントからテキストを抽出する	大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。さまざまな言語をサポートします。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
AI をバッチジョブとして使用してドキュメントから分類またはカテゴリを抽出する	大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
AI を使用してドキュメントからすべてのフィールドとデータテーブルを抽出する	AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
AI を使用してドキュメントからテキストを抽出する	AI を使用してドキュメントから生テキストを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。さまざまな言語をサポートします。ページあたり 100 個の API 呼び出しを使用します。
AI を使用してドキュメントからデータのテーブルを抽出する	AI を使用してドキュメントからデータの行と列で構成されるテーブルを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 1 ページあたり 100 回の API 呼び出しを使用しました。
AI を使用してドキュメントからバーコードを抽出する	AI を使用してドキュメントからすべてのバーコードを抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。ページあたり 100 個の API 呼び出しを使用します。
AI を使用してドキュメントからフィールド値を抽出する	AI を使用してドキュメントからフィールド値 (請求書番号、請求日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
AI を使用してドキュメントから分類またはカテゴリを抽出する	AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
AI を使用してドキュメントから概要を抽出する	人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックする	ドキュメントにポリシーを適用して、高度な AI を使用してドキュメントを許可またはブロックします。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。
ドキュメントの抽出バッチジョブの状態と結果を取得する	非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。この API は、Cloudmersive Managed Instance とプライベートクラウドのデプロイでのみ使用できます。
高度な AI をバッチジョブとして使用してドキュメントからフィールド値を抽出する	大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。
高度な AI を使用してドキュメントからフィールド値を抽出する	高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
高度な AI を使用してドキュメントから分類またはカテゴリを抽出する	高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。
高度な AI を使用して構造化された方法でドキュメントに関する質問に回答する	Advanced AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数の選択肢、自由回答の質問に回答します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。

AI をバッチジョブとして使用してドキュメントからすべてのフィールドとデータテーブルを抽出する

操作 ID:: ExtractAllFieldsAndTablesFromDocumentBatchJob

大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

分割ドキュメントバッチジョブを実行した結果

Body: ExtractDocumentBatchJobResult

AI をバッチジョブとして使用してドキュメントからテキストを抽出する

操作 ID:: ExtractTextFromDocumentBatchJob

大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。さまざまな言語をサポートします。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

分割ドキュメントバッチジョブを実行した結果

Body: ExtractDocumentBatchJobResult

AI をバッチジョブとして使用してドキュメントから分類またはカテゴリを抽出する

操作 ID:: ExtractClassificationFromDocumentBatchJob

大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。

パラメーター

名前	キー	型	説明
抽出する必要な分類	Categories	string	抽出する必要な分類
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile	file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

分割ドキュメントバッチジョブを実行した結果

Body: ExtractDocumentBatchJobResult

AI を使用してドキュメントからすべてのフィールドとデータテーブルを抽出する

操作 ID:: ExtractAllFieldsAndTables

AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 ...	preprocessing	string	オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 ...
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile	file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントからフィールドを抽出した結果

Body: ExtractFieldsAndTablesResponse

AI を使用してドキュメントからテキストを抽出する

操作 ID:: ExtractText

AI を使用してドキュメントから生テキストを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。さまざまな言語をサポートします。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントからテキストを抽出した結果

Body: ExtractTextResponse

AI を使用してドキュメントからデータのテーブルを抽出する

操作 ID:: ExtractTables

AI を使用してドキュメントからデータの行と列で構成されるテーブルを抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 1 ページあたり 100 回の API 呼び出しを使用しました。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントからテーブルを抽出した結果

Body: ExtractTablesResponse

AI を使用してドキュメントからバーコードを抽出する

操作 ID:: ExtractBarcodes

AI を使用してドキュメントからすべてのバーコードを抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントからバーコードを抽出した結果

Body: ExtractBarcodesAiResponse

AI を使用してドキュメントからフィールド値を抽出する

操作 ID:: ExtractFields

AI を使用してドキュメントからフィールド値 (請求書番号、請求日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
抽出する必要なフィールド、コンマ区切り	FieldNames	string	抽出する必要なフィールド、コンマ区切り
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile	file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントからフィールドを抽出した結果

Body: ExtractFieldsResponse

AI を使用してドキュメントから分類またはカテゴリを抽出する

操作 ID:: ExtractClassification

AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
抽出する必要な分類	Categories	string	抽出する必要な分類
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile	file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

AI を使用してドキュメントを分類した結果

Body: DocumentClassificationResult

AI を使用してドキュメントから概要を抽出する

操作 ID:: ExtractSummary

人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	必須	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode		string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
入力ドキュメント、またはドキュメントの写真からデータを抽出する	InputFile		file	入力ドキュメント、またはドキュメントの写真からデータを抽出する

戻り値

ドキュメントを要約した結果

Body: SummarizeDocumentResponse

ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックする

操作 ID:: ApplyRules

ドキュメントにポリシーを適用して、高度な AI を使用してドキュメントを許可またはブロックします。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
InputFile	InputFile	byte	バイト配列としての入力ファイル
規則 ID	RuleId	string
ルールタイプ	RuleType	string	使用可能な値は ALLOW と DENY です
RuleDescription	RuleDescription	string	自然言語でのルールの説明 (たとえば、不快な言語を含むドキュメントを許可しない)
RecognitionMode	RecognitionMode	string	オプション;認識モード - 標準 (既定) は最高の精度を提供しますが、速度は遅くなりますが、標準では応答は速くなりますが、低品質の画像では精度が低くなります。

戻り値

ドキュメントポリシーの適用操作を実行した結果

Body: DocumentPolicyResult

ドキュメントの抽出バッチジョブの状態と結果を取得する

操作 ID:: GetAsyncJobStatus

非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。この API は、Cloudmersive Managed Instance とプライベートクラウドのデプロイでのみ使用できます。

パラメーター

名前	キー	必須	型	説明
状態を取得するバッチジョブのジョブ ID	AsyncJobID		string	状態を取得するバッチジョブのジョブ ID

戻り値

バッチジョブ操作を実行した結果

Body: ExtractDocumentJobStatusResult

高度な AI をバッチジョブとして使用してドキュメントからフィールド値を抽出する

操作 ID:: ExtractFieldsFromDocumentAdvancedBatchJob

大規模なドキュメントを AI バッチジョブとして処理するための非同期バッチジョブを作成します。高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instanceまたはプライベートクラウドのデプロイが必要です。

パラメーター

名前	キー	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
InputFile	InputFile	byte	操作をバイト配列として実行する入力ドキュメントファイル
フィールド名	FieldName	string	抽出するフィールドの名前
FieldOptional	FieldOptional	boolean	省略可能: フィールドが省略可能な場合は True、必要な場合は false (既定値)
FieldDescription	FieldDescription	string	省略可能ですが、推奨: フィールドの説明 - フィールドの内容、書式設定方法、一意のフィールドなどを説明するために使用します。
FieldExample	FieldExample	string	省略可能: フィールドのラベルまたは値の例
MaximumPagesProcessed	MaximumPagesProcessed	integer	省略可能: 処理されるページの数を制限する
Preprocessing	Preprocessing	string	オプション: 精度を高めるために、イメージ前処理のレベルを設定します。指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'ContrastEdgesPlus'、'ContrastEdgesPlus'、'Invert'、'Binarize'、'Compatability'、'None' です。既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 ContrastEdges と ContrastEdgesPlus に設定すると、低品質の白黒またはグレースケール画像のコントラストと読みやすさが向上します。 [反転] に設定すると、入力イメージが反転されます。入力イメージをバイナリ化するには、バイナリ化に設定します。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。
ResultCrossCheck	ResultCrossCheck	string	省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。指定できる値は、'None'、'Advanced'、'Ultra' です。既定値は None です。 Ultraは最高の精度を生み出しますが、処理時間は長くなります。
RotateImageDegrees	RotateImageDegrees	double	省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。

戻り値

分割ドキュメントバッチジョブを実行した結果

Body: ExtractDocumentBatchJobResult

高度な AI を使用してドキュメントからフィールド値を抽出する

操作 ID:: ExtractFieldsAdvanced

高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
InputFile	InputFile	byte	操作をバイト配列として実行する入力ドキュメントファイル
フィールド名	FieldName	string	抽出するフィールドの名前
FieldOptional	FieldOptional	boolean	省略可能: フィールドが省略可能な場合は True、必要な場合は false (既定値)
FieldDescription	FieldDescription	string	省略可能ですが、推奨: フィールドの説明 - フィールドの内容、書式設定方法、一意のフィールドなどを説明するために使用します。
FieldExample	FieldExample	string	省略可能: フィールドのラベルまたは値の例
MaximumPagesProcessed	MaximumPagesProcessed	integer	省略可能: 処理されるページの数を制限する
Preprocessing	Preprocessing	string	オプション: 精度を高めるために、イメージ前処理のレベルを設定します。指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'ContrastEdgesPlus'、'ContrastEdgesPlus'、'Invert'、'Binarize'、'Compatability'、'None' です。既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 ContrastEdges と ContrastEdgesPlus に設定すると、低品質の白黒またはグレースケール画像のコントラストと読みやすさが向上します。 [反転] に設定すると、入力イメージが反転されます。入力イメージをバイナリ化するには、バイナリ化に設定します。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。
ResultCrossCheck	ResultCrossCheck	string	省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。指定できる値は、'None'、'Advanced'、'Ultra' です。既定値は None です。 Ultraは最高の精度を生み出しますが、処理時間は長くなります。
RotateImageDegrees	RotateImageDegrees	double	省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。

戻り値

ドキュメントからフィールドを抽出した結果

Body: ExtractFieldsAdvancedResponse

高度な AI を使用してドキュメントから分類またはカテゴリを抽出する

操作 ID:: ExtractClassificationAdvanced

高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。	recognitionMode	string	オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
InputFile	InputFile	byte	操作をバイト配列として実行する入力ドキュメントファイル
カテゴリ名	CategoryName	string	分類の名前
CategoryDescription	CategoryDescription	string	省略可能ですが推奨: 自然言語での分類の説明
Preprocessing	Preprocessing	string	オプション: 精度を高めるために、イメージ前処理のレベルを設定します。指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'Compatability' および 'None' です。既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。
ResultCrossCheck	ResultCrossCheck	string	省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。指定できる値は、'None'、'Advanced'、'Ultra'、'Hyper' です。既定値は None です。 Ultra と Hyper は最高の精度を生み出しますが、処理時間は長くなります。
MaximumPagesProcessed	MaximumPagesProcessed	integer	省略可能: 処理されるページの数を制限する
RotateImageDegrees	RotateImageDegrees	double	省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。

戻り値

AI を使用してドキュメントを分類した結果

Body: DocumentAdvancedClassificationResult

高度な AI を使用して構造化された方法でドキュメントに関する質問に回答する

操作 ID:: AnswerQuestions

Advanced AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数の選択肢、自由回答の質問に回答します。サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。ページあたり 100 個の API 呼び出しを使用します。

パラメーター

名前	キー	型	説明
InputFile	InputFile	byte	バイト配列としての入力ファイル
QuestionId	QuestionId	string	質問の一意の ID (例: 1 または 2A)
QuestionText	QuestionText	string	回答が YES または NO に解決されるドキュメントを尋ねる自然言語の質問 (例: "このドキュメントは両方の当事者によって署名され、署名されていますか?"
QuestionId	QuestionId	string	質問の一意の ID (例: 1 または 2A)
QuestionText	QuestionText	string	「本契約の準拠法とは何か」など、一定の数の選択肢のいずれかに回答が解決されるドキュメントを尋ねる自然言語の質問。
ChoiceId	ChoiceId	string	応答の選択の一意の ID (例: 3C)
ChoiceText	ChoiceText	string	この選択の説明テキスト (例: "Delaware" )
QuestionId	QuestionId	string	質問の一意の ID (例: 7 または 5A)
QuestionText	QuestionText	string	回答が無料の回答に解決されるドキュメントを尋ねる自然言語の質問 (例: "この契約の対応者は誰ですか?"
RecognitionMode	RecognitionMode	string	オプション;認識モード - 標準 (既定) は最高の精度を提供しますが、速度は遅くなりますが、標準では応答は速くなりますが、低品質の画像では精度が低くなります。

戻り値

ドキュメントの質問に回答する操作を実行した結果

Body: DocumentQuestionAnswersResult

定義

DocumentAdvancedClassificationResult

AI を使用してドキュメントを分類した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
DocumentCategoryResult	DocumentCategoryResult	string	ドキュメントに適用されるカテゴリ。カテゴリを識別できなかった場合は、"other" が使用されます。スペースはアンダースコアに置き換えられます。
信頼度スコア	ConfidenceScore	double	信頼度スコアは 0.0 ~ 1.0 です。値 > 0.8 は高い信頼度を示します

DocumentClassificationResult

AI を使用してドキュメントを分類した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
DocumentCategoryResult	DocumentCategoryResult	string	ドキュメントに適用されるカテゴリ。カテゴリを識別できなかった場合は、"other" が使用されます。スペースはアンダースコアに置き換えられます。

DocumentPolicyResult

ドキュメントポリシーの適用操作を実行した結果

名前	パス	型	説明
CleanResult	CleanResult	boolean	ドキュメントがすべてのポリシーに準拠している場合は true、準拠していない場合は false
RiskScore	RiskScore	double	0.0 から 1.0 の間のリスクスコア。0.5 を超える値によってリスクレベルが増加しています
RuleViolations	RuleViolations	array of PolicyRuleViolation	ポリシー違反

DocumentQuestionAnswerItem

入力の質問に対する回答

名前	パス	型	説明
QuestionId	QuestionId	string	入力質問の ID
AnswerValue	AnswerValue	string	この質問に対して、文字列として書式設定された応答値に回答します。ブール型の質問では、YES または NO が返されます。
AnswerRationale	AnswerRationale	string	この回答が与えられた理由を説明する根拠
信頼度スコア	ConfidenceScore	double	信頼度スコアは 0.0 ~ 1.0 です。0.8 を超える値は高い信頼度を示します

DocumentQuestionAnswersResult

ドキュメントの質問に回答する操作を実行した結果

名前	パス	型	説明
成功	Successful	boolean	操作が正常に完了した場合は True、それ以外の場合は false
信頼度スコア	ConfidenceScore	double	信頼度スコアは 0.0 ~ 1.0 です。0.8 を超える値は高い信頼度を示します
AnswerResults	AnswerResults	array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

ドキュメントからバーコードを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
BarcodeResults	BarcodeResults	array of ExtractedBarcodeItem	抽出操作の結果のテーブル値

ExtractDocumentBatchJobResult

分割ドキュメントバッチジョブを実行した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
AsyncJobID	AsyncJobID	string	ジョブを作成すると、非同期ジョブ ID が返されます。 GetAsyncJobStatus API を使用して AsyncJobID を使用してこのジョブの状態を確認し、終了時に結果を取得します

ExtractDocumentJobStatusResult

バッチジョブ操作を実行した結果

名前	パス	型	説明
成功	Successful	boolean	ジョブの状態を確認する操作が成功した場合は true、それ以外の場合は false
AsyncJobStatus	AsyncJobStatus	string	必要に応じて、非同期ジョブのジョブの状態を返します。考えられる状態は STARTED と COMPLETED です
AsyncJobID	AsyncJobID	string	職務 ID
ExtractTextResult	ExtractTextResult	ExtractTextResponse	ドキュメントからテキストを抽出した結果
ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResponse	ドキュメントからフィールドを抽出した結果
ExtractFieldsResult	ExtractFieldsResult	ExtractFieldsResponse	ドキュメントからフィールドを抽出した結果
ExtractClassificationResult	ExtractClassificationResult	DocumentClassificationResult	AI を使用してドキュメントを分類した結果
エラーメッセージ	ErrorMessage	string	エラーメッセージ (ある場合)

ExtractFieldsAdvancedResponse

ドキュメントからフィールドを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
結果	Results	array of FieldAdvancedValue	抽出操作によるフィールド値の結果
信頼度スコア	ConfidenceScore	double	信頼度スコアは 0.0 ~ 1.0 です。値 > 0.8 は高い信頼度を示します

ExtractFieldsAndTablesResponse

ドキュメントからフィールドを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
FieldResults	FieldResults	array of FieldValue	抽出操作によるフィールド値の結果
TableResults	TableResults	array of TableResult	抽出操作の結果のテーブル値

ExtractFieldsResponse

ドキュメントからフィールドを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
結果	Results	array of FieldValue	抽出操作によるフィールド値の結果

ExtractTablesResponse

ドキュメントからテーブルを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
TableResults	TableResults	array of TableResult	抽出操作の結果のテーブル値

ExtractTextResponse

ドキュメントからテキストを抽出した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
PageResults	PageResults	array of ExtractedTextPage	抽出操作のページ結果

ExtractedBarcodeItem

抽出されたバーコードの結果

名前	パス	型	説明
BarcodeType	BarcodeType	string	識別されるバーコードの種類、使用可能な値は、AZTEC、CODABAR、CODE_39、CODE_93、CODE_128、DATA_MATRIX、EAN_8 EAN_13、ITF、MAXICODE、PDF_417、QR_CODE、RSS_14、RSS_EXPANDED、UPC_A、UPC_E、All_1D、UPC_EAN_EXTENSION、MSI、PLESSEY、IMB、UNKNOWN です。
BarcodeValue	BarcodeValue	string	バーコードの文字列としての値

ExtractedTextPage

入力ドキュメントから抽出されたページ

名前	パス	型	説明
PageNumber	PageNumber	integer	ページ番号インデックス(1 から始まる)
TextResult	TextResult	string	ページのテキストコンテンツ

FieldAdvancedValue

ドキュメントからフィールドを抽出したフィールド値の結果

名前	パス	型	説明
フィールド名	FieldName	string	フィールドの名前 (スペースはアンダースコアに置き換えられます)
FieldStringValue	FieldStringValue	string	ドキュメントから抽出されたフィールドの文字列値

FieldValue

ドキュメントからフィールドを抽出したフィールド値の結果

名前	パス	型	説明
フィールド名	FieldName	string	フィールドの名前 (スペースはアンダースコアに置き換えられます)
FieldStringValue	FieldStringValue	string	ドキュメントから抽出されたフィールドのプライマリまたは最初の文字列値
AdditionalFieldStringValues	AdditionalFieldStringValues	array of string	同じフィールドが複数の値を持つ場合 (たとえば、同じドキュメント内に同じフォームの 2 つのインスタンスが存在する場合) に、このフィールドの追加の値

PolicyRuleViolation

ポリシー規則違反のインスタンス

名前	パス	型	説明
規則 ID	RuleId	string	ルールの ID。ID が指定されていない場合、ID はルールの 1 から始まるインデックスです
RuleViolationRiskScore	RuleViolationRiskScore	double	0.0 から 1.0 の間のリスクスコア。0.5 を超える値によってリスクレベルが増加しています
RuleViolationRationale	RuleViolationRationale	string	このポリシーに違反した理由の AI 自然言語の根拠

SummarizeDocumentResponse

ドキュメントを要約した結果

名前	パス	型	説明
成功	Successful	boolean	成功した場合は True、それ以外の場合は false
DocumentSummaryText	DocumentSummaryText	string	ドキュメントの概要

TableResult

ドキュメントから抽出されたテーブル

名前	パス	型	説明
Title	Title	string	テーブルのタイトル (省略可能)
Rows	Rows	array of TableResultRow	テーブルの行

TableResultCell

ドキュメントから抽出されたテーブルの行のセル

名前	パス	型	説明
CellHeader	CellHeader	string	セル列ヘッダー
CellValue	CellValue	string	文字列としてのセル値

TableResultRow

ドキュメントから抽出されたテーブルの行

名前	パス	型	説明
細胞	Cells	array of TableResultCell	行内のセル

次の方法で共有

ドキュメント AI (プレビュー)

Cloudmersive Document AI Connector

[前提条件]

資格情報を取得する方法

API キーとシークレットを取得する

サポートされている操作

接続を作成する

デフォルト

調整制限

アクション

AI をバッチ ジョブとして使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する

パラメーター

戻り値

AI をバッチ ジョブとして使用してドキュメントからテキストを抽出する

パラメーター

戻り値

AI をバッチ ジョブとして使用してドキュメントから分類またはカテゴリを抽出する

パラメーター

戻り値

AI を使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する

パラメーター

戻り値

AI を使用してドキュメントからテキストを抽出する

パラメーター

戻り値

AI を使用してドキュメントからデータのテーブルを抽出する

パラメーター

戻り値

AI を使用してドキュメントからバーコードを抽出する

パラメーター

戻り値

AI を使用してドキュメントからフィールド値を抽出する

パラメーター

戻り値

AI を使用してドキュメントから分類またはカテゴリを抽出する

パラメーター

戻り値

AI を使用してドキュメントから概要を抽出する

パラメーター

戻り値

ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックする

パラメーター

戻り値

ドキュメントの抽出バッチ ジョブの状態と結果を取得する

パラメーター

戻り値

高度な AI をバッチ ジョブとして使用してドキュメントからフィールド値を抽出する

パラメーター

戻り値

高度な AI を使用してドキュメントからフィールド値を抽出する

パラメーター

戻り値

高度な AI を使用してドキュメントから分類またはカテゴリを抽出する

パラメーター

戻り値

高度な AI を使用して構造化された方法でドキュメントに関する質問に回答する

パラメーター

戻り値

定義

DocumentAdvancedClassificationResult

DocumentClassificationResult

DocumentPolicyResult

DocumentQuestionAnswerItem

DocumentQuestionAnswersResult

ExtractBarcodesAiResponse

ExtractDocumentBatchJobResult

ExtractDocumentJobStatusResult

ExtractFieldsAdvancedResponse

ExtractFieldsAndTablesResponse

ExtractFieldsResponse

ExtractTablesResponse

ExtractTextResponse

ExtractedBarcodeItem

ExtractedTextPage

FieldAdvancedValue

FieldValue

PolicyRuleViolation

SummarizeDocumentResponse

TableResult

AI をバッチジョブとして使用してドキュメントからすべてのフィールドとデータテーブルを抽出する

AI をバッチジョブとして使用してドキュメントからテキストを抽出する

AI をバッチジョブとして使用してドキュメントから分類またはカテゴリを抽出する

AI を使用してドキュメントからすべてのフィールドとデータテーブルを抽出する

ドキュメントの抽出バッチジョブの状態と結果を取得する

高度な AI をバッチジョブとして使用してドキュメントからフィールド値を抽出する