ドキュメント AI (プレビュー)
AI を使用して、一般的なドキュメント形式、スキャンされたドキュメント、ドキュメントの写真から、名前付きフィールド、テーブル、バーコード、分類、および概要を含む構造化データを抽出します。 また、手書きと低品質の写真やスキャン、デジタルドキュメント入力もサポートしています。 さまざまな言語をサポートし、ドキュメントのビジュアル レイアウトからセマンティック構造を分析および推論できます。
このコネクタは、次の製品とリージョンで使用できます。
| サービス | クラス | リージョン |
|---|---|---|
| コピロット スタジオ | Premium | 次を除くすべての Power Automate リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD) |
| ロジック アプリ | Standard | 次を除くすべての Logic Apps リージョン : - Azure Government リージョン - Azure China リージョン - 米国国防総省 (DoD) |
| Power Apps | Premium | 次を除くすべての Power Apps リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD) |
| Power Automate(パワーオートメート) | Premium | 次を除くすべての Power Automate リージョン : - 米国政府 (GCC) - 米国政府 (GCC High) - 21Vianet が運営する China Cloud - 米国国防総省 (DoD) |
| お問い合わせ | |
|---|---|
| 名前 | Cloudmersive |
| URL | https://www.cloudmersive.com |
| support@cloudmersive.com |
| コネクタ メタデータ | |
|---|---|
| パブリッシャー | Cloudmersive、LLC |
| Web サイト | https://www.cloudmersive.com |
| プライバシー ポリシー | https://www.cloudmersive.com/privacy-policy |
| カテゴリ | 人工知能;コンテンツとファイル |
Cloudmersive Document AI Connector
Cloudmersive Document AI API を使用すると、次世代 AI を使用して、ドキュメントからデータ、フィールド、分析情報、テキストを抽出できます。
[前提条件]
続行するには、次のものが必要です。
- Premium コネクタをサポートする Microsoft Power Apps、Power Automate、または Azure Logic Apps
- Cloudmersive API キー
資格情報を取得する方法
このコネクタを使用するには、Cloudmersive アカウントが必要です。 Microsoft アカウントでサインアップするか、Cloudmersive アカウントを作成できます。 API キーを取得するには、次の手順に従います。
API キーとシークレットを取得する
- Cloudmersive アカウントに登録する
- [API キー] をクリックします
ここでは、[API キー] ページに表示されている API キーを作成して確認できます。 この API キーをコピーして Cloudmersive Document AI Connector に貼り付けるだけです。
これで、Cloudmersive CDR コネクタの使用を開始する準備ができました。
サポートされている操作
コネクタは、次の操作をサポートしています。
-
Enforce Policies to a Document to allow or block it using Advanced AI: ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックします。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Answer Questions about a Document in a structured way using Advanced AI:高度な AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数選択の質問、自由回答の質問に回答します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Text from a Document using AI: AI を使用してドキュメントから生テキストを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 さまざまな言語をサポートします。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Field Values from a Document using AI: AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Field Values from a Document using Advanced AI: 高度な AI を使用して、ドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Tables of Data from a Document using AI: AI を使用してドキュメントから、データの行と列で構成されるテーブルを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Barcodes of from a Document using AI: AI を使用してドキュメントからすべてのバーコードを抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract All Fields and Tables of Data from a Document using AI: AI を使用してドキュメントから、データの行と列で構成されるすべてのフィールドとテーブルを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Classification or Category from a Document using AI: AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Classification or Category from a Document using Advanced AI: 高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Summary from a Document using AI: 人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 -
Extract Text from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 さまざまな言語をサポートします。 Managed Instance またはプライベート クラウドのデプロイが必要です。 -
Extract Field Values from a Document using Advanced AI as a Batch Job: 大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 -
Extract All Fields and Tables of Data from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 -
Extract Classification or Category from a Document using AI as a Batch Job: 大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 -
Get the status and result of an Extract Document Batch Job: 非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。 この API は、Cloudmersive Managed Instance とプライベート クラウドのデプロイでのみ使用できます。
接続を作成する
コネクタでは、次の認証の種類がサポートされています。
| デフォルト | 接続を作成するためのパラメーター。 | すべてのリージョン | 共有不可 |
デフォルト
適用対象: すべてのリージョン
接続を作成するためのパラメーター。
これは共有可能な接続ではありません。 電源アプリが別のユーザーと共有されている場合、別のユーザーは新しい接続を明示的に作成するように求められます。
| 名前 | タイプ | Description | 必須 |
|---|---|---|---|
| Apikey | securestring | この API の Apikey | 正しい |
調整制限
| 名前 | 呼び出し | 更新期間 |
|---|---|---|
| 接続ごとの API 呼び出し | 100 | 60 秒 |
アクション
| AI をバッチ ジョブとして使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する |
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 |
| AI をバッチ ジョブとして使用してドキュメントからテキストを抽出する |
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 さまざまな言語をサポートします。 Managed Instance またはプライベート クラウドのデプロイが必要です。 |
| AI をバッチ ジョブとして使用してドキュメントから分類またはカテゴリを抽出する |
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 |
| AI を使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する |
AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| AI を使用してドキュメントからテキストを抽出する |
AI を使用してドキュメントから生テキストを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 さまざまな言語をサポートします。 ページあたり 100 個の API 呼び出しを使用します。 |
| AI を使用してドキュメントからデータのテーブルを抽出する |
AI を使用してドキュメントからデータの行と列で構成されるテーブルを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 1 ページあたり 100 回の API 呼び出しを使用しました。 |
| AI を使用してドキュメントからバーコードを抽出する |
AI を使用してドキュメントからすべてのバーコードを抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。 ページあたり 100 個の API 呼び出しを使用します。 |
| AI を使用してドキュメントからフィールド値を抽出する |
AI を使用してドキュメントからフィールド値 (請求書番号、請求日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| AI を使用してドキュメントから分類またはカテゴリを抽出する |
AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| AI を使用してドキュメントから概要を抽出する |
人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックする |
ドキュメントにポリシーを適用して、高度な AI を使用してドキュメントを許可またはブロックします。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| ドキュメントの抽出バッチ ジョブの状態と結果を取得する |
非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。 この API は、Cloudmersive Managed Instance とプライベート クラウドのデプロイでのみ使用できます。 |
| 高度な AI をバッチ ジョブとして使用してドキュメントからフィールド値を抽出する |
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。 |
| 高度な AI を使用してドキュメントからフィールド値を抽出する |
高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| 高度な AI を使用してドキュメントから分類またはカテゴリを抽出する |
高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
| 高度な AI を使用して構造化された方法でドキュメントに関する質問に回答する |
Advanced AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数の選択肢、自由回答の質問に回答します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。 |
AI をバッチ ジョブとして使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
分割ドキュメント バッチ ジョブを実行した結果
AI をバッチ ジョブとして使用してドキュメントからテキストを抽出する
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 さまざまな言語をサポートします。 Managed Instance またはプライベート クラウドのデプロイが必要です。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
分割ドキュメント バッチ ジョブを実行した結果
AI をバッチ ジョブとして使用してドキュメントから分類またはカテゴリを抽出する
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
抽出する必要な分類
|
Categories | string |
抽出する必要な分類 |
|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
分割ドキュメント バッチ ジョブを実行した結果
AI を使用してドキュメントからすべてのフィールドとデータ テーブルを抽出する
AI を使用して、データの行と列で構成されるすべてのフィールドとテーブルをドキュメントから抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 ...
|
preprocessing | string |
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 ... |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントからフィールドを抽出した結果
AI を使用してドキュメントからテキストを抽出する
AI を使用してドキュメントから生テキストを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 さまざまな言語をサポートします。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントからテキストを抽出した結果
- Body
- ExtractTextResponse
AI を使用してドキュメントからデータのテーブルを抽出する
AI を使用してドキュメントからデータの行と列で構成されるテーブルを抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 1 ページあたり 100 回の API 呼び出しを使用しました。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントからテーブルを抽出した結果
AI を使用してドキュメントからバーコードを抽出する
AI を使用してドキュメントからすべてのバーコードを抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC、WEBP などがあります。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントからバーコードを抽出した結果
AI を使用してドキュメントからフィールド値を抽出する
AI を使用してドキュメントからフィールド値 (請求書番号、請求日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
抽出する必要なフィールド、コンマ区切り
|
FieldNames | string |
抽出する必要なフィールド、コンマ区切り |
|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントからフィールドを抽出した結果
AI を使用してドキュメントから分類またはカテゴリを抽出する
AI を使用してドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
抽出する必要な分類
|
Categories | string |
抽出する必要な分類 |
|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
AI を使用してドキュメントを分類した結果
AI を使用してドキュメントから概要を抽出する
人工知能を使用して、入力ドキュメントの 1 段落の概要を作成します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
入力ドキュメント、またはドキュメントの写真からデータを抽出する
|
InputFile | file |
入力ドキュメント、またはドキュメントの写真からデータを抽出する |
戻り値
ドキュメントを要約した結果
ドキュメントにポリシーを適用して、Advanced AI を使用してドキュメントを許可またはブロックする
ドキュメントにポリシーを適用して、高度な AI を使用してドキュメントを許可またはブロックします。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
バイト配列としての入力ファイル |
|
|
規則 ID
|
RuleId | string | ||
|
ルールタイプ
|
RuleType | string |
使用可能な値は ALLOW と DENY です |
|
|
RuleDescription
|
RuleDescription | string |
自然言語でのルールの説明 (たとえば、不快な言語を含むドキュメントを許可しない) |
|
|
RecognitionMode
|
RecognitionMode | string |
オプション;認識モード - 標準 (既定) は最高の精度を提供しますが、速度は遅くなりますが、標準では応答は速くなりますが、低品質の画像では精度が低くなります。 |
戻り値
ドキュメント ポリシーの適用操作を実行した結果
- Body
- DocumentPolicyResult
ドキュメントの抽出バッチ ジョブの状態と結果を取得する
非同期ジョブの結果を返します。可能な状態は STARTED または COMPLETED です。 この API は、Cloudmersive Managed Instance とプライベート クラウドのデプロイでのみ使用できます。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
状態を取得するバッチ ジョブのジョブ ID
|
AsyncJobID | string |
状態を取得するバッチ ジョブのジョブ ID |
戻り値
バッチ ジョブ操作を実行した結果
高度な AI をバッチ ジョブとして使用してドキュメントからフィールド値を抽出する
大規模なドキュメントを AI バッチ ジョブとして処理するための非同期バッチ ジョブを作成します。 高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 Managed Instance またはプライベート クラウドのデプロイが必要です。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
InputFile
|
InputFile | byte |
操作をバイト配列として実行する入力ドキュメント ファイル |
|
|
フィールド名
|
FieldName | string |
抽出するフィールドの名前 |
|
|
FieldOptional
|
FieldOptional | boolean |
省略可能: フィールドが省略可能な場合は True、必要な場合は false (既定値) |
|
|
FieldDescription
|
FieldDescription | string |
省略可能ですが、推奨: フィールドの説明 - フィールドの内容、書式設定方法、一意のフィールドなどを説明するために使用します。 |
|
|
FieldExample
|
FieldExample | string |
省略可能: フィールドのラベルまたは値の例 |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
省略可能: 処理されるページの数を制限する |
|
|
Preprocessing
|
Preprocessing | string |
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'ContrastEdgesPlus'、'ContrastEdgesPlus'、'Invert'、'Binarize'、'Compatability'、'None' です。 既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 ContrastEdges と ContrastEdgesPlus に設定すると、低品質の白黒またはグレースケール画像のコントラストと読みやすさが向上します。 [反転] に設定すると、入力イメージが反転されます。 入力イメージをバイナリ化するには、バイナリ化に設定します。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。 |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。 指定できる値は、'None'、'Advanced'、'Ultra' です。 既定値は None です。 Ultraは最高の精度を生み出しますが、処理時間は長くなります。 |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。 |
戻り値
分割ドキュメント バッチ ジョブを実行した結果
高度な AI を使用してドキュメントからフィールド値を抽出する
高度な AI を使用してドキュメントからフィールド値 (請求書番号、請求書日、名刺の電話番号など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
InputFile
|
InputFile | byte |
操作をバイト配列として実行する入力ドキュメント ファイル |
|
|
フィールド名
|
FieldName | string |
抽出するフィールドの名前 |
|
|
FieldOptional
|
FieldOptional | boolean |
省略可能: フィールドが省略可能な場合は True、必要な場合は false (既定値) |
|
|
FieldDescription
|
FieldDescription | string |
省略可能ですが、推奨: フィールドの説明 - フィールドの内容、書式設定方法、一意のフィールドなどを説明するために使用します。 |
|
|
FieldExample
|
FieldExample | string |
省略可能: フィールドのラベルまたは値の例 |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
省略可能: 処理されるページの数を制限する |
|
|
Preprocessing
|
Preprocessing | string |
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'ContrastEdgesPlus'、'ContrastEdgesPlus'、'Invert'、'Binarize'、'Compatability'、'None' です。 既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 ContrastEdges と ContrastEdgesPlus に設定すると、低品質の白黒またはグレースケール画像のコントラストと読みやすさが向上します。 [反転] に設定すると、入力イメージが反転されます。 入力イメージをバイナリ化するには、バイナリ化に設定します。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。 |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。 指定できる値は、'None'、'Advanced'、'Ultra' です。 既定値は None です。 Ultraは最高の精度を生み出しますが、処理時間は長くなります。 |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。 |
戻り値
ドキュメントからフィールドを抽出した結果
高度な AI を使用してドキュメントから分類またはカテゴリを抽出する
高度な AI を使用して、ドキュメントから分類またはカテゴリ (請求書、領収書、税フォーム、フォーム 1040、フォーム 1040 EZ など) を抽出します。 サポートされる入力ドキュメント形式には、DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、WEBP が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。
|
recognitionMode | string |
オプション;認識モード - 高度 (既定値) は、最も高い a... を提供します。 |
|
|
InputFile
|
InputFile | byte |
操作をバイト配列として実行する入力ドキュメント ファイル |
|
|
カテゴリ名
|
CategoryName | string |
分類の名前 |
|
|
CategoryDescription
|
CategoryDescription | string |
省略可能ですが推奨: 自然言語での分類の説明 |
|
|
Preprocessing
|
Preprocessing | string |
オプション: 精度を高めるために、イメージ前処理のレベルを設定します。 指定できる値は、'Auto'、'SmoothEdges'、'SmoothEdgesPlus'、'Compatability' および 'None' です。 既定値は [自動] です。SmoothEdges に設定すると、入力画像の粗いエッジがスムーズに表示され、認識精度が向上します。 SmoothEdgesPlus に設定すると、粗いエッジを高度に滑らかにできます。 PDF 機能の互換性を最大限に高めるために、[互換性] に設定します。 |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
省略可能: 入力に対して実行する出力精度クロスチェックのレベルを設定します。 指定できる値は、'None'、'Advanced'、'Ultra'、'Hyper' です。 既定値は None です。 Ultra と Hyper は最高の精度を生み出しますが、処理時間は長くなります。 |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
省略可能: 処理されるページの数を制限する |
|
|
RotateImageDegrees
|
RotateImageDegrees | double |
省略可能: 指定された度数だけ認識する前に入力画像を回転させます。有効な値の範囲は、-360 ~ +360 です。 |
戻り値
AI を使用してドキュメントを分類した結果
高度な AI を使用して構造化された方法でドキュメントに関する質問に回答する
Advanced AI を使用して、ドキュメントの内容に関するブール値 (はい/いいえ)、複数の選択肢、自由回答の質問に回答します。 サポートされている入力ドキュメント形式には、DOCX、PDF、PNG、JPG が含まれます。 ページあたり 100 個の API 呼び出しを使用します。
パラメーター
| 名前 | キー | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
バイト配列としての入力ファイル |
|
|
QuestionId
|
QuestionId | string |
質問の一意の ID (例: 1 または 2A) |
|
|
QuestionText
|
QuestionText | string |
回答が YES または NO に解決されるドキュメントを尋ねる自然言語の質問 (例: "このドキュメントは両方の当事者によって署名され、署名されていますか?" |
|
|
QuestionId
|
QuestionId | string |
質問の一意の ID (例: 1 または 2A) |
|
|
QuestionText
|
QuestionText | string |
「本契約の準拠法とは何か」など、一定の数の選択肢のいずれかに回答が解決されるドキュメントを尋ねる自然言語の質問。 |
|
|
ChoiceId
|
ChoiceId | string |
応答の選択の一意の ID (例: 3C) |
|
|
ChoiceText
|
ChoiceText | string |
この選択の説明テキスト (例: "Delaware" ) |
|
|
QuestionId
|
QuestionId | string |
質問の一意の ID (例: 7 または 5A) |
|
|
QuestionText
|
QuestionText | string |
回答が無料の回答に解決されるドキュメントを尋ねる自然言語の質問 (例: "この契約の対応者は誰ですか?" |
|
|
RecognitionMode
|
RecognitionMode | string |
オプション;認識モード - 標準 (既定) は最高の精度を提供しますが、速度は遅くなりますが、標準では応答は速くなりますが、低品質の画像では精度が低くなります。 |
戻り値
ドキュメントの質問に回答する操作を実行した結果
定義
DocumentAdvancedClassificationResult
AI を使用してドキュメントを分類した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
ドキュメントに適用されるカテゴリ。カテゴリを識別できなかった場合は、"other" が使用されます。 スペースはアンダースコアに置き換えられます。 |
|
信頼度スコア
|
ConfidenceScore | double |
信頼度スコアは 0.0 ~ 1.0 です。値 > 0.8 は高い信頼度を示します |
DocumentClassificationResult
AI を使用してドキュメントを分類した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
ドキュメントに適用されるカテゴリ。カテゴリを識別できなかった場合は、"other" が使用されます。 スペースはアンダースコアに置き換えられます。 |
DocumentPolicyResult
ドキュメント ポリシーの適用操作を実行した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
CleanResult
|
CleanResult | boolean |
ドキュメントがすべてのポリシーに準拠している場合は true、準拠していない場合は false |
|
RiskScore
|
RiskScore | double |
0.0 から 1.0 の間のリスク スコア。0.5 を超える値によってリスク レベルが増加しています |
|
RuleViolations
|
RuleViolations | array of PolicyRuleViolation |
ポリシー違反 |
DocumentQuestionAnswerItem
入力の質問に対する回答
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
QuestionId
|
QuestionId | string |
入力質問の ID |
|
AnswerValue
|
AnswerValue | string |
この質問に対して、文字列として書式設定された応答値に回答します。 ブール型の質問では、YES または NO が返されます。 |
|
AnswerRationale
|
AnswerRationale | string |
この回答が与えられた理由を説明する根拠 |
|
信頼度スコア
|
ConfidenceScore | double |
信頼度スコアは 0.0 ~ 1.0 です。0.8 を超える値は高い信頼度を示します |
DocumentQuestionAnswersResult
ドキュメントの質問に回答する操作を実行した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
操作が正常に完了した場合は True、それ以外の場合は false |
|
信頼度スコア
|
ConfidenceScore | double |
信頼度スコアは 0.0 ~ 1.0 です。0.8 を超える値は高い信頼度を示します |
|
AnswerResults
|
AnswerResults | array of DocumentQuestionAnswerItem |
ExtractBarcodesAiResponse
ドキュメントからバーコードを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
BarcodeResults
|
BarcodeResults | array of ExtractedBarcodeItem |
抽出操作の結果のテーブル値 |
ExtractDocumentBatchJobResult
分割ドキュメント バッチ ジョブを実行した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
AsyncJobID
|
AsyncJobID | string |
ジョブを作成すると、非同期ジョブ ID が返されます。 GetAsyncJobStatus API を使用して AsyncJobID を使用してこのジョブの状態を確認し、終了時に結果を取得します |
ExtractDocumentJobStatusResult
バッチ ジョブ操作を実行した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
ジョブの状態を確認する操作が成功した場合は true、それ以外の場合は false |
|
AsyncJobStatus
|
AsyncJobStatus | string |
必要に応じて、非同期ジョブのジョブの状態を返します。 考えられる状態は STARTED と COMPLETED です |
|
AsyncJobID
|
AsyncJobID | string |
職務 ID |
|
ExtractTextResult
|
ExtractTextResult | ExtractTextResponse |
ドキュメントからテキストを抽出した結果 |
|
ExtractFieldsAndTablesResult
|
ExtractFieldsAndTablesResult | ExtractFieldsAndTablesResponse |
ドキュメントからフィールドを抽出した結果 |
|
ExtractFieldsResult
|
ExtractFieldsResult | ExtractFieldsResponse |
ドキュメントからフィールドを抽出した結果 |
|
ExtractClassificationResult
|
ExtractClassificationResult | DocumentClassificationResult |
AI を使用してドキュメントを分類した結果 |
|
エラーメッセージ
|
ErrorMessage | string |
エラー メッセージ (ある場合) |
ExtractFieldsAdvancedResponse
ドキュメントからフィールドを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
結果
|
Results | array of FieldAdvancedValue |
抽出操作によるフィールド値の結果 |
|
信頼度スコア
|
ConfidenceScore | double |
信頼度スコアは 0.0 ~ 1.0 です。値 > 0.8 は高い信頼度を示します |
ExtractFieldsAndTablesResponse
ドキュメントからフィールドを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
FieldResults
|
FieldResults | array of FieldValue |
抽出操作によるフィールド値の結果 |
|
TableResults
|
TableResults | array of TableResult |
抽出操作の結果のテーブル値 |
ExtractFieldsResponse
ドキュメントからフィールドを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
結果
|
Results | array of FieldValue |
抽出操作によるフィールド値の結果 |
ExtractTablesResponse
ドキュメントからテーブルを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
TableResults
|
TableResults | array of TableResult |
抽出操作の結果のテーブル値 |
ExtractTextResponse
ドキュメントからテキストを抽出した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
PageResults
|
PageResults | array of ExtractedTextPage |
抽出操作のページ結果 |
ExtractedBarcodeItem
抽出されたバーコードの結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
BarcodeType
|
BarcodeType | string |
識別されるバーコードの種類、使用可能な値は、AZTEC、CODABAR、CODE_39、CODE_93、CODE_128、DATA_MATRIX、EAN_8 EAN_13、ITF、MAXICODE、PDF_417、QR_CODE、RSS_14、RSS_EXPANDED、UPC_A、UPC_E、All_1D、UPC_EAN_EXTENSION、MSI、PLESSEY、IMB、UNKNOWN です。 |
|
BarcodeValue
|
BarcodeValue | string |
バーコードの文字列としての値 |
ExtractedTextPage
入力ドキュメントから抽出されたページ
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
PageNumber
|
PageNumber | integer |
ページ番号インデックス(1 から始まる) |
|
TextResult
|
TextResult | string |
ページのテキスト コンテンツ |
FieldAdvancedValue
ドキュメントからフィールドを抽出したフィールド値の結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
フィールド名
|
FieldName | string |
フィールドの名前 (スペースはアンダースコアに置き換えられます) |
|
FieldStringValue
|
FieldStringValue | string |
ドキュメントから抽出されたフィールドの文字列値 |
FieldValue
ドキュメントからフィールドを抽出したフィールド値の結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
フィールド名
|
FieldName | string |
フィールドの名前 (スペースはアンダースコアに置き換えられます) |
|
FieldStringValue
|
FieldStringValue | string |
ドキュメントから抽出されたフィールドのプライマリまたは最初の文字列値 |
|
AdditionalFieldStringValues
|
AdditionalFieldStringValues | array of string |
同じフィールドが複数の値を持つ場合 (たとえば、同じドキュメント内に同じフォームの 2 つのインスタンスが存在する場合) に、このフィールドの追加の値 |
PolicyRuleViolation
ポリシー規則違反のインスタンス
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
規則 ID
|
RuleId | string |
ルールの ID。ID が指定されていない場合、ID はルールの 1 から始まるインデックスです |
|
RuleViolationRiskScore
|
RuleViolationRiskScore | double |
0.0 から 1.0 の間のリスク スコア。0.5 を超える値によってリスク レベルが増加しています |
|
RuleViolationRationale
|
RuleViolationRationale | string |
このポリシーに違反した理由の AI 自然言語の根拠 |
SummarizeDocumentResponse
ドキュメントを要約した結果
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功した場合は True、それ以外の場合は false |
|
DocumentSummaryText
|
DocumentSummaryText | string |
ドキュメントの概要 |
TableResult
ドキュメントから抽出されたテーブル
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
Title
|
Title | string |
テーブルのタイトル (省略可能) |
|
Rows
|
Rows | array of TableResultRow |
テーブルの行 |
TableResultCell
ドキュメントから抽出されたテーブルの行のセル
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
CellHeader
|
CellHeader | string |
セル列ヘッダー |
|
CellValue
|
CellValue | string |
文字列としてのセル値 |
TableResultRow
ドキュメントから抽出されたテーブルの行
| 名前 | パス | 型 | 説明 |
|---|---|---|---|
|
細胞
|
Cells | array of TableResultCell |
行内のセル |