文件 AI（預覽版）

利用 AI 從常見文件格式、掃描文件及文件照片中提取結構化資料，包括命名欄位、表格、條碼、分類與摘要。同時支援手寫、低畫質照片與掃描件，以及數位文件輸入。支援多種語言，並能從文件的視覺化佈局分析並推斷語意結構。

此連接器適用於以下產品和區域：

服務	Class	Regions
Copilot Studio	進階	除以下部分外，所有Power Automate區域： - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）
邏輯應用程式	標準	所有 Logic Apps 區域，但下列區域除外： - Azure Government regions - Azure中國地區 - 美國國防部（DoD）
Power Apps	進階	除以下部分外，所有Power Apps區域 - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）
Power Automate	進階	除以下部分外，所有Power Automate區域： - 美國政府（GCC） - 美國政府（海灣合作委員會高中） - 由 21Vianet 營運的中國雲 - 美國國防部（DoD）

連絡人
名稱	雲浸
URL	https://www.cloudmersive.com
Email	support@cloudmersive.com

連接器中繼資料
Publisher	Cloudmersive有限責任公司
網站	https://www.cloudmersive.com
隱私策略	https://www.cloudmersive.com/privacy-policy
類別	人工智慧;內容和文件

Cloudmersive 文件 AI 連接器

Cloudmersive 文件 AI API 讓您能利用次世代 AI 從文件中提取資料、欄位、洞察與文字。

先決條件

您將需要以下內容才能繼續：

A Microsoft Power Apps， Power Automate 或 Azure Logic Apps with premium connector support
Cloudmersive API 金鑰

如何取得認證

若要使用此連接器，您需要 Cloudmersive 帳戶。您可以使用 Microsoft 帳戶註冊或建立 Cloudmersive 帳戶。請按照以下步驟獲取您的 API 密鑰。

取得 API 金鑰和密碼

註冊 Cloudmersive 帳戶
點擊 API 金鑰

您可以在此處建立並查看 API 金鑰頁面上列出的 API 金鑰。只要將此 API 金鑰複製並貼上到 Cloudmersive 文件 AI 連接器即可。

現在您已準備好開始使用 Cloudmersive CDR 連接器。

支援的作業

連接器支援下列作業：

Enforce Policies to a Document to allow or block it using Advanced AI：使用先進 AI 強制執行文件政策以允許或阻擋。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。
Answer Questions about a Document in a structured way using Advanced AI：利用Advanced AI回答布林（是/否）、多項選擇題及自由回答問題，關於文件內容。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。
Extract Text from a Document using AI：利用 AI 從文件中擷取原始文字。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。支援多種語言。每頁會消耗 100 次 API 呼叫。
Extract Field Values from a Document using AI：利用 AI 從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Field Values from a Document using Advanced AI：利用先進 AI 從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Tables of Data from a Document using AI：使用 AI 從文件中擷取由資料列與欄組成的表格。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Barcodes of from a Document using AI：利用 AI 從文件中擷取所有條碼。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract All Fields and Tables of Data from a Document using AI：利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Classification or Category from a Document using AI：利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Classification or Category from a Document using Advanced AI：利用先進 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格，或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Summary from a Document using AI：利用人工智慧建立輸入文件的一段摘要。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
Extract Text from a Document using AI as a Batch Job：建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。支援多種語言。需要 Managed Instance 或 Private Cloud 部署。
Extract Field Values from a Document using Advanced AI as a Batch Job：建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用先進的人工智慧從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
Extract All Fields and Tables of Data from a Document using AI as a Batch Job：建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
Extract Classification or Category from a Document using AI as a Batch Job：建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
Get the status and result of an Extract Document Batch Job：回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。此 API 僅適用於 Cloudmersive Managed Instance 與私有雲部署。

正在建立連線

連接器支援下列驗證類型：


預設值	建立連線的參數。	所有區域	不可共享

預設

適用：所有地區

建立連線的參數。

這不是可共用的連線。如果 Power App 與其他使用者共用，系統會明確提示其他使用者建立新連線。

名稱	類型	Description	為必填項目
阿皮基	安全字串	此 API 的 Apikey	對

節流限制

名稱	呼叫	續約期間
每個連線的 API 呼叫	100	60 秒

動作

使用 Advanced AI 作為批次作業從文件中擷取欄位值	建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用先進的人工智慧從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
使用 AI 作為批次作業從文件中擷取文字	建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。支援多種語言。需要 Managed Instance 或 Private Cloud 部署。
使用 AI 作為批次作業，從文件中擷取分類或類別	建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
使用 AI 作為批次作業，從文件中擷取所有欄位和資料表	建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。
使用 AI 從文件中擷取所有欄位和資料表	利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
使用 AI 從文件中擷取欄位值	利用 AI 從文件中提取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
利用 AI 從文件中擷取分類或分類	利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
利用 AI 從文件中擷取摘要	利用人工智慧建立輸入文件的一段摘要。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
利用 AI 從文件中擷取文字	利用 AI 從文件中擷取原始文字。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。支援多種語言。每頁會消耗 100 次 API 呼叫。
利用 AI 從文件中擷取條碼	利用 AI 從文件中擷取所有條碼。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。每頁會消耗 100 次 API 呼叫。
利用 AI 從文件中擷取資料表	利用 AI 從文件中擷取資料表，由資料列和欄組成。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁消耗 100 次 API 呼叫。
利用先進 AI 以結構化方式回答文件相關問題	利用 Advanced AI 回答布林（是/否）、選擇題及自由回答問題，內容關於文件內容。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。
利用先進 AI 強制執行文件政策以允許或阻擋	利用進階 AI 強制執行文件政策，允許或阻擋該文件。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。
利用先進 AI 從文件中擷取分類或分類	利用先進 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格，或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
利用先進 AI 從文件中擷取欄位值	利用先進的人工智慧從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。
取得擷取文件批次作業的狀態與結果	回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。此 API 僅適用於 Cloudmersive Managed Instance 與私有雲部署。

使用 Advanced AI 作為批次作業從文件中擷取欄位值

作業識別碼：: ExtractFieldsFromDocumentAdvancedBatchJob

建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用先進的人工智慧從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。

參數

名稱	機碼	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
InputFile	InputFile	byte	輸入文件檔，以位元組陣列形式執行操作
欄位名稱	FieldName	string	要提取的欄位名稱
欄位可選	FieldOptional	boolean	可選：若欄位為可選，則為真;若必要，則為假（預設）
田野描述	FieldDescription	string	可選但建議：欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。
FieldExample	FieldExample	string	可選：欄位的範例標籤或值
最大處理頁面	MaximumPagesProcessed	integer	可選：限制處理的頁面數量
Preprocessing	Preprocessing	string	可選：設定影像前處理等級以提升準確度。可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。預設為自動。設定為 SmoothEdges，以平滑輸入影像中較硬的邊緣以提升辨識準確度。設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。設定為 ContrastEdges 和 ContrastEdgesPlus，以提升低品質黑白或灰階影像的對比度與可讀性。設定為反轉以反轉輸入影像。設定為二元化以二元化輸入影像。設定為相容性以達到最大 PDF 功能相容性。
結果交叉檢查	ResultCrossCheck	string	可選：設定輸出準確度交叉檢查的水準，用於輸入。可能的數值有「無」、「進階」和「超高」。預設值為 None。 Ultra 能產生最高精度，但代價是處理時間較長。
旋轉影像度數	RotateImageDegrees	double	可選：在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

執行分割文件批次作業的結果

身體: ExtractDocumentBatchJobResult

使用 AI 作為批次作業從文件中擷取文字

作業識別碼：: ExtractTextFromDocumentBatchJob

建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。支援多種語言。需要 Managed Instance 或 Private Cloud 部署。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

執行分割文件批次作業的結果

身體: ExtractDocumentBatchJobResult

使用 AI 作為批次作業，從文件中擷取分類或類別

作業識別碼：: ExtractClassificationFromDocumentBatchJob

建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。

參數

名稱	機碼	類型	Description
想要提取的分類	Categories	string	想要提取的分類
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile	file	輸入文件或文件相片，以從中擷取資料

傳回

執行分割文件批次作業的結果

身體: ExtractDocumentBatchJobResult

使用 AI 作為批次作業，從文件中擷取所有欄位和資料表

作業識別碼：: ExtractAllFieldsAndTablesFromDocumentBatchJob

建立一個非同步批次工作，作為 AI 批次工作來處理大型文件。利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。需要 Managed Instance 或 Private Cloud 部署。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

執行分割文件批次作業的結果

身體: ExtractDocumentBatchJobResult

使用 AI 從文件中擷取所有欄位和資料表

作業識別碼：: ExtractAllFieldsAndTables

利用 AI 從文件中擷取所有欄位與表格，包含資料的列與欄。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
可選：設定影像前處理等級以提升準確度。 ...	preprocessing	string	可選：設定影像前處理等級以提升準確度。 ...
輸入文件或文件相片，以從中擷取資料	InputFile	file	輸入文件或文件相片，以從中擷取資料

傳回

從文件中擷取欄位的結果

身體: ExtractFieldsAndTablesResponse

使用 AI 從文件中擷取欄位值

作業識別碼：: ExtractFields

利用 AI 從文件中提取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
欲擷取欄位，逗號分隔	FieldNames	string	欲擷取欄位，逗號分隔
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile	file	輸入文件或文件相片，以從中擷取資料

傳回

從文件中擷取欄位的結果

身體: ExtractFieldsResponse

利用 AI 從文件中擷取分類或分類

作業識別碼：: ExtractClassification

利用 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
想要提取的分類	Categories	string	想要提取的分類
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile	file	輸入文件或文件相片，以從中擷取資料

傳回

利用 AI 分類文件的結果

身體: DocumentClassificationResult

利用 AI 從文件中擷取摘要

作業識別碼：: ExtractSummary

利用人工智慧建立輸入文件的一段摘要。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

文件摘要的結果

身體: SummarizeDocumentResponse

利用 AI 從文件中擷取文字

作業識別碼：: ExtractText

利用 AI 從文件中擷取原始文字。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。支援多種語言。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

從文件中擷取文字的結果

身體: ExtractTextResponse

利用 AI 從文件中擷取條碼

作業識別碼：: ExtractBarcodes

利用 AI 從文件中擷取所有條碼。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

從文件中擷取條碼的結果

身體: ExtractBarcodesAiResponse

利用 AI 從文件中擷取資料表

作業識別碼：: ExtractTables

利用 AI 從文件中擷取資料表，由資料列和欄組成。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁消耗 100 次 API 呼叫。

參數

名稱	機碼	必要	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode		string	選修;辨識模式 - 進階（預設）提供最高等級的...
輸入文件或文件相片，以從中擷取資料	InputFile		file	輸入文件或文件相片，以從中擷取資料

傳回

從文件中擷取資料表的結果

身體: ExtractTablesResponse

利用先進 AI 以結構化方式回答文件相關問題

作業識別碼：: AnswerQuestions

利用 Advanced AI 回答布林（是/否）、選擇題及自由回答問題，內容關於文件內容。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
InputFile	InputFile	byte	輸入檔案以位元組陣列形式呈現
問題ID	QuestionId	string	問題的唯一識別碼，例如 1 或 2A
問題正文	QuestionText	string	用自然語言向文件提出的問題，當答案為「是」或「否」時，例如：「此文件是否由雙方簽署並雙簽？」
問題ID	QuestionId	string	問題的唯一識別碼，例如 1 或 2A
問題正文	QuestionText	string	以自然語言向文件提出的問題，該文件的答案為固定數量的選項之一，例如：「本協議的適用法律是什麼？」
ChoiceId（選擇性）	ChoiceId	string	回應選擇的唯一識別碼，例如 3C
選擇文字	ChoiceText	string	此選擇的描述文字，例如「特拉華州」
問題ID	QuestionId	string	問題的唯一識別碼，例如 7 或 5A
問題正文	QuestionText	string	用自然語言向文件提出的問題，答案為自由回應，例如：「本協議的對手方是誰？」
識別模式	RecognitionMode	string	選修;辨識模式 - 一般（預設）提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低

傳回

執行文件問答操作的結果

身體: DocumentQuestionAnswersResult

利用先進 AI 強制執行文件政策以允許或阻擋

作業識別碼：: ApplyRules

利用進階 AI 強制執行文件政策，允許或阻擋該文件。支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
InputFile	InputFile	byte	輸入檔案以位元組陣列形式呈現
規則識別碼	RuleId	string
規則類型	RuleType	string	可能的值為 ALLOW 與 DENY
規則描述	RuleDescription	string	規則的自然語言說明，例如：不允許包含冒犯性語言的文件
識別模式	RecognitionMode	string	選修;辨識模式 - 一般（預設）提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低

傳回

執行文件政策執行操作的結果

身體: DocumentPolicyResult

利用先進 AI 從文件中擷取分類或分類

作業識別碼：: ExtractClassificationAdvanced

利用先進 AI 從文件中擷取分類或類別（例如發票、收據、稅務表格，或 1040 表格、1040 EZ 表格等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
InputFile	InputFile	byte	輸入文件檔，以位元組陣列形式執行操作
類別名稱	CategoryName	string	分類名稱
分類描述	CategoryDescription	string	可選但建議：自然語言分類說明
Preprocessing	Preprocessing	string	可選：設定影像前處理等級以提升準確度。可能的值包括「自動」、「SmoothEdges」、「SmoothEdgesPlus」、「相容性」和「無」。預設為自動。設定為 SmoothEdges，以平滑輸入影像中較硬的邊緣以提升辨識準確度。設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。設定為相容性以達到最大 PDF 功能相容性。
結果交叉檢查	ResultCrossCheck	string	可選：設定輸出準確度交叉檢查的水準，用於輸入。可能的數值有「無」、「進階」、「極致」和「超高」。預設值為 None。 Ultra 和 Hyper 會產生最高的準確度，但代價是處理時間較長。
最大處理頁面	MaximumPagesProcessed	integer	可選：限制處理的頁面數量
旋轉影像度數	RotateImageDegrees	double	可選：在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

利用 AI 分類文件的結果

身體: DocumentAdvancedClassificationResult

利用先進 AI 從文件中擷取欄位值

作業識別碼：: ExtractFieldsAdvanced

利用先進的人工智慧從文件中擷取欄位值（例如發票號碼、發票日期、名片電話號碼等）。支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。每頁會消耗 100 次 API 呼叫。

參數

名稱	機碼	類型	Description
選修;辨識模式 - 進階（預設）提供最高等級的...	recognitionMode	string	選修;辨識模式 - 進階（預設）提供最高等級的...
InputFile	InputFile	byte	輸入文件檔，以位元組陣列形式執行操作
欄位名稱	FieldName	string	要提取的欄位名稱
欄位可選	FieldOptional	boolean	可選：若欄位為可選，則為真;若必要，則為假（預設）
田野描述	FieldDescription	string	可選但建議：欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。
FieldExample	FieldExample	string	可選：欄位的範例標籤或值
最大處理頁面	MaximumPagesProcessed	integer	可選：限制處理的頁面數量
Preprocessing	Preprocessing	string	可選：設定影像前處理等級以提升準確度。可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。預設為自動。設定為 SmoothEdges，以平滑輸入影像中較硬的邊緣以提升辨識準確度。設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。設定為 ContrastEdges 和 ContrastEdgesPlus，以提升低品質黑白或灰階影像的對比度與可讀性。設定為反轉以反轉輸入影像。設定為二元化以二元化輸入影像。設定為相容性以達到最大 PDF 功能相容性。
結果交叉檢查	ResultCrossCheck	string	可選：設定輸出準確度交叉檢查的水準，用於輸入。可能的數值有「無」、「進階」和「超高」。預設值為 None。 Ultra 能產生最高精度，但代價是處理時間較長。
旋轉影像度數	RotateImageDegrees	double	可選：在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

從文件中擷取欄位的結果

身體: ExtractFieldsAdvancedResponse

取得擷取文件批次作業的狀態與結果

作業識別碼：: GetAsyncJobStatus

回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。此 API 僅適用於 Cloudmersive Managed Instance 與私有雲部署。

參數

名稱	機碼	必要	類型	Description
批次作業的 Job ID 以取得的狀態	AsyncJobID		string	批次作業的 Job ID 以取得的狀態

傳回

執行批次作業操作的結果

身體: ExtractDocumentJobStatusResult

定義

文件進階分類結果

利用 AI 分類文件的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
文件分類結果	DocumentCategoryResult	string	文件所適用的類別;若無法辨識某類別，則使用「其他」分類。空格則被底線取代。
信心指數 (ConfidenceScore)	ConfidenceScore	double	信心分數介於0.0至1.0之間，其中0.8 > 表示高度信心

文件分類結果

利用 AI 分類文件的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
文件分類結果	DocumentCategoryResult	string	文件所適用的類別;若無法辨識某類別，則使用「其他」分類。空格則被底線取代。

文件政策結果

執行文件政策執行操作的結果

名稱	路徑	類型	Description
清潔結果	CleanResult	boolean	若文件符合所有政策，則為真;若不符合，則為假
風險評分	RiskScore	double	風險分數介於0.0到1.0之間，當值高於0.5時，風險等級會增加
違規行為	RuleViolations	array of PolicyRuleViolation	原則違規

文件問題回答項目

輸入問題的回答

名稱	路徑	類型	Description
問題ID	QuestionId	string	輸入問題的識別
答案值	AnswerValue	string	回答這個問題的回答值，格式為字串。布林問題會回傳是或否。
答案理由	AnswerRationale	string	解釋為何會給出這個答案的理由
信心指數 (ConfidenceScore)	ConfidenceScore	double	信心分數介於0.0至1.0之間，且高於0.8表示信心度較高

文件問題回答結果

執行文件問答操作的結果

名稱	路徑	類型	Description
成功	Successful	boolean	若操作成功，則為真;否則為假
信心指數 (ConfidenceScore)	ConfidenceScore	double	信心分數介於0.0至1.0之間，且高於0.8表示信心度較高
答案結果	AnswerResults	array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse（條碼AiResponse）

從文件中擷取條碼的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
條碼結果	BarcodeResults	array of ExtractedBarcodeItem	擷取操作會產生表值

ExtractDocumentBatchJobResult

執行分割文件批次作業的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
AsyncJobID	AsyncJobID	string	建立工作時，會回傳一個非同步工作 ID。使用 GetAsyncJobStatus API 透過 AsyncJobID 檢查該工作的狀態，並在完成後取得結果

ExtractDocumentJobStatusResult

執行批次作業操作的結果

名稱	路徑	類型	Description
成功	Successful	boolean	若檢查工作狀態的操作成功，則為 True;否則為
非同步工作狀態	AsyncJobStatus	string	若適用，回傳非同步工作的工作狀態。可能的狀態已開始與完成
AsyncJobID	AsyncJobID	string	作業識別碼
ExtractTextResult	ExtractTextResult	ExtractTextResponse	從文件中擷取文字的結果
ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResponse	從文件中擷取欄位的結果
ExtractFieldsResult	ExtractFieldsResult	ExtractFieldsResponse	從文件中擷取欄位的結果
摘錄分類結果	ExtractClassificationResult	DocumentClassificationResult	利用 AI 分類文件的結果
錯誤訊息	ErrorMessage	string	錯誤訊息（如有）

ExtractFieldsAdvancedResponse

從文件中擷取欄位的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
Results	Results	array of FieldAdvancedValue	場值由抽取操作產生
信心指數 (ConfidenceScore)	ConfidenceScore	double	信心分數介於0.0至1.0之間，其中0.8 > 表示高度信心

ExtractFieldsAndTablesResponse（擷取欄位與表格回應）

從文件中擷取欄位的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
場地成績	FieldResults	array of FieldValue	場值由抽取操作產生
表格結果	TableResults	array of TableResult	擷取操作會產生表值

ExtractFieldsResponse（萃取場回應）

從文件中擷取欄位的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
Results	Results	array of FieldValue	場值由抽取操作產生

ExtractTablesResponse（萃取表回應）

從文件中擷取資料表的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
表格結果	TableResults	array of TableResult	擷取操作會產生表值

ExtractTextResponse（擷取文字回應）

從文件中擷取文字的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
頁面結果	PageResults	array of ExtractedTextPage	擷取操作的頁面結果

擷取條碼項目

擷取條碼結果

名稱	路徑	類型	Description
BarcodeType	BarcodeType	string	識別條碼類型，可能值為：AZTEC、CODABAR、CODE_39、CODE_93、CODE_128、DATA_MATRIX、EAN_8、EAN_13、ITF、MAXICODE、PDF_417、QR_CODE、RSS_14、RSS_EXPANDED、UPC_A、UPC_E、All_1D、UPC_EAN_EXTENSION、MSI、PLESSEY、IMB、未知
條碼值	BarcodeValue	string	條碼作為字串的值

擷取文字頁

從輸入文件擷取的頁面

名稱	路徑	類型	Description
PageNumber	PageNumber	integer	頁碼索引，以 1 為基礎
文字結果	TextResult	string	頁面內容

FieldAdvancedValue

從文件中擷取欄位的欄位值結果

名稱	路徑	類型	Description
欄位名稱	FieldName	string	欄位名稱（注意空格將被底線取代）
欄位字串值	FieldStringValue	string	從文件中擷取的欄位的字串值

欄位值

從文件中擷取欄位的欄位值結果

名稱	路徑	類型	Description
欄位名稱	FieldName	string	欄位名稱（注意空格將被底線取代）
欄位字串值	FieldStringValue	string	從文件中擷取的欄位的主字串或第一個字串值
AdditionalFieldStringValues	AdditionalFieldStringValues	array of string	當同一欄位同時存在多個值時，例如同一文件中出現兩個相同形式的實例，該欄位會被額外賦予

政策規則違規

政策規則違規的案例

名稱	路徑	類型	Description
規則識別碼	RuleId	string	規則的識別;若未提供 ID，則該 ID 為規則的 1 索引
違規風險評分	RuleViolationRiskScore	double	風險分數介於0.0到1.0之間，當值高於0.5時，風險等級會增加
違規理由	RuleViolationRationale	string	人工智慧自然語言為何違反此政策

摘要文件回應

文件摘要的結果

名稱	路徑	類型	Description
成功	Successful	boolean	成功則為 true，否則為 false
文件摘要正文	DocumentSummaryText	string	文件摘要

TableResult

從文件中擷取的表格

名稱	路徑	類型	Description
Title	Title	string	表格標題（可選）
Rows	Rows	array of TableResultRow	表格的排

TableResultCell

從文件擷取的資料表列的儲存格

名稱	路徑	類型	Description
CellHeader	CellHeader	string	儲存格欄位標頭
CellValue	CellValue	string	儲存格值作為字串

TableResultRow

從文件擷取的表格列

名稱	路徑	類型	Description
細胞	Cells	array of TableResultCell	排中格

共用方式為

文件 AI（預覽版）

Cloudmersive 文件 AI 連接器

先決條件

如何取得認證

取得 API 金鑰和密碼

支援的作業

正在建立連線

預設

節流限制

動作

使用 Advanced AI 作為批次作業從文件中擷取欄位值

參數

傳回

使用 AI 作為批次作業從文件中擷取文字

參數

傳回

使用 AI 作為批次作業，從文件中擷取分類或類別

參數

傳回

使用 AI 作為批次作業，從文件中擷取所有欄位和資料表

參數

傳回

使用 AI 從文件中擷取所有欄位和資料表

參數

傳回

使用 AI 從文件中擷取欄位值

參數

傳回

利用 AI 從文件中擷取分類或分類

參數

傳回

利用 AI 從文件中擷取摘要

參數

傳回

利用 AI 從文件中擷取文字

參數

傳回

利用 AI 從文件中擷取條碼

參數

傳回

利用 AI 從文件中擷取資料表

參數

傳回

利用先進 AI 以結構化方式回答文件相關問題

參數

傳回

利用先進 AI 強制執行文件政策以允許或阻擋

參數

傳回

利用先進 AI 從文件中擷取分類或分類

參數

傳回

利用先進 AI 從文件中擷取欄位值

參數

傳回

取得擷取文件批次作業的狀態與結果

參數

傳回

定義

文件進階分類結果

文件分類結果

文件政策結果

文件問題回答項目

文件問題回答結果

ExtractBarcodesAiResponse（條碼AiResponse）

ExtractDocumentBatchJobResult

ExtractDocumentJobStatusResult

ExtractFieldsAdvancedResponse

ExtractFieldsAndTablesResponse（擷取欄位與表格回應）

ExtractFieldsResponse（萃取場回應）

ExtractTablesResponse（萃取表回應）

ExtractTextResponse（擷取文字回應）

擷取條碼項目

擷取文字頁

FieldAdvancedValue

欄位值

政策規則違規

摘要文件回應

TableResult