共用方式為


文件 AI(預覽版)

利用 AI 從常見文件格式、掃描文件及文件照片中提取結構化資料,包括命名欄位、表格、條碼、分類與摘要。 同時支援手寫、低畫質照片與掃描件,以及數位文件輸入。 支援多種語言,並能從文件的視覺化佈局分析並推斷語意結構。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
邏輯應用程式 標準 所有 Logic Apps 區域, 但下列區域除外:
     - Azure Government 區域
     - Azure 中國區域
     - 美國國防部 (DoD)
Power Apps 進階 除下列區域外的所有 Power Apps 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
Power Automate(自動化服務) 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
連絡人​​
名稱 雲浸
URL https://www.cloudmersive.com
Email support@cloudmersive.com
連接器中繼資料
Publisher Cloudmersive有限責任公司
網站 https://www.cloudmersive.com
隱私策略 https://www.cloudmersive.com/privacy-policy
類別 人工智慧;內容和文件

Cloudmersive 文件 AI 連接器

Cloudmersive 文件 AI API 讓您能利用次世代 AI 從文件中提取資料、欄位、洞察與文字。

先決條件

您將需要以下內容才能繼續:

  • 具有進階連接器支援的 Microsoft Power Apps、Power Automate 或 Azure Logic Apps
  • Cloudmersive API 金鑰

如何取得認證

若要使用此連接器,您需要 Cloudmersive 帳戶。 您可以使用 Microsoft 帳戶註冊或建立 Cloudmersive 帳戶。 請按照以下步驟獲取您的 API 密鑰。

取得 API 金鑰和密碼

  • 註冊 Cloudmersive 帳戶
  • 點擊 API 金鑰

您可以在此處建立並查看 API 金鑰頁面上列出的 API 金鑰。 只要將此 API 金鑰複製並貼上到 Cloudmersive 文件 AI 連接器即可。

現在您已準備好開始使用 Cloudmersive CDR 連接器。

支援的作業

連接器支援下列作業:

  • Enforce Policies to a Document to allow or block it using Advanced AI:使用先進 AI 強制執行文件政策以允許或阻擋。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。
  • Answer Questions about a Document in a structured way using Advanced AI:利用Advanced AI回答布林(是/否)、多項選擇題及自由回答問題,關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。
  • Extract Text from a Document using AI:利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。
  • Extract Field Values from a Document using AI:利用 AI 從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Field Values from a Document using Advanced AI:利用先進 AI 從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Tables of Data from a Document using AI:使用 AI 從文件中擷取由資料列與欄組成的表格。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Barcodes of from a Document using AI:利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract All Fields and Tables of Data from a Document using AI:利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Classification or Category from a Document using AI:利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Classification or Category from a Document using Advanced AI:利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Summary from a Document using AI:利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
  • Extract Text from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。
  • Extract Field Values from a Document using Advanced AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
  • Extract All Fields and Tables of Data from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
  • Extract Classification or Category from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
  • Get the status and result of an Extract Document Batch Job: 回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。

正在建立連線

連接器支援下列驗證類型:

預設值 建立連線的參數。 所有區域 不可共享

預設

適用:所有地區

建立連線的參數。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
阿皮基 安全字串 此 API 的 Apikey

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 100 60 秒

動作

使用 Advanced AI 作為批次作業從文件中擷取欄位值

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

使用 AI 作為批次作業從文件中擷取文字

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。

使用 AI 作為批次作業,從文件中擷取分類或類別

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

使用 AI 作為批次作業,從文件中擷取所有欄位和資料表

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

使用 AI 從文件中擷取所有欄位和資料表

利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

使用 AI 從文件中擷取欄位值

利用 AI 從文件中提取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

利用 AI 從文件中擷取分類或分類

利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

利用 AI 從文件中擷取摘要

利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

利用 AI 從文件中擷取文字

利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。

利用 AI 從文件中擷取條碼

利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。

利用 AI 從文件中擷取資料表

利用 AI 從文件中擷取資料表,由資料列和欄組成。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁消耗 100 次 API 呼叫。

利用先進 AI 以結構化方式回答文件相關問題

利用 Advanced AI 回答布林(是/否)、選擇題及自由回答問題,內容關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。

利用先進 AI 強制執行文件政策以允許或阻擋

利用進階 AI 強制執行文件政策,允許或阻擋該文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。

利用先進 AI 從文件中擷取分類或分類

利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

利用先進 AI 從文件中擷取欄位值

利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

取得擷取文件批次作業的狀態與結果

回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。

使用 Advanced AI 作為批次作業從文件中擷取欄位值

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

InputFile
InputFile byte

輸入文件檔,以位元組陣列形式執行操作

欄位名稱
FieldName string

要提取的欄位名稱

欄位可選
FieldOptional boolean

可選:若欄位為可選,則為真;若必要,則為假(預設)

田野描述
FieldDescription string

可選但建議:欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。

FieldExample
FieldExample string

可選:欄位的範例標籤或值

最大處理頁面
MaximumPagesProcessed integer

可選:限制處理的頁面數量

Preprocessing
Preprocessing string

可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為 ContrastEdges 和 ContrastEdgesPlus,以提升低品質黑白或灰階影像的對比度與可讀性。 設定為反轉以反轉輸入影像。 設定為二元化以二元化輸入影像。 設定為相容性以達到最大 PDF 功能相容性。

結果交叉檢查
ResultCrossCheck string

可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」和「超高」。 預設值為 None。 Ultra 能產生最高精度,但代價是處理時間較長。

旋轉影像度數
RotateImageDegrees double

可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

執行分割文件批次作業的結果

使用 AI 作為批次作業從文件中擷取文字

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

執行分割文件批次作業的結果

使用 AI 作為批次作業,從文件中擷取分類或類別

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

參數

名稱 機碼 必要 類型 Description
想要提取的分類
Categories string

想要提取的分類

選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

執行分割文件批次作業的結果

使用 AI 作為批次作業,從文件中擷取所有欄位和資料表

建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

執行分割文件批次作業的結果

使用 AI 從文件中擷取所有欄位和資料表

利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

可選:設定影像前處理等級以提升準確度。 ...
preprocessing string

可選:設定影像前處理等級以提升準確度。 ...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

從文件中擷取欄位的結果

使用 AI 從文件中擷取欄位值

利用 AI 從文件中提取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
欲擷取欄位,逗號分隔
FieldNames string

欲擷取欄位,逗號分隔

選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

從文件中擷取欄位的結果

利用 AI 從文件中擷取分類或分類

利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
想要提取的分類
Categories string

想要提取的分類

選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

利用 AI 分類文件的結果

利用 AI 從文件中擷取摘要

利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

文件摘要的結果

利用 AI 從文件中擷取文字

利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

從文件中擷取文字的結果

利用 AI 從文件中擷取條碼

利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

從文件中擷取條碼的結果

利用 AI 從文件中擷取資料表

利用 AI 從文件中擷取資料表,由資料列和欄組成。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

輸入文件或文件相片,以從中擷取資料
InputFile file

輸入文件或文件相片,以從中擷取資料

傳回

從文件中擷取資料表的結果

利用先進 AI 以結構化方式回答文件相關問題

利用 Advanced AI 回答布林(是/否)、選擇題及自由回答問題,內容關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
InputFile
InputFile byte

輸入檔案以位元組陣列形式呈現

問題ID
QuestionId string

問題的唯一識別碼,例如 1 或 2A

問題正文
QuestionText string

用自然語言向文件提出的問題,當答案為「是」或「否」時,例如:「此文件是否由雙方簽署並雙簽?」

問題ID
QuestionId string

問題的唯一識別碼,例如 1 或 2A

問題正文
QuestionText string

以自然語言向文件提出的問題,該文件的答案為固定數量的選項之一,例如:「本協議的適用法律是什麼?」

ChoiceId(選擇性)
ChoiceId string

回應選擇的唯一識別碼,例如 3C

選擇文字
ChoiceText string

此選擇的描述文字,例如「特拉華州」

問題ID
QuestionId string

問題的唯一識別碼,例如 7 或 5A

問題正文
QuestionText string

用自然語言向文件提出的問題,答案為自由回應,例如:「本協議的對手方是誰?」

識別模式
RecognitionMode string

選修;辨識模式 - 一般(預設)提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低

傳回

執行文件問答操作的結果

利用先進 AI 強制執行文件政策以允許或阻擋

利用進階 AI 強制執行文件政策,允許或阻擋該文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
InputFile
InputFile byte

輸入檔案以位元組陣列形式呈現

規則識別碼
RuleId string
規則類型
RuleType string

可能的值為 ALLOW 與 DENY

規則描述
RuleDescription string

規則的自然語言說明,例如:不允許包含冒犯性語言的文件

識別模式
RecognitionMode string

選修;辨識模式 - 一般(預設)提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低

傳回

執行文件政策執行操作的結果

利用先進 AI 從文件中擷取分類或分類

利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

InputFile
InputFile byte

輸入文件檔,以位元組陣列形式執行操作

類別名稱
CategoryName string

分類名稱

分類描述
CategoryDescription string

可選但建議:自然語言分類說明

Preprocessing
Preprocessing string

可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「SmoothEdges」、「SmoothEdgesPlus」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為相容性以達到最大 PDF 功能相容性。

結果交叉檢查
ResultCrossCheck string

可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」、「極致」和「超高」。 預設值為 None。 Ultra 和 Hyper 會產生最高的準確度,但代價是處理時間較長。

最大處理頁面
MaximumPagesProcessed integer

可選:限制處理的頁面數量

旋轉影像度數
RotateImageDegrees double

可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

利用 AI 分類文件的結果

利用先進 AI 從文件中擷取欄位值

利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。

參數

名稱 機碼 必要 類型 Description
選修;辨識模式 - 進階(預設)提供最高等級的...
recognitionMode string

選修;辨識模式 - 進階(預設)提供最高等級的...

InputFile
InputFile byte

輸入文件檔,以位元組陣列形式執行操作

欄位名稱
FieldName string

要提取的欄位名稱

欄位可選
FieldOptional boolean

可選:若欄位為可選,則為真;若必要,則為假(預設)

田野描述
FieldDescription string

可選但建議:欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。

FieldExample
FieldExample string

可選:欄位的範例標籤或值

最大處理頁面
MaximumPagesProcessed integer

可選:限制處理的頁面數量

Preprocessing
Preprocessing string

可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為 ContrastEdges 和 ContrastEdgesPlus,以提升低品質黑白或灰階影像的對比度與可讀性。 設定為反轉以反轉輸入影像。 設定為二元化以二元化輸入影像。 設定為相容性以達到最大 PDF 功能相容性。

結果交叉檢查
ResultCrossCheck string

可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」和「超高」。 預設值為 None。 Ultra 能產生最高精度,但代價是處理時間較長。

旋轉影像度數
RotateImageDegrees double

可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。

傳回

從文件中擷取欄位的結果

取得擷取文件批次作業的狀態與結果

回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。

參數

名稱 機碼 必要 類型 Description
批次作業的 Job ID 以取得 的狀態
AsyncJobID string

批次作業的 Job ID 以取得 的狀態

傳回

執行批次作業操作的結果

定義

文件進階分類結果

利用 AI 分類文件的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

文件分類結果
DocumentCategoryResult string

文件所適用的類別;若無法辨識某類別,則使用「其他」分類。 空格則被底線取代。

信心指數 (ConfidenceScore)
ConfidenceScore double

信心分數介於0.0至1.0之間,其中0.8 > 表示高度信心

文件分類結果

利用 AI 分類文件的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

文件分類結果
DocumentCategoryResult string

文件所適用的類別;若無法辨識某類別,則使用「其他」分類。 空格則被底線取代。

文件政策結果

執行文件政策執行操作的結果

名稱 路徑 類型 Description
清潔結果
CleanResult boolean

若文件符合所有政策,則為真;若不符合,則為假

風險評分
RiskScore double

風險分數介於0.0到1.0之間,當值高於0.5時,風險等級會增加

違規行為
RuleViolations array of PolicyRuleViolation

原則違規

文件問題回答項目

輸入問題的回答

名稱 路徑 類型 Description
問題ID
QuestionId string

輸入問題的識別

答案值
AnswerValue string

回答這個問題的回答值,格式為字串。 布林問題會回傳是或否。

答案理由
AnswerRationale string

解釋為何會給出這個答案的理由

信心指數 (ConfidenceScore)
ConfidenceScore double

信心分數介於0.0至1.0之間,且高於0.8表示信心度較高

文件問題回答結果

執行文件問答操作的結果

名稱 路徑 類型 Description
成功
Successful boolean

若操作成功,則為真;否則為假

信心指數 (ConfidenceScore)
ConfidenceScore double

信心分數介於0.0至1.0之間,且高於0.8表示信心度較高

答案結果
AnswerResults array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse(條碼AiResponse)

從文件中擷取條碼的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

條碼結果
BarcodeResults array of ExtractedBarcodeItem

擷取操作會產生表值

ExtractDocumentBatchJobResult

執行分割文件批次作業的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

AsyncJobID
AsyncJobID string

建立工作時,會回傳一個非同步工作 ID。 使用 GetAsyncJobStatus API 透過 AsyncJobID 檢查該工作的狀態,並在完成後取得結果

ExtractDocumentJobStatusResult

執行批次作業操作的結果

名稱 路徑 類型 Description
成功
Successful boolean

若檢查工作狀態的操作成功,則為 True;否則為

非同步工作狀態
AsyncJobStatus string

若適用,回傳非同步工作的工作狀態。 可能的狀態已開始與完成

AsyncJobID
AsyncJobID string

作業識別碼

ExtractTextResult
ExtractTextResult ExtractTextResponse

從文件中擷取文字的結果

ExtractFieldsAndTablesResult
ExtractFieldsAndTablesResult ExtractFieldsAndTablesResponse

從文件中擷取欄位的結果

ExtractFieldsResult
ExtractFieldsResult ExtractFieldsResponse

從文件中擷取欄位的結果

摘錄分類結果
ExtractClassificationResult DocumentClassificationResult

利用 AI 分類文件的結果

錯誤訊息
ErrorMessage string

錯誤訊息(如有)

ExtractFieldsAdvancedResponse

從文件中擷取欄位的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

Results
Results array of FieldAdvancedValue

場值由抽取操作產生

信心指數 (ConfidenceScore)
ConfidenceScore double

信心分數介於0.0至1.0之間,其中0.8 > 表示高度信心

ExtractFieldsAndTablesResponse(擷取欄位與表格回應)

從文件中擷取欄位的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

場地成績
FieldResults array of FieldValue

場值由抽取操作產生

表格結果
TableResults array of TableResult

擷取操作會產生表值

ExtractFieldsResponse(萃取場回應)

從文件中擷取欄位的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

Results
Results array of FieldValue

場值由抽取操作產生

ExtractTablesResponse(萃取表回應)

從文件中擷取資料表的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

表格結果
TableResults array of TableResult

擷取操作會產生表值

ExtractTextResponse(擷取文字回應)

從文件中擷取文字的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

頁面結果
PageResults array of ExtractedTextPage

擷取操作的頁面結果

擷取條碼項目

擷取條碼結果

名稱 路徑 類型 Description
BarcodeType
BarcodeType string

識別條碼類型,可能值為:AZTEC、CODABAR、CODE_39、CODE_93、CODE_128、DATA_MATRIX、EAN_8、EAN_13、ITF、MAXICODE、PDF_417、QR_CODE、RSS_14、RSS_EXPANDED、UPC_A、UPC_E、All_1D、UPC_EAN_EXTENSION、MSI、PLESSEY、IMB、未知

條碼值
BarcodeValue string

條碼作為字串的值

擷取文字頁

從輸入文件擷取的頁面

名稱 路徑 類型 Description
PageNumber
PageNumber integer

頁碼索引,以 1 為基礎

文字結果
TextResult string

頁面內容

FieldAdvancedValue

從文件中擷取欄位的欄位值結果

名稱 路徑 類型 Description
欄位名稱
FieldName string

欄位名稱(注意空格將被底線取代)

欄位字串值
FieldStringValue string

從文件中擷取的欄位的字串值

欄位值

從文件中擷取欄位的欄位值結果

名稱 路徑 類型 Description
欄位名稱
FieldName string

欄位名稱(注意空格將被底線取代)

欄位字串值
FieldStringValue string

從文件中擷取的欄位的主字串或第一個字串值

AdditionalFieldStringValues
AdditionalFieldStringValues array of string

當同一欄位同時存在多個值時,例如同一文件中出現兩個相同形式的實例,該欄位會被額外賦予

政策規則違規

政策規則違規的案例

名稱 路徑 類型 Description
規則識別碼
RuleId string

規則的識別;若未提供 ID,則該 ID 為規則的 1 索引

違規風險評分
RuleViolationRiskScore double

風險分數介於0.0到1.0之間,當值高於0.5時,風險等級會增加

違規理由
RuleViolationRationale string

人工智慧自然語言為何違反此政策

摘要文件回應

文件摘要的結果

名稱 路徑 類型 Description
成功
Successful boolean

成功則為 true,否則為 false

文件摘要正文
DocumentSummaryText string

文件摘要

TableResult

從文件中擷取的表格

名稱 路徑 類型 Description
Title
Title string

表格標題(可選)

Rows
Rows array of TableResultRow

表格的排

TableResultCell

從文件擷取的資料表列的儲存格

名稱 路徑 類型 Description
CellHeader
CellHeader string

儲存格欄位標頭

CellValue
CellValue string

儲存格值作為字串

TableResultRow

從文件擷取的表格列

名稱 路徑 類型 Description
細胞
Cells array of TableResultCell

排中格