文件 AI(預覽版)
利用 AI 從常見文件格式、掃描文件及文件照片中提取結構化資料,包括命名欄位、表格、條碼、分類與摘要。 同時支援手寫、低畫質照片與掃描件,以及數位文件輸入。 支援多種語言,並能從文件的視覺化佈局分析並推斷語意結構。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure Government 區域 - Azure 中國區域 - 美國國防部 (DoD) |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 連絡人 | |
|---|---|
| 名稱 | 雲浸 |
| URL | https://www.cloudmersive.com |
| support@cloudmersive.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | Cloudmersive有限責任公司 |
| 網站 | https://www.cloudmersive.com |
| 隱私策略 | https://www.cloudmersive.com/privacy-policy |
| 類別 | 人工智慧;內容和文件 |
Cloudmersive 文件 AI 連接器
Cloudmersive 文件 AI API 讓您能利用次世代 AI 從文件中提取資料、欄位、洞察與文字。
先決條件
您將需要以下內容才能繼續:
- 具有進階連接器支援的 Microsoft Power Apps、Power Automate 或 Azure Logic Apps
- Cloudmersive API 金鑰
如何取得認證
若要使用此連接器,您需要 Cloudmersive 帳戶。 您可以使用 Microsoft 帳戶註冊或建立 Cloudmersive 帳戶。 請按照以下步驟獲取您的 API 密鑰。
取得 API 金鑰和密碼
- 註冊 Cloudmersive 帳戶
- 點擊 API 金鑰
您可以在此處建立並查看 API 金鑰頁面上列出的 API 金鑰。 只要將此 API 金鑰複製並貼上到 Cloudmersive 文件 AI 連接器即可。
現在您已準備好開始使用 Cloudmersive CDR 連接器。
支援的作業
連接器支援下列作業:
-
Enforce Policies to a Document to allow or block it using Advanced AI:使用先進 AI 強制執行文件政策以允許或阻擋。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。 -
Answer Questions about a Document in a structured way using Advanced AI:利用Advanced AI回答布林(是/否)、多項選擇題及自由回答問題,關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。 -
Extract Text from a Document using AI:利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。 -
Extract Field Values from a Document using AI:利用 AI 從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Field Values from a Document using Advanced AI:利用先進 AI 從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Tables of Data from a Document using AI:使用 AI 從文件中擷取由資料列與欄組成的表格。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Barcodes of from a Document using AI:利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract All Fields and Tables of Data from a Document using AI:利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Classification or Category from a Document using AI:利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Classification or Category from a Document using Advanced AI:利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Summary from a Document using AI:利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 -
Extract Text from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。 -
Extract Field Values from a Document using Advanced AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 -
Extract All Fields and Tables of Data from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 -
Extract Classification or Category from a Document using AI as a Batch Job:建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 -
Get the status and result of an Extract Document Batch Job: 回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。
正在建立連線
連接器支援下列驗證類型:
| 預設值 | 建立連線的參數。 | 所有區域 | 不可共享 |
預設
適用:所有地區
建立連線的參數。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| 阿皮基 | 安全字串 | 此 API 的 Apikey | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 使用 Advanced AI 作為批次作業從文件中擷取欄位值 |
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 |
| 使用 AI 作為批次作業從文件中擷取文字 |
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。 |
| 使用 AI 作為批次作業,從文件中擷取分類或類別 |
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 |
| 使用 AI 作為批次作業,從文件中擷取所有欄位和資料表 |
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。 |
| 使用 AI 從文件中擷取所有欄位和資料表 |
利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 使用 AI 從文件中擷取欄位值 |
利用 AI 從文件中提取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 利用 AI 從文件中擷取分類或分類 |
利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 利用 AI 從文件中擷取摘要 |
利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 利用 AI 從文件中擷取文字 |
利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。 |
| 利用 AI 從文件中擷取條碼 |
利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 利用 AI 從文件中擷取資料表 |
利用 AI 從文件中擷取資料表,由資料列和欄組成。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁消耗 100 次 API 呼叫。 |
| 利用先進 AI 以結構化方式回答文件相關問題 |
利用 Advanced AI 回答布林(是/否)、選擇題及自由回答問題,內容關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。 |
| 利用先進 AI 強制執行文件政策以允許或阻擋 |
利用進階 AI 強制執行文件政策,允許或阻擋該文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。 |
| 利用先進 AI 從文件中擷取分類或分類 |
利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 利用先進 AI 從文件中擷取欄位值 |
利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。 |
| 取得擷取文件批次作業的狀態與結果 |
回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。 |
使用 Advanced AI 作為批次作業從文件中擷取欄位值
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
InputFile
|
InputFile | byte |
輸入文件檔,以位元組陣列形式執行操作 |
|
|
欄位名稱
|
FieldName | string |
要提取的欄位名稱 |
|
|
欄位可選
|
FieldOptional | boolean |
可選:若欄位為可選,則為真;若必要,則為假(預設) |
|
|
田野描述
|
FieldDescription | string |
可選但建議:欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。 |
|
|
FieldExample
|
FieldExample | string |
可選:欄位的範例標籤或值 |
|
|
最大處理頁面
|
MaximumPagesProcessed | integer |
可選:限制處理的頁面數量 |
|
|
Preprocessing
|
Preprocessing | string |
可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為 ContrastEdges 和 ContrastEdgesPlus,以提升低品質黑白或灰階影像的對比度與可讀性。 設定為反轉以反轉輸入影像。 設定為二元化以二元化輸入影像。 設定為相容性以達到最大 PDF 功能相容性。 |
|
|
結果交叉檢查
|
ResultCrossCheck | string |
可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」和「超高」。 預設值為 None。 Ultra 能產生最高精度,但代價是處理時間較長。 |
|
|
旋轉影像度數
|
RotateImageDegrees | double |
可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。 |
傳回
執行分割文件批次作業的結果
使用 AI 作為批次作業從文件中擷取文字
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 支援多種語言。 需要管理實例或私有雲部署。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
執行分割文件批次作業的結果
使用 AI 作為批次作業,從文件中擷取分類或類別
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
想要提取的分類
|
Categories | string |
想要提取的分類 |
|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
執行分割文件批次作業的結果
使用 AI 作為批次作業,從文件中擷取所有欄位和資料表
建立一個非同步批次工作,作為 AI 批次工作來處理大型文件。 利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 需要管理實例或私有雲部署。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
執行分割文件批次作業的結果
使用 AI 從文件中擷取所有欄位和資料表
利用 AI 從文件中擷取所有欄位與表格,包含資料的列與欄。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
可選:設定影像前處理等級以提升準確度。 ...
|
preprocessing | string |
可選:設定影像前處理等級以提升準確度。 ... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
從文件中擷取欄位的結果
使用 AI 從文件中擷取欄位值
利用 AI 從文件中提取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
欲擷取欄位,逗號分隔
|
FieldNames | string |
欲擷取欄位,逗號分隔 |
|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
從文件中擷取欄位的結果
利用 AI 從文件中擷取分類或分類
利用 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
想要提取的分類
|
Categories | string |
想要提取的分類 |
|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
利用 AI 分類文件的結果
利用 AI 從文件中擷取摘要
利用人工智慧建立輸入文件的一段摘要。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
文件摘要的結果
利用 AI 從文件中擷取文字
利用 AI 從文件中擷取原始文字。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 支援多種語言。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
從文件中擷取文字的結果
利用 AI 從文件中擷取條碼
利用 AI 從文件中擷取所有條碼。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG、HEIC 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
從文件中擷取條碼的結果
利用 AI 從文件中擷取資料表
利用 AI 從文件中擷取資料表,由資料列和欄組成。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
輸入文件或文件相片,以從中擷取資料
|
InputFile | file |
輸入文件或文件相片,以從中擷取資料 |
傳回
從文件中擷取資料表的結果
利用先進 AI 以結構化方式回答文件相關問題
利用 Advanced AI 回答布林(是/否)、選擇題及自由回答問題,內容關於文件內容。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
輸入檔案以位元組陣列形式呈現 |
|
|
問題ID
|
QuestionId | string |
問題的唯一識別碼,例如 1 或 2A |
|
|
問題正文
|
QuestionText | string |
用自然語言向文件提出的問題,當答案為「是」或「否」時,例如:「此文件是否由雙方簽署並雙簽?」 |
|
|
問題ID
|
QuestionId | string |
問題的唯一識別碼,例如 1 或 2A |
|
|
問題正文
|
QuestionText | string |
以自然語言向文件提出的問題,該文件的答案為固定數量的選項之一,例如:「本協議的適用法律是什麼?」 |
|
|
ChoiceId(選擇性)
|
ChoiceId | string |
回應選擇的唯一識別碼,例如 3C |
|
|
選擇文字
|
ChoiceText | string |
此選擇的描述文字,例如「特拉華州」 |
|
|
問題ID
|
QuestionId | string |
問題的唯一識別碼,例如 7 或 5A |
|
|
問題正文
|
QuestionText | string |
用自然語言向文件提出的問題,答案為自由回應,例如:「本協議的對手方是誰?」 |
|
|
識別模式
|
RecognitionMode | string |
選修;辨識模式 - 一般(預設)提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低 |
傳回
執行文件問答操作的結果
利用先進 AI 強制執行文件政策以允許或阻擋
利用進階 AI 強制執行文件政策,允許或阻擋該文件。 支援的輸入文件格式包括 DOCX、PDF、PNG 及 JPG。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
輸入檔案以位元組陣列形式呈現 |
|
|
規則識別碼
|
RuleId | string | ||
|
規則類型
|
RuleType | string |
可能的值為 ALLOW 與 DENY |
|
|
規則描述
|
RuleDescription | string |
規則的自然語言說明,例如:不允許包含冒犯性語言的文件 |
|
|
識別模式
|
RecognitionMode | string |
選修;辨識模式 - 一般(預設)提供最高準確度但速度較慢;一般則回應較快但對低品質影像準確度較低 |
傳回
執行文件政策執行操作的結果
利用先進 AI 從文件中擷取分類或分類
利用先進 AI 從文件中擷取分類或類別(例如發票、收據、稅務表格,或 1040 表格、1040 EZ 表格等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
InputFile
|
InputFile | byte |
輸入文件檔,以位元組陣列形式執行操作 |
|
|
類別名稱
|
CategoryName | string |
分類名稱 |
|
|
分類描述
|
CategoryDescription | string |
可選但建議:自然語言分類說明 |
|
|
Preprocessing
|
Preprocessing | string |
可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「SmoothEdges」、「SmoothEdgesPlus」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為相容性以達到最大 PDF 功能相容性。 |
|
|
結果交叉檢查
|
ResultCrossCheck | string |
可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」、「極致」和「超高」。 預設值為 None。 Ultra 和 Hyper 會產生最高的準確度,但代價是處理時間較長。 |
|
|
最大處理頁面
|
MaximumPagesProcessed | integer |
可選:限制處理的頁面數量 |
|
|
旋轉影像度數
|
RotateImageDegrees | double |
可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。 |
傳回
利用 AI 分類文件的結果
利用先進 AI 從文件中擷取欄位值
利用先進的人工智慧從文件中擷取欄位值(例如發票號碼、發票日期、名片電話號碼等)。 支援的輸入文件格式包括 DOCX、PDF、XLSX、PPTX、EML、MSG、JPG、PNG 及 WEBP。 每頁會消耗 100 次 API 呼叫。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
選修;辨識模式 - 進階(預設)提供最高等級的...
|
recognitionMode | string |
選修;辨識模式 - 進階(預設)提供最高等級的... |
|
|
InputFile
|
InputFile | byte |
輸入文件檔,以位元組陣列形式執行操作 |
|
|
欄位名稱
|
FieldName | string |
要提取的欄位名稱 |
|
|
欄位可選
|
FieldOptional | boolean |
可選:若欄位為可選,則為真;若必要,則為假(預設) |
|
|
田野描述
|
FieldDescription | string |
可選但建議:欄位描述——用來描述欄位是什麼、格式如何、獨特之處等等。 |
|
|
FieldExample
|
FieldExample | string |
可選:欄位的範例標籤或值 |
|
|
最大處理頁面
|
MaximumPagesProcessed | integer |
可選:限制處理的頁面數量 |
|
|
Preprocessing
|
Preprocessing | string |
可選:設定影像前處理等級以提升準確度。 可能的值包括「自動」、「平滑邊緣」、「平滑邊緣加」、「對比邊緣」、「對比邊緣加」、「反轉」、「二元化」、「相容性」和「無」。 預設為自動。設定為 SmoothEdges,以平滑輸入影像中較硬的邊緣以提升辨識準確度。 設定到 SmoothEdgesPlus 來更有效地平滑粗糙的邊緣。 設定為 ContrastEdges 和 ContrastEdgesPlus,以提升低品質黑白或灰階影像的對比度與可讀性。 設定為反轉以反轉輸入影像。 設定為二元化以二元化輸入影像。 設定為相容性以達到最大 PDF 功能相容性。 |
|
|
結果交叉檢查
|
ResultCrossCheck | string |
可選:設定輸出準確度交叉檢查的水準,用於輸入。 可能的數值有「無」、「進階」和「超高」。 預設值為 None。 Ultra 能產生最高精度,但代價是處理時間較長。 |
|
|
旋轉影像度數
|
RotateImageDegrees | double |
可選:在辨識前將輸入影像旋轉指定度數;有效數值範圍從 -360 到+360。 |
傳回
從文件中擷取欄位的結果
取得擷取文件批次作業的狀態與結果
回傳非同步作業的結果——可能的狀態可為 STARTED 或 COMPLETED。 此 API 僅適用於 Cloudmersive 管理實例與私有雲部署。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
批次作業的 Job ID 以取得 的狀態
|
AsyncJobID | string |
批次作業的 Job ID 以取得 的狀態 |
傳回
執行批次作業操作的結果
定義
文件進階分類結果
利用 AI 分類文件的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
文件分類結果
|
DocumentCategoryResult | string |
文件所適用的類別;若無法辨識某類別,則使用「其他」分類。 空格則被底線取代。 |
|
信心指數 (ConfidenceScore)
|
ConfidenceScore | double |
信心分數介於0.0至1.0之間,其中0.8 > 表示高度信心 |
文件分類結果
利用 AI 分類文件的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
文件分類結果
|
DocumentCategoryResult | string |
文件所適用的類別;若無法辨識某類別,則使用「其他」分類。 空格則被底線取代。 |
文件政策結果
執行文件政策執行操作的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
清潔結果
|
CleanResult | boolean |
若文件符合所有政策,則為真;若不符合,則為假 |
|
風險評分
|
RiskScore | double |
風險分數介於0.0到1.0之間,當值高於0.5時,風險等級會增加 |
|
違規行為
|
RuleViolations | array of PolicyRuleViolation |
原則違規 |
文件問題回答項目
輸入問題的回答
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
問題ID
|
QuestionId | string |
輸入問題的識別 |
|
答案值
|
AnswerValue | string |
回答這個問題的回答值,格式為字串。 布林問題會回傳是或否。 |
|
答案理由
|
AnswerRationale | string |
解釋為何會給出這個答案的理由 |
|
信心指數 (ConfidenceScore)
|
ConfidenceScore | double |
信心分數介於0.0至1.0之間,且高於0.8表示信心度較高 |
文件問題回答結果
執行文件問答操作的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
若操作成功,則為真;否則為假 |
|
信心指數 (ConfidenceScore)
|
ConfidenceScore | double |
信心分數介於0.0至1.0之間,且高於0.8表示信心度較高 |
|
答案結果
|
AnswerResults | array of DocumentQuestionAnswerItem |
ExtractBarcodesAiResponse(條碼AiResponse)
從文件中擷取條碼的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
條碼結果
|
BarcodeResults | array of ExtractedBarcodeItem |
擷取操作會產生表值 |
ExtractDocumentBatchJobResult
執行分割文件批次作業的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
AsyncJobID
|
AsyncJobID | string |
建立工作時,會回傳一個非同步工作 ID。 使用 GetAsyncJobStatus API 透過 AsyncJobID 檢查該工作的狀態,並在完成後取得結果 |
ExtractDocumentJobStatusResult
執行批次作業操作的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
若檢查工作狀態的操作成功,則為 True;否則為 |
|
非同步工作狀態
|
AsyncJobStatus | string |
若適用,回傳非同步工作的工作狀態。 可能的狀態已開始與完成 |
|
AsyncJobID
|
AsyncJobID | string |
作業識別碼 |
|
ExtractTextResult
|
ExtractTextResult | ExtractTextResponse |
從文件中擷取文字的結果 |
|
ExtractFieldsAndTablesResult
|
ExtractFieldsAndTablesResult | ExtractFieldsAndTablesResponse |
從文件中擷取欄位的結果 |
|
ExtractFieldsResult
|
ExtractFieldsResult | ExtractFieldsResponse |
從文件中擷取欄位的結果 |
|
摘錄分類結果
|
ExtractClassificationResult | DocumentClassificationResult |
利用 AI 分類文件的結果 |
|
錯誤訊息
|
ErrorMessage | string |
錯誤訊息(如有) |
ExtractFieldsAdvancedResponse
從文件中擷取欄位的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
Results
|
Results | array of FieldAdvancedValue |
場值由抽取操作產生 |
|
信心指數 (ConfidenceScore)
|
ConfidenceScore | double |
信心分數介於0.0至1.0之間,其中0.8 > 表示高度信心 |
ExtractFieldsAndTablesResponse(擷取欄位與表格回應)
從文件中擷取欄位的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
場地成績
|
FieldResults | array of FieldValue |
場值由抽取操作產生 |
|
表格結果
|
TableResults | array of TableResult |
擷取操作會產生表值 |
ExtractFieldsResponse(萃取場回應)
從文件中擷取欄位的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
Results
|
Results | array of FieldValue |
場值由抽取操作產生 |
ExtractTablesResponse(萃取表回應)
從文件中擷取資料表的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
表格結果
|
TableResults | array of TableResult |
擷取操作會產生表值 |
ExtractTextResponse(擷取文字回應)
從文件中擷取文字的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
頁面結果
|
PageResults | array of ExtractedTextPage |
擷取操作的頁面結果 |
擷取條碼項目
擷取條碼結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
BarcodeType
|
BarcodeType | string |
識別條碼類型,可能值為:AZTEC、CODABAR、CODE_39、CODE_93、CODE_128、DATA_MATRIX、EAN_8、EAN_13、ITF、MAXICODE、PDF_417、QR_CODE、RSS_14、RSS_EXPANDED、UPC_A、UPC_E、All_1D、UPC_EAN_EXTENSION、MSI、PLESSEY、IMB、未知 |
|
條碼值
|
BarcodeValue | string |
條碼作為字串的值 |
擷取文字頁
從輸入文件擷取的頁面
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
PageNumber
|
PageNumber | integer |
頁碼索引,以 1 為基礎 |
|
文字結果
|
TextResult | string |
頁面內容 |
FieldAdvancedValue
從文件中擷取欄位的欄位值結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
欄位名稱
|
FieldName | string |
欄位名稱(注意空格將被底線取代) |
|
欄位字串值
|
FieldStringValue | string |
從文件中擷取的欄位的字串值 |
欄位值
從文件中擷取欄位的欄位值結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
欄位名稱
|
FieldName | string |
欄位名稱(注意空格將被底線取代) |
|
欄位字串值
|
FieldStringValue | string |
從文件中擷取的欄位的主字串或第一個字串值 |
|
AdditionalFieldStringValues
|
AdditionalFieldStringValues | array of string |
當同一欄位同時存在多個值時,例如同一文件中出現兩個相同形式的實例,該欄位會被額外賦予 |
政策規則違規
政策規則違規的案例
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
規則識別碼
|
RuleId | string |
規則的識別;若未提供 ID,則該 ID 為規則的 1 索引 |
|
違規風險評分
|
RuleViolationRiskScore | double |
風險分數介於0.0到1.0之間,當值高於0.5時,風險等級會增加 |
|
違規理由
|
RuleViolationRationale | string |
人工智慧自然語言為何違反此政策 |
摘要文件回應
文件摘要的結果
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
成功
|
Successful | boolean |
成功則為 true,否則為 false |
|
文件摘要正文
|
DocumentSummaryText | string |
文件摘要 |
TableResult
從文件中擷取的表格
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
Title
|
Title | string |
表格標題(可選) |
|
Rows
|
Rows | array of TableResultRow |
表格的排 |
TableResultCell
從文件擷取的資料表列的儲存格
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
CellHeader
|
CellHeader | string |
儲存格欄位標頭 |
|
CellValue
|
CellValue | string |
儲存格值作為字串 |
TableResultRow
從文件擷取的表格列
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
細胞
|
Cells | array of TableResultCell |
排中格 |