檔智慧婚姻證明模型
此內容適用於:v4.0(預覽版)
檔智慧婚姻證書模型使用功能強大的光學字元辨識(OCR)功能,從婚姻證分析及擷取關鍵字段。 結婚證的格式和品質可以是各種格式和品質,包括手機擷取的圖像、掃描的檔和數位 PDF。 API 會分析檔文字;擷取配偶姓名、發行日期和婚姻地點等重要資訊:和會傳回結構化 JSON 數據表示。 此模型目前支援英文檔案格式。
自動結婚證處理
自動化結婚證處理是從婚姻證中擷取關鍵字段的程式。 從歷史上看,婚姻證分析程式是手動完成的,因此非常耗時。 從婚姻證準確擷取金鑰數據通常是婚姻證自動化程式中第一個最重要的步驟之一。
開發選項
Document Intelligence v4.0 (2024-02-29-preview) 支援下列工具、應用程式和連結庫:
功能 | 資源 | Model ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK• Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
輸入需求
若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
支援的檔案格式:
模型 PDF 圖片:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ (2024-02-29-preview) 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。
影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。
針對自訂分類模型定型,定型資料的大小總計為
1GB
(上限為 10,000 頁)。
試用婚姻證明文件數據擷取
若要查看婚姻證卡服務的數據擷取運作方式,您需要下列資源:
Azure 訂用帳戶-您可以 免費建立一個訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
Document Intelligence Studio
在 [Document Intelligence Studio] 首頁上,選取 [ 婚姻證]。
您可以分析範例婚姻證或上傳您自己的檔案。
選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項:
支援的語言和地區設定
如需支援語言的完整清單,請參閱 我們的 語言支援 — 預先建置的模型 頁面。
欄位擷取
以下是 JSON 輸出回應中從婚姻憑證擷取的字段。
名稱 | 類型 | 描述 | 範例輸出 |
---|---|---|---|
Spouse1FirstName |
String | 配偶 1 的名字 | 韋斯利 |
Spouse1MiddleName |
String | 配偶 1 的中間名 | M. |
Spouse1LastName |
String | 配偶 1 的姓 | 佩里 |
Spouse1Age |
整數 | 配偶 1 的年齡 | 26 |
Spouse1BirthDate |
Date | 配偶 1 的出生日期 | 1997 年 11 月 16 日 |
Spouse1Address |
位址 | 配偶 1 的位址 | 4292 唐傑克遜巷, 布盧姆菲爾德鄉, 密歇根州 48302 |
Spouse1BirthPlace |
String | 配偶 1 的出生地 | 密西根州 |
Spouse2FirstName |
String | 配偶 2 的名字 | 貝絲 |
Spouse2MiddleName |
String | 配偶 2 的中間名 | R. |
Spouse2LastName |
String | 配偶 2 的姓氏 | 梅森 |
Spouse2Age |
整數 | 配偶 2 的年齡 | 23 |
Spouse2BirthDate |
Date | 配偶 2 的出生日期 | 2000 年 7 月 22 日 |
Spouse2Address |
位址 | 配偶 2 的位址 | 2671 舒適法院, 麥迪遜, 威斯康星州 53704 |
Spouse2BirthPlace |
String | 配偶 2 的出生地 | 威斯康辛州 |
DocumentNumber |
String | 文件編號 | 01976/202 |
IssueDate |
Date | 憑證的發行日期 | 2023年10月10日 |
IssuePlace |
String | 簽發憑證的位置 | 2398 回聲巷, 哈斯廷斯, 密歇根州 49058 |
MarriageDate |
Date | 婚姻日期 | 2023年10月10日 |
MarriagePlace |
String | 婚姻場所 | 105 煤街, 加洛韋, 威斯康星州 54432 |
擷取的婚姻憑證金鑰/值組和明細項目位於 documentResults
JSON 輸出的 區段中。
下一步
嘗試使用 Document Intelligence Studio 處理您自己的表單和檔。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應