Azure AI 視覺的新功能
了解 Azure AI 視覺有何新功能。 檢查此頁面以掌握最新的功能、增強功能、修正及文件更新。
2024 年 9 月
模型自訂和產品辨識淘汰
在 2025 年 1 月 10 日,Azure AI 視覺產品辨識和模型自定義功能將會淘汰。 在此日期之後,對這些服務的 API 呼叫將會失敗。
若要維持模型的順暢作業,請轉換至現已正式推出的 Azure AI 自訂視覺。 自訂視覺提供與這些淘汰功能類似的功能。
2024 年 8 月
新可偵測的臉部屬性
最新的偵測 03 模型提供眼鏡、遮蔽、模糊和曝光屬性。 如需詳細資料,請參閱指定臉部偵測模型。
2024 年 5 月
新的臉部 SDK 1.0.0-beta.1 (重大變更)
臉部 SDK 已在 1.0.0-beta.1 版中重寫,以更符合 Azure SDK 的指導方針和設計原則。 C#、Python、Java 和 JavaScript 是支援的語言。 請遵循快速入門開始作業。
2024 年 2 月
多模式內嵌 GA:新的多語言模型
多模式內嵌 API 已更新,現已正式推出。 2024-02-01
API 包含多一個新模型,可支援 102 種語言的文字搜尋。 原始的僅限英文模型仍可供使用,但無法與相同搜尋索引中的新模型結合。 如果您使用僅限英文的模型向量化文字和影像,則這些向量與多語言文字和影像向量不相容。
如需支援語言的完整清單,請參閱語言支援頁面。
2024 年一月
新的影像分析 SDK 1.0.0-beta.1 (重大變更)
影像分析 SDK 已在 1.0.0-beta.1 版中重寫,以更符合其他 Azure SDK。 所有 API 都已變更。 如需如何使用新 SDK 的相關資訊,請參閱更新的 快速入門、範例 和 操作指南。
重大變更:
- SDK 現在會呼叫正式推出的 電腦視覺 REST API (2023-10-01),而不是預覽電腦視覺 REST API (2023-04-01-preview)。
- 已新增 JavaScript 的支援。
- 已不再支援 C++。
- SDK 已不再支援使用自訂模型影像分析和影像分割 (背景移除),因為 電腦視覺 REST API (2023-10-01) 尚支持它們。 若要使用任一功能,請直接呼叫 電腦視覺 REST API (2023-04-01-preview) (分別使用
Analyze
和Segment
作業)。
2023 年 11 月
分析影像 4.0 GA
分析影像 4.0 REST API 現已正式推出。 請遵循分析影像 4.0 快速入門以開始使用。
影像分析的其他功能,例如模型自訂、背景移除和多模式內嵌,仍為公開預覽狀態。
臉部用戶端 SDK 以進行即時偵測
臉部活躍度 SDK 支援使用者行動裝置或邊緣裝置上的即時偵測。 針對 Android,在 Java/Kotlin 提供,針對 iOS 則在 Swift/Objective-C 提供。
我們的活躍度偵測服務符合 iBeta 層級 1 和 2 ISO/IEC 30107-3 合規性。
2023 年 9 月
淘汰過時的電腦視覺 API 版本
電腦視覺 API 1.0、2.0、3.0 和 3.1 版將於 2026 年 9 月 13 日淘汰。 開發人員將無法在該日期之後對這些 API 進行 API 呼叫。 建議所有受影響的客戶儘快遵循此 快速入門,好將工作負載儘早移轉至正式推出的電腦視覺 3.2 API。 客戶也應該考慮移轉至 影像分析 4.0 API (預覽版),它擁有最新且最厲害的影像分析功能。
如有任何問題,請瀏覽我們的問答集。
2023 年 5 月
影像分析 4.0 產品辨識 (公開預覽版)
產品辨識 API 可讓您分析零售商店中貨架相片。 您可以偵測產品是否存在,並取得週框方塊座標。 與模型自訂搭配使用,將模型定型以識別您的特定產品。 您也可以比較產品辨識結果與商店的貨架圖文件。 產品辨識。
2023 年 4 月
臉部有限存取權杖
獨立軟體廠商 (ISV) 可以發行存取權杖以授與通常受管制的臉部功能存取權,藉以管理用戶端的臉部 API 使用。 這可讓用戶端公司使用臉部 API,而無須進行正式核准程序。 使用有限存取權杖。
2023 年 3 月
Azure AI 視覺影響分析 4.0 SDK 公開預覽版
Florence 基礎模型現在已整合至 Azure AI 視覺。 改善的視覺服務可讓開發人員建立各種產業的市場就緒、負責任的 Azure AI 視覺應用程式。 客戶現在可以順暢將資料數位化、進行分析及連線至自然語言互動,深入解析影像和影片內容以支援網站無障礙性,透過 SEO 推動流量獲得、保護使用者免於有害內容、強化安全性,以及改善事件回應時間。 如需詳細資訊,請參閱 宣佈 Microsoft 的 Florence 基礎模型。
影像分析 4.0 SDK (公開預覽版)
影像分析 4.0 現在可透過 C#、C++ 和 Python 的用戶端程式庫 SDK 取得。 此更新也包含人類同等表現的 Florence 支援影像輔助字幕和密集輔助字幕。
影像分析 V4.0 輔助字幕和密集輔助字幕 (公開預覽版):
「字幕」將於 V4.0 取代「描述」,因為大幅改善的影像字幕功能具有豐富的詳細資料與語意理解。 除了描述整張影像之外,「密集字幕」還可以產生最多 10 個影像區域的單句描述來提供更多詳細資料。 密集輔助字幕也會傳回所描述影像區域的週框方塊座標。 另外還有新的性別中性參數,可讓客戶選擇是否要啟用替代文字和 Seeing AI 應用程式的預測性性別推斷。 自動提供豐富的輔助字幕、無障礙替代文字、SEO 優化,以及智慧型相片策劃,以支援數位內容。 影像輔助字幕。
影片摘要和影格定位器 (公用預覽版):
使用您所想和撰寫的相同直覺方式,搜尋影片內容並與其進行互動。 尋找相關內容,而無需額外的中繼資料。 僅適用於 Vision Studio。
影像分析 4.0 模型自訂 (公開預覽版)
您現在可以建立使用 Vision Studio 或 v4.0 REST API 來建立和定型自己的自訂影像分類和物件偵測模型。
多模式內嵌 API (公開預覽)
多模式內嵌 API 為影像分析 4.0 API 的一部分,可啟用影像和文字查詢的 向量化。 這可讓您將影像和文字轉換成多維度向量空間的座標。 您現在可以使用自然語言搜尋,並使用向量相似度搜尋來尋找相關的影像。
背景移除 API (公開預覽版)
作為影像分析 4.0 API 的一部分,背景移除 API 可讓您移除影像的背景。 這項作業可以輸出透明背景所偵測前景物件的影像,或輸出顯示所偵測前景物件的不透明度的灰階 Alpha 遮罩影像。
Azure AI Vision 3.0 和 3.1 預覽版淘汰
Azure AI 視覺 3.0 和 3.1 API 的預覽版本已排定於 2023 年 9 月 30 日淘汰。 超過此日期後,客戶將無法對這些 API 進行任何呼叫。 鼓勵客戶改為將工作負載移轉至正式推出 (GA) 3.2 API。 請注意,從預覽本版移轉至 3.2 API 時的變更如下:
- 分析影像和讀取 API 呼叫會採用選擇性的模型版本參數,供您用來指定要使用的 AI 模型。 預設會使用最新的模型。
- 分析影像和讀取 API 呼叫也會在成功的 API 回應中傳回
model-version
欄位。 此欄位會報告所使用的模型。 - Azure AI 視覺 3.2 API 使用不同的錯誤回報格式。 請參閱 API 參考檔,了解如何調整任何錯誤處理常式程式碼。
2022 年 10 月
Azure AI 視覺影像分析 4.0 (公開預覽版)
影像分析 4.0 已在公開預覽中發行。 新的 API 包括影像標題、影像標記、物件偵測、智慧型裁剪、人員偵測和讀取 OCR 功能,全都透過一個分析影像作業取得。 OCR 已針對增強效能的同步 API 中的一般非文件影像進行最佳化,可讓您更輕鬆地在工作流程中內嵌 OCR 支援的體驗。
2022 年 9 月
Azure AI 視覺 3.0/3.1 讀取預覽淘汰
Azure AI 視覺 3.0 和 3.1 讀取 API 的預覽版本已排定於 2023 年 1 月 31 日淘汰。 我們鼓勵客戶參考操作說明和快速入門,以改為開始使用正式運作 (GA) 版本的讀取 API。 最新的 GA 版本提供下列優點:
- OCR 模型最新正式推出 2022 年最新版
- OCR 語言涵蓋範圍大幅擴充,包括支援手寫文字
- 改善 OCR 品質
2022 年 6 月
Vision Studio 啟動
Vision Studio 是 UI 工具,可讓您從適 Azure AI 視覺探索、建置功能,並將其整合到您的應用程式中。
Vision Studio 為您提供一個可嘗試數種服務功能的平台,並查看其以視覺化方式傳回的內容。 您可以使用 Studio,在不需要撰寫程式碼的情況下開始使用,然後在您的應用程式中使用可用的用戶端程式庫和 REST API。
負責任臉部 AI
臉部透明度注意事項
- 透明度注意事項會提供指導以協助我們的客戶提高其系統的正確性和公平性,藉由納入有意義的人工檢閱以偵測和解決錯誤識別或其他故障的情況,提供支援給認為其結果不正確的人,以及識別並解決因操作狀況變化而導致的精確度波動。
淘汰敏感性屬性
- 我們已淘汰了旨在推斷情緒狀態和身份屬性的臉部分析功能,例如性別、年齡、笑臉、臉部毛髮、頭髮和化妝。
- 臉部偵測功能 (包括偵測模糊、曝光、眼鏡、頭部姿態、地標、噪音、遮擋、臉部邊界框) 會維持正常運作,且不需要應用程式。
Fairlearn 套件和 Microsoft 的公平性儀表板
- 開放原始碼 Fairlearn 套件和 Microsoft 的公平性儀表板目的在於支援客戶在自己的資料上,測量 Microsoft 臉部驗證演算法的公平性,使其在部署技術之前,找出並解決可能影響不同人口統計群組的潛在公平性問題。
有限存取原則
- 在將臉部對齊更新的負責 AI 標準過程中,已針對臉部 API 和電腦視覺實作新的有限存取原則。 現有客戶有一年可申請並接收核准,根據其提供的使用案例繼續存取臉部辨識服務。 請參閱這裡取得臉部有限存取的詳細資料並參閱這裡取得 Azure AI 視覺的詳細資料。
Azure AI 視覺 3.2 預覽版淘汰
3.2 API 的預覽版本已排定在 2022 年 12 月淘汰。 建議客戶改用正式發行 (GA) 版 API。 移轉時,請注意 3.2-預覽版版本的下列變更:
- 分析影像和讀取 API 呼叫現在會採用選擇性的模型版本參數,供您用來指定要使用的 AI 模型。 預設會使用最新的模型。
- 分析影像和讀取 API 呼叫也會在成功的 API 回應中傳回
model-version
欄位。 此欄位會報告所使用的模型。 - 影像分析 API 現在使用不同的錯誤報告格式。 請參閱 API 參考檔,了解如何調整任何錯誤處理常式程式碼。
2022 年 5 月
光學字元辨識 (OCR) API 模型現已正式發行 (GA)
Azure AI 視覺的光學字元辨識 (讀取) API 最新的模型具備 164 種支援語言,現已正式以雲端服務和容器的形式發行。
- 印刷文字的光學字元辨識支援擴充至 164 種語言,包括使用斯拉夫文、阿拉伯文、印度文和其他如古斯拉夫文、阿拉伯文和梵文字母的指令碼。
- 手寫文字的光學字元辨識支援擴充為 9 種語言,其中包含英文、簡體中文、法文、德文、義大利文、日文、韓文、葡萄牙文和西班牙文。
- 增強對對單一字元、手寫日期、金額、名稱、收據和發票中常見其他實體的支援。
- 改善數位 PDF 文件的流程。
- 輸入檔案大小限制增加 10 倍至 500 MB。
- 效能和延遲改善。
- 可作為雲端服務和Docker 容器使用。
請參閱光學字元辨識 (OCR) 操作指南,了解如何使用正式發行 (GA) 模型。
2022 年 2 月
OCR (讀取) API 公開預覽版支援 164 種語言
Azure AI 視覺的 OCR (讀取) API 將支援的語言擴充至 164 種,並提供最新的預覽:
- 印刷文字的光學字元辨識支援會擴充至 42 種新語言,包括使用阿拉伯文和梵文字母指令碼的其他語言。
- 手寫文字的光學字元辨識支援會擴充為多種語言,其中包含日文、韓文、英文、簡體中文、法文、德文、義大利文、葡萄牙文和西班牙文。
- 增強功能包括擷取手寫日期、數量、名稱和單一字元方塊的更佳支援。
- 一般效能和 AI 品質改進
請參閱 OCR 操作指南以了解如何使用新的預覽功能。
Detection_01 與 Detection_03 的新品質屬性
- 為了協助系統建立程式和其客戶擷取臉部 API 高品質輸出所需的高品質影像,我們引進了新的品質屬性 QualityForRecognition,來協助判斷影像是否具有足夠的品質來嘗試臉部辨識。 值是低、中或高的非正式評等。 僅在使用偵測模型
detection_01
或detection_03
、辨識模型recognition_03
或recognition_04
的任何組合時,才能使用新的屬性。 若用於人員註冊,建議僅使用「高」品質影像,若用於識別案例則建議至少使用「中」品質以上的影像。 若要深入了解新的品質屬性,請參閱臉部偵測與屬性,並了解如何搭配快速入門使用。
2021 年 9 月
OCR (讀取) API 公開預覽版支援 122 種語言
Azure AI 視覺的 OCR (讀取) API 將支援的語言擴充至 122 種,並提供最新的預覽:
- OCR 支援 49 種新語言的列印文字,包括俄文、保加利亞文和其他斯拉夫文和其他拉丁語言。
- OCR 支援 6 種新語言的手寫文字,包括英文、簡體中文、法文、德文、義大利文、葡萄牙文和西班牙文。
- 處理數位 PDF 和電腦可讀取區域 (MRZ) 文字在識別文件方面的增強功能。
- 一般效能和 AI 品質改進
請參閱 OCR 操作指南以了解如何使用新的預覽功能。
2021 年 8 月
影像標記語言擴充
最新版本 (v3.2) 的影像標記程式現在支援 50 種語言的標記。 如需詳細資訊,請參閱語言支援頁面。
2021 年 7 月
Detection_03 的新 HeadPose 和地標改進
- Detection_03 模型已更新為支援臉部地標。
- Detection_03 中的地標功能更精確,特別是在眼球地標中,這對注視追蹤至關重要。
2021 年 5 月
空間分析容器更新
已發行包含新功能集的新版空間分析容器。 此 Docker 容器可讓您分析即時串流影片,透過實體環境了解人員之間的空間關聯性,以及移動情況。
空間分析作業現在可以設定為偵測某位人員所面對的方向。
- 您可以透過設定
enable_orientation
參數,為personcrossingline
和personcrossingpolygon
作業啟用方向分類器。 其預設為關閉狀態。
- 您可以透過設定
空間分析作業現在也提供偵測某位人員行走/跑步速度的設定
- 開啟
enable_speed
分類器 (預設為關閉狀態) 可以偵測personcrossingline
和personcrossingpolygon
作業的速度。 輸出會反映在speed
、avgSpeed
和minSpeed
輸出中。
- 開啟
2021 年 4 月
Azure AI 視覺 v3.2 GA
電Azure AI 視覺 API v3.2 現已正式推出,並提供下列更新:
- 改良影像標記模型:分析視覺內容,並根據影像中所顯示的物件、動作和內容,產生相關的標記。 此模型可透過標記影像 API 取得。 若要深入了解,請參閱影像分析操作指南和概觀。
- 更新內容仲裁模型:偵測是否存在成人內容,並提供旗標以篩選包含成人、猥褻和暴力視覺內容的影像。 此模型可透過分析 API 取得。 若要深入了解,請參閱影像分析操作指南和概觀。
- OCR (讀取) 適用於 73 種語言,包括簡體中文和繁體中文、日文、韓文和拉丁語言。
- OCR (讀取) 也可以部署為內部部署的 Distroless 容器。
PersonDirectory 資料結構 (預覽版)
- 若要執行臉部辨識作業 (例如識別和尋找類似的項目),臉部 API 客戶必須建立各種 Person 物件清單。 新的 PersonDirectory 是一種資料結構,其中包含新增至目錄之每個 Person 身分識別的唯一識別碼、選擇性的名稱字串和選擇性的使用者中繼資料字串。 目前,臉部 API 提供的 LargePersonGroup 結構具有類似的功能,但受限於 1 百萬個身分識別。 PersonDirectory 結構最多可擴大至 7 千 5 百萬個身分識別。
- PersonDirectory 和先前的資料結構的主要差別在於,在向 Person 物件新增臉部後,您就不再需要進行任何定型呼叫,更新程序會自動發生。 如需詳細資訊,請參閱使用 PersonDirectory 結構。
2021 年 3 月
Azure AI 視覺 3.2 公開預覽版更新
Azure AI 視覺 API v3.2 公開預覽版已更新。 預覽版本具備所有 Azure AI 視覺功能,以及更新的讀取和分析 API。
2021 年 2 月
包含 OCR 功能的讀取 API v3.2 公開預覽版支援 73 種語言
Azure AI 視覺讀取 API v3.2 公開預覽版 (以雲端服務和 Docker 容器形式提供) 包含下列更新:
- OCR 適用於 73 種語言,包括簡體中文和繁體中文、日文、韓文和拉丁語言。
- 文字行輸出的自然讀取順序 (僅適用於拉丁語言)
- 文字行的手寫樣式分類以及信賴分數 (僅適用於拉丁語言)。
- 若文件包含多個頁面,則只會擷取所選頁面的文字。
- 可以部署為內部部署的 Distroless 容器。
若要深入了解,請參閱讀取 API 操作指南。
新的臉部 API 偵測模型
- 新的 Detection 03 模型是目前可用的最精確偵測模型。 如果您是新客戶,建議使用此模式。 Detection 03 可改善在影像中找到的較小臉部的召回率和精確度 (64x64 像素)。 額外的改進包括整體誤報的降低,以及對旋轉臉部方向的改善偵測。 將 Detection 03 與新的 Recognition 04 模型結合,也可提升辨識正確性。 如需詳細資料,請參閱指定臉部偵測模型。
新可偵測的臉部屬性
faceMask
屬性可用於最新的 Detection 03 模型,以及其他屬性"noseAndMouthCovered"
,這可偵測口罩是否有按預期佩戴,同時遮住鼻子和嘴巴。 若要使用最新的口罩偵測功能,使用者必須在 API 要求中指定偵測模型:將具有 detectionModel 參數的模型版本指派為detection_03
。 如需詳細資料,請參閱指定臉部偵測模型。
新的臉部 API 辨識模型
- 新的 Recognition 04 模型是目前可用的最精確辨識模型。 如果您是新客戶,我們建議使用此模型來進行驗證和識別。 這可改善 Recognition 03 的正確性,包括改善在使用者穿戴臉部遮蔽物 (外科口罩、N95 口罩和布口罩) 時的辨識能力。 建議您不要註冊使用者穿戴臉部遮蔽物的影像,因為這會降低辨識品質。 現在您可以建立安全順暢的使用者體驗,這些體驗會使用最新的 Detection 03 模型偵測使用者是否正戴著口罩,然後使用最新的 Recognition 04 模型辨識其身分。 如需詳細資料,請參閱指定臉部辨識模型。
2021 年一月
空間分析容器更新
已發行包含新功能集的新版空間分析容器。 此 Docker 容器可讓您分析即時串流影片,透過實體環境了解人員之間的空間關聯性,以及移動情況。
- 空間分析作業現在可以設定為偵測某個人是否戴著口罩之類的防護面罩。
- 您可以藉由設定
ENABLE_FACE_MASK_CLASSIFIER
參數,為personcount
、personcrossingline
和personcrossingpolygon
作業啟用面罩分類器。 face_mask
和face_noMask
屬性會以中繼資料的形式傳回,且影片串流中所偵測到的每個人都會有信賴分數
- 您可以藉由設定
- personcrossingpolygon 作業已經過擴充,可允許計算某個人在區域中花費的停留時間。 您可以在區域設定中,將作業的
type
參數設定為zonedwelltime
,而且 personZoneDwellTimeEvent 類型的新事件將包含durationMs
欄位,此欄位會填入該人員在區域中花費的毫秒數。 - 重大變更:personZoneEvent 事件已重新命名為 personZoneEnterExitEvent。 當某個人員進入或離開區域時,personcrossingpolygon 作業會引發此事件,並針對已穿過區域的編號端提供方向資訊。
- 影片 URL 在所有作業中可以當作「私用參數/模糊化」。 模糊化現在是選用的,只有在
KEY
和IV
是以環境變數的形式提供時,才會運作。 - 預設會針對所有作業啟用校正。 設定
do_calibration: false
以將其停用。 - 新增透過
enable_recalibration
參數自動重新校正的支援 (預設為停用狀態),如需詳細資料,請參閱空間分析作業 DETECTOR_NODE_CONFIG
的相機校正參數。 如需詳細資料,請參閱空間分析作業。
緩和延遲
- 臉部小組發佈了一篇新文章,詳述使用服務和可能的風險降低策略時的潛在延遲原因。 請參閱降低使用臉部服務時的延遲。
2020 年 12 月
臉部識別碼儲存體的客戶設定
- 當臉部服務未儲存客戶影像時,已擷取的臉部特徵將會儲存在伺服器上。 臉部識別碼是臉部特徵的識別碼,將用於 Face - Identify (臉部 - 識別)、Face - Verify (臉部 - 驗證) 及 Face - Find Similar (臉部 - 尋找類似的項目)。 儲存的臉部特徵將會在原始偵測呼叫後的 24 小時後過期並遭到刪除。 客戶現在可以決定這些臉部識別碼的快取時間長度。 最大值仍為 24 小時,但現在可以設定最小值 60 秒。 所快取之臉部識別碼的新時間範圍為介於 60 秒到 24 小時之間的任何值。 如需詳細資訊,請參閱 (faceIdTimeToLive 參數) 的Face - Detect (臉部 - 偵測) API 參考。
2020 年 11 月
樣本臉部註冊應用程式
- 小組已發佈樣本臉部註冊應用程式,以示範如何透過高品質的註冊,來建立有意義的同意和建立高正確性臉部辨識系統的最佳做法。 您可以在建立註冊應用程式指南和 GitHub (可供開發人員部署或自訂) 中找到開放原始碼樣本。
2020 年 10 月
Azure AI 視覺 API v3.1 GA
正式運作的 Azure AI 視覺 API 已升級至 v3.1。
2020 年 9 月
空間分析容器預覽
空間分析容器目前為預覽狀態。 Azure AI 視覺的空間分析功能可讓您分析即時串流影片,透過實體環境了解人員之間的空間關聯性,以及移動情況。 空間分析是一種 Docker 容器,可供您用來執行內部部署。
Read API v3.1 公開預覽版新增日文的 OCR
Azure AI 視覺讀取 API v3.1 公開預覽版新增下列功能:
日文 OCR
指出每行文字的外觀是手寫或列印樣式,以及信賴分數 (僅限拉丁語言)。
若文件包含多個頁面,則只會擷取選取的頁面或頁面範圍文字。
此預覽版本的 Read API 支援英文、荷蘭文、法文、德文、義大利文、日文、葡萄牙文、簡體中文和西班牙文語言。
若要深入了解,請參閱讀取 API 操作指南。
2020 年 8 月
客戶管理的待用資料加密
- 臉部服務會在將您的資料保存到雲端時自動加密資料。 臉部服務加密可保護資料安全,並協助您達到組織的安全性和合規性承諾。 根據預設,您的訂用帳戶會使用由 Microsoft 管理的加密金鑰。 此外,您也可以使用您自己名為客戶自控金鑰 (CMK) 的金鑰,來管理訂用帳戶。 您可以在客戶自控金鑰中找到更多詳細資料。
2020 年 7 月
Read API 3.1 公開預覽版新增了簡體中文 OCR
Azure AI 視覺讀取 API v3.1 公開預覽版新增簡體中文的支援。
- 此預覽版本的 Read API 支援英文、荷蘭文、法文、德文、義大利文、葡萄牙文、簡體中文和西班牙文語言。
若要深入了解,請參閱讀取 API 操作指南。
2020 年 5 月
Azure AI 視覺 API v3.0 已正式發行,並包含讀取 API 的更新:
- 支援英文、荷蘭文、法文、德文、義大利文、葡萄牙文和西班牙文
- 更高的精確度
- 每個擷取字組的信賴分數
- 新的輸出格式
若要深入了解,請參閱 OCR 概觀。
2020 年 4 月
新的臉部 API 辨識模型
- 新的 recognition 03 模型是目前可用的最精確模型。 如果您是新客戶,建議使用此模式。 Recognition 03 可提高相似度比較和人員比對比較的正確性。 如需詳細資料,請參閱指定臉部辨識模型。
2020 年 3 月
- 現在對於此服務的所有 HTTP 要求都會強制執行 TLS 1.2。 如需詳細資訊,請參閱 Azure AI 服務安全性。
2020 年 1 月
Read API 3.0 公開預覽
您現在可以使用 3.0 版的讀取 API,從影像中擷取列印或手寫的文字。 相較於舊版,3.0 提供:
- 更高的精確度
- 新的輸出格式
- 每個擷取字組的信賴分數
- 透過語言參數支援西班牙文與英文
遵循擷取文字快速入門,開始使用 3.0 API。
2019 年 6 月
新的臉部 API 偵測模型
- 新的 Detection 02 模型功能改善了小型、並排顯示、遮蔽和模糊臉部的正確性。 透過在
detectionModel
參數中指定新的臉部偵測模型名稱detection_02
,透過 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 加以使用。 詳細資料都在如何指定偵測模型中。
2019 年 4 月
改善的屬性正確性
- 改善
age
和headPose
屬性的整體正確性。headPose
屬性也會更新為現在已啟用的pitch
值。 透過在 Face - Detect (臉部 - 偵測)returnFaceAttributes
參數的returnFaceAttributes
參數中進行指定來使用這些屬性。
改善的處理速度
- 改善 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 的速度。
2019 年 3 月
新的臉部 API 辨識模型
- Recognition 02 模型已改善正確性。 透過在
recognitionModel
參數中指定新的臉部辨識模型名稱recognition_02
,透過 Face - Detect (臉部 - 偵測)、FaceList - Create (FaceList - 建立)、LargeFaceList - Create (LargeFaceList - 建立)、PersonGroup - Create (PersonGroup - 建立) 和 LargePersonGroup - Create (LargePersonGroup - 建立) 加以使用。 詳細資料都在如何指定辨識模型中。
2019 年 1 月
臉部快照集功能
- 此功能允許服務支援訂用帳戶間的資料移轉:快照集。
重要
臉部快照集 API 已自 2023 年 6 月 30 日起淘汰。
2018 年 10 月
API 訊息
- PersonGroup - 取得訓練狀態、LargePersonGroup - 取得訓練狀態 及 LargeFaceList - 取得訓練狀態 中
status
、createdDateTime
、lastActionDateTime
和lastSuccessfulTrainingDateTime
的精簡描述。
2018 年 5 月
改善的屬性正確性
- 已大幅改善
gender
屬性,並已改善age
、glasses
、facialHair
、hair
、makeup
屬性。 您可以透過 Face - Detect (臉部 - 偵測)returnFaceAttributes
參數來使用這些屬性。
檔案大小限制增加
- 在 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 中,輸入影像檔大小限制從 4 MB 提高到 6 MB。
2018 年 3 月
新的資料結構
- LargeFaceList 和 LargePersonGroup。 如何調整以處理更多已註冊的使用者中的詳細資料。
- 將 Face - Identify (臉部 - 識別)
maxNumOfCandidatesReturned
參數從 [1, 5] 提高到 [1, 100],預設為 10。
2017 年 5 月
新可偵測的臉部屬性
- 在 Face - Detect (臉部 - 偵測)
returnFaceAttributes
參數中新增hair
、makeup
、accessory
、occlusion
、blur
、exposure
和noise
屬性。 - 在 PersonGroup 和 Face - Identify (臉部 - 識別) 中支援 一萬人。
- PersonGroup Person - List (PersonGroup Person - 列出) 支援分頁,其選擇性參數為:
start
和top
。 - 支援同時對不同的 FaceList 和 PersonGroup 中的不同人員新增/刪除臉部。
2017 年 3 月
新可偵測的臉部屬性
- 在 Face - Detect (臉部 - 偵測)
returnFaceAttributes
參數中新增emotion
屬性。
已修正的問題
- 無法使用從 Face - Detect (臉部 - 偵測) 傳回的矩形,重新偵測臉部作為 FaceList - Add Face (FaceList - 新增臉部) 和 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 中的
targetFace
。 - 已設定可偵測的臉部大小,確保其完全介於 36x36 到 4096x4096 像素之間。
2016 年 11 月
新的訂用帳戶階層
- 新增臉部儲存體標準訂用帳戶,在使用 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 或 FaceList - Add Face (FaceList - 新增臉部) 時,持續儲存更多的臉部,供比對識別及相似度之用。 儲存影像的計費方式為每 1000 張人臉美金 $0.5,並會依使用天數按比例計算。 免費層訂用帳戶的總人數會繼續僅限 1,000 名。
2016 年 10 月
API 訊息
- 在 FaceList - Add Face (FaceList - 新增臉部) 和 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 中,將
targetFace
中有多個臉部的錯誤訊息,從「There are more than one face in the image」變更為「There is more than one face in the image」。
2016 年 7 月
新功能
- 在 Face - Verify (臉部 - 驗證) 中支援 Face 對 Person 物件的驗證。
- 在 Face - Find Similar (臉部 - 尋找類似項目) 中新增選擇性
mode
參數,讓您可以選取兩個工作模式:matchPerson
和matchFace
,預設為matchPerson
。 - 在 Face - Identify (臉部 - 識別) 中新增選擇性
confidenceThreshold
參數,讓使用者可以設定某個臉部是否屬於 Person 物件的閾值。 - 在 PersonGroup - List (PersonGroup - 列出) 中新增選擇性
start
和top
參數,讓使用者可以為清單指定起點和 PersonGroup 總數。
從 V0 變更為 V1.0
- 將服務根端點從
https://westus.api.cognitive.microsoft.com/face/v0/
更新為https://westus.api.cognitive.microsoft.com/face/v1.0/
。 變更適用於:Face - Detect (臉部 - 偵測)、Face - Identify (臉部 - 識別)、Face - Find Similar (臉部 - 尋找類似項目) 和 Face - Group (臉部 - 分組)。 - 將可偵測的臉部大小下限更新為 36x36 像素。 小於 36x36 像素的臉部將無法被偵測。
- 臉部 V0 中的 PersonGroup 和 Person 資料已淘汰。 無法使用臉部 V1.0 服務存取這些資料。
- 臉部 API 的 V0 端點已於 2016 年 6 月 30 日淘汰。