Azure AI 視覺的新功能
瞭解 Azure AI 視覺的新功能。 檢查此頁面以掌握新功能、增強功能、修正程式和檔更新的最新狀態。
2024 年 2 月
多模式內嵌 GA:新的多語言模型
多模式內嵌 API 已更新,現已正式推出。 新的 2024-02-01
API 包含支援 102 種語言文字搜尋的新模型。 原始的英文模型仍可供使用,但無法與相同搜尋索引中的新模型合併。 如果您使用僅限英文模型向量化文字和影像,則這些向量與多語系文字和影像向量不相容。
2024 年一月
新的影像分析 SDK 1.0.0-beta.1 (重大變更)
影像分析 SDK 已在 1.0.0-beta.1 版中重寫,以更符合其他 Azure SDK。 所有 API 都已變更。 如需如何使用新 SDK 的相關信息,請參閱更新 的快速入門、 範例 和 操作指南 。
主要變更:
- SDK 現在會呼叫正式運作 電腦視覺 REST API (2023-10-01),而不是預覽 電腦視覺 REST API (2023-04-01-preview)。
- 已新增 JavaScript 的支援。
- 不再支援 C++。
- SDK 不再支援使用自定義模型進行影像分析,而且不再支援影像分割(背景移除),因為 電腦視覺 REST API (2023-10-01) 尚未支持它們。 若要使用任一功能,請直接呼叫 電腦視覺 REST API (2023-04-01-preview) (分別使用
Analyze
和Segment
作業)。
2023 年 11 月
分析影像 4.0 GA
分析影像 4.0 REST API 現已正式推出。 請遵循分析影像 4.0 快速入門以開始使用。
影像分析的其他功能,例如模型自定義、背景移除和多模式內嵌,仍為公開預覽狀態。
臉部用戶端 SDK 以進行即時偵測
臉部 Liveness SDK 支援使用者行動裝置或邊緣裝置上的即時偵測。 適用於 Android 的 Java/Kotlin 和適用於 iOS 的 Swift/Objective-C 提供。
我們的活躍度偵測服務符合 iBeta 層級 1 和 2 ISO/IEC 30107-3 合規性。
2023 年 9 月
淘汰過時的 電腦視覺 API 版本
電腦視覺 API 1.0、2.0、3.0 和 3.1 版將於 2026 年 9 月 13 日淘汰。 開發人員將無法在該日期之後對這些 API 進行 API 呼叫。 我們建議所有受影響的客戶都依照本快速入門的便利性,將其工作負載移轉至正式運作的 電腦視覺 3.2 API。 客戶也應該考慮移轉至 影像分析 4.0 API(預覽版),其具有我們最新且最偉大的影像分析功能。
如需任何問題,請造訪我們的 問答 。
2023 年 5 月
影像分析 4.0 產品辨識 (公開預覽版)
產品辨識 API 可讓您分析零售商店中貨架相片。 您可以偵測產品是否存在,並取得週框方塊座標。 與模型自訂搭配使用,將模型定型以識別您的特定產品。 您也可以比較產品辨識結果與商店的貨架圖文件。 產品辨識。
2023 年 4 月
臉部有限存取權杖
獨立軟體供應商 (ISV) 可以發行存取令牌,授與通常閘道的臉部功能存取權,來管理其用戶端的臉部 API 使用方式。 這可讓用戶端公司使用臉部 API,而無須進行正式核准程序。 使用有限存取權杖。
2023 年 3 月
Azure AI 視覺影響分析 4.0 SDK 公開預覽版
Florence 基礎模型現在已整合至 Azure AI 視覺。 改善的視覺服務可讓開發人員跨各種產業建立市場就緒、負責任的 Azure AI 視覺應用程式。 客戶現在可以順暢將資料數位化、進行分析及連線至自然語言互動,深入解析影像和影片內容以支援網站無障礙性,透過 SEO 推動流量獲得、保護使用者免於有害內容、強化安全性,以及改善事件回應時間。 如需詳細資訊,請參閱 宣佈 Microsoft 的 Florence 基礎模型。
影像分析 4.0 SDK (公開預覽版)
影像分析 4.0 現在可透過 C#、C++ 和 Python 的用戶端程式庫 SDK 取得。 此更新也包含人類同等表現的 Florence 支援影像輔助字幕和密集輔助字幕。
影像分析 V4.0 輔助字幕和密集輔助字幕 (公開預覽版):
「標題」取代 V4.0 中的「描述」,因為改善的影像 標題 功能豐富,具有詳細數據和語意理解。 除了描述整個影像之外,密集標題還提供更多詳細數據,方法是產生最多10個影像區域的一句描述。 密集輔助字幕也會傳回所描述影像區域的週框方塊座標。 另外還有新的性別中性參數,可讓客戶選擇是否要啟用替代文字和 Seeing AI 應用程式的預測性性別推斷。 自動提供豐富的輔助字幕、無障礙替代文字、SEO 優化,以及智慧型相片策劃,以支援數位內容。 影像輔助字幕。
影片摘要和影格定位器 (公用預覽版):
使用您所想和撰寫的相同直覺方式,搜尋影片內容並與其進行互動。 找出相關的內容,而不需要額外的元數據。 僅適用於 Vision Studio。
影像分析 4.0 模型自訂 (公開預覽版)
您現在可以建立使用 Vision Studio 或 v4.0 REST API 來建立和定型自己的自訂影像分類和物件偵測模型。
多模式內嵌 API (公開預覽)
多模式內嵌 API 是影像分析 4.0 API 的一部分,可讓您向量化影像和文字查詢。 這可讓您將影像和文字轉換成多維度向量空間的座標。 您現在可以使用自然語言搜尋,並使用向量相似度搜尋來尋找相關的影像。
背景移除 API (公開預覽版)
作為影像分析 4.0 API 的一部分,背景移除 API 可讓您移除影像的背景。 這項作業可以輸出透明背景所偵測前景物件的影像,或輸出顯示所偵測前景物件的不透明度的灰階 Alpha 遮罩影像。
Azure AI Vision 3.0 和 3.1 預覽已淘汰
Azure AI 視覺 3.0 和 3.1 API 的預覽版本已排定於 2023 年 9 月 30 日淘汰。 超過此日期後,客戶將無法對這些 API 進行任何呼叫。 鼓勵客戶改為將工作負載移轉至正式推出 (GA) 3.2 API。 請注意,從預覽本版移轉至 3.2 API 時的變更如下:
- 分析影像和讀取 API 呼叫會採用選擇性的模型版本參數,供您用來指定要使用的 AI 模型。 根據預設,他們會使用最新的模型。
- 分析 影像 和 讀取 API 呼叫也會傳回
model-version
成功 API 回應中的欄位。 此欄位會報告所使用的模型。 - Azure AI 視覺 3.2 API 使用不同的錯誤回報格式。 請參閱 API 參考檔,以瞭解如何調整任何錯誤處理程式碼。
2022 年 10 月
Azure AI 視覺影像分析 4.0 (公開預覽版)
影像分析 4.0 已在公開預覽版中發行。 新的 API 包含影像 標題、影像標記、物件偵測、智慧型作物、人員偵測和讀取 OCR 功能,全都可透過單一分析影像作業取得。 OCR 已針對效能增強的同步 API 中的一般非檔影像進行優化,可讓您更輕鬆地在工作流程中內嵌 OCR 支援的體驗。
2022 年 9 月
Azure AI 視覺 3.0/3.1 讀取預覽淘汰
Azure AI 視覺 3.0 和 3.1 讀取 API 的預覽版本已排定於 2023 年 1 月 31 日淘汰。 建議客戶參考 操作 說明和 快速入門 ,以改為開始使用正式推出 (GA) 版本的讀取 API。 最新的 GA 版本提供下列優點:
- 2022 最新正式推出 OCR 模型
- OCR 語言涵蓋範圍大幅擴大,包括手寫文字的支援
- 改善 OCR 品質
2022 年 6 月
Vision Studio 啟動
Vision Studio 是 UI 工具,可讓您從適 Azure AI 視覺探索、建置功能,並將其整合到您的應用程式中。
Vision Studio 提供您一個平臺來嘗試數個服務功能,並查看它們以可視化方式傳回的內容。 使用 Studio,您不需要撰寫程式代碼即可開始使用,然後在應用程式中使用可用的用戶端連結庫和 REST API。
適用於臉部的負責任 AI
臉部透明度附註
- 透明度附注提供指引,協助我們的客戶改善其系統的精確度和公平性,方法是納入有意義的人檢閱,以偵測和解決誤判或其他失敗案例、為相信其結果不正確的人員提供支援,以及識別和解決因操作條件變化而造成的精確度波動。
敏感性屬性的淘汰
- 我們已經淘汰了面部分析功能,據稱推斷情感狀態和身份屬性,例如性別、年齡、微笑、臉部頭髮、頭髮和化妝。
- 臉部偵測功能(包括偵測模糊、曝光、眼鏡、頭部置底、地標、噪音、遮蔽、臉部周框方塊)將一般可用,且不需要應用程式。
Fairlearn 套件和 Microsoft 的公平性儀錶板
- 開放原始碼 Fairlearn 套件和 Microsoft 的 Fairness 儀錶板 旨在支援客戶測量 Microsoft 臉部驗證演算法在其本身數據上的公平性,讓他們在部署技術之前找出並解決可能影響不同人口群體的潛在公平性問題。
受限存取原則
- 在將臉部對齊更新的負責 AI 標準過程中,已針對臉部 API 和電腦視覺實作新的有限存取原則。 現有的客戶有一年可申請並接收核准,以根據所提供的使用案例繼續存取臉部辨識服務。 請參閱這裡取得臉部有限存取的詳細資料並參閱這裡取得 Azure AI 視覺的詳細資料。
Azure AI 視覺 3.2 預覽版淘汰
3.2 API 的預覽版本定於 2022 年 12 月淘汰。 建議客戶改用正式推出 (GA) 版本的 API。 從 3.2-preview 版本移轉時,請記住下列變更:
- 分析 影像 和 讀取 API 呼叫現在會採用選擇性 的模型版本 參數,讓您可用來指定要使用的 AI 模型。 根據預設,他們會使用最新的模型。
- 分析 影像 和 讀取 API 呼叫也會傳回
model-version
成功 API 回應中的欄位。 此欄位會報告所使用的模型。 - 影像分析 API 現在使用不同的錯誤報告格式。 請參閱 API 參考檔,以瞭解如何調整任何錯誤處理程式碼。
2022 年 5 月
OCR (讀取) API 模型已正式推出 (GA)
Azure AI 視覺的光學字元辨識 (讀取) API 最新的模型具備 164 種支援語言,現已正式以雲端服務和容器的形式發行。
- 列印文字的 OCR 支援擴充為 164 種語言,包括使用斯拉夫文、阿拉伯文、阿拉伯文和 Devanagari 腳本的俄文、阿拉伯文、印度文和其他語言。
- 手寫文字的 OCR 支援擴充至英文、簡體中文、法文、德文、義大利文、日文、韓文、葡萄牙文和西班牙文的 9 種語言。
- 增強對單一字元、手寫日期、金額、名稱、收據和發票中常見其他實體的支援。
- 改善數位 PDF 文件的處理。
- 輸入檔案大小限制增加 10x 到 500 MB。
- 效能和延遲改善。
- 可作為 雲端服務和Docker 容器使用。
請參閱 OCR 操作指南,以瞭解如何使用 GA 模型。
2022 年 2 月
OCR (讀取) API 公開預覽支援 164 種語言
Azure AI 視覺的 OCR (讀取) API 將支援的語言擴充至 164 種,並提供最新的預覽:
- 列印文字的 OCR 支援擴充至 42 種新語言,包括阿拉伯文、印度文,以及使用阿拉伯文和 Devanagari 腳本的其他語言。
- 除了英文、簡體中文、法文、德文、義大利文、葡萄牙文和西班牙文之外,手寫文字的 OCR 支援也會擴展到日文和韓文。
- 增強功能,包括更好的支援擷取手寫日期、數量、名稱和單一字元方塊。
- 一般效能和 AI 品質改善
請參閱 OCR 操作指南,以瞭解如何使用新的預覽功能。
Detection_01 與 Detection_03 的新品質屬性
- 為了協助系統建置者及其客戶擷取高品質的影像,這是臉部 API 高品質輸出的必要條件,我們引進了新的品質屬性 QualityForRecognition ,以協助判斷影像是否具有足夠的質量來嘗試臉部辨識。 值是低、中或高的非正式評等。 僅在使用偵測模型
detection_01
或detection_03
、辨識模型recognition_03
或recognition_04
的任何組合時,才能使用新的屬性。 若用於人員註冊,建議僅使用「高」品質影像,若用於識別案例則建議至少使用「中」品質以上的影像。 若要深入了解新的品質屬性,請參閱臉部偵測與屬性,並了解如何搭配快速入門使用。
2021 年 9 月
OCR (讀取) API 公開預覽支援 122 種語言
Azure AI 視覺的 OCR (讀取) API 將支援的語言擴充至 122 種,並提供最新的預覽:
- OCR 支援以 49 種新語言列印文字,包括俄文、保加利亞文和其他斯拉夫文和更多的拉丁語言。
- OCR 支援 6 種新語言的手寫文字,包括英文、簡體中文、法文、德文、義大利文、葡萄牙文和西班牙文。
- 在身分識別檔中處理數位 PDF 和機器可讀取區域 (MRZ) 文字的增強功能。
- 一般效能和 AI 品質改善
請參閱 OCR 操作指南,以瞭解如何使用新的預覽功能。
2021 年 8 月
影像標記語言擴充
映像 標記工具的最新版本 (v3.2) 現在支援 50 種語言的標籤。 如需詳細資訊, 請參閱語言支持 頁面。
2021 年 7 月
Detection_03 的新 HeadPose 和地標改進
- Detection_03 模型已更新為支援臉部地標。
- Detection_03中的地標特徵更精確,特別是在眼球地標中,這對注視追蹤至關重要。
2021 年 5 月
空間分析容器更新
新的空間分析容器版本已發行,其中包含新的功能集。 此 Docker 容器可讓您分析即時串流影片,以了解人員與其透過實體環境移動之間的空間關聯性。
空間分析作業 現在可以設定為偵測人員所面對的方向。
- 您可以藉由
enable_orientation
設定 參數,為personcrossingline
和personcrossingpolygon
作業啟用方向分類器。 預設會將其設定為關閉。
- 您可以藉由
空間分析作業 現在也提供設定來偵測人員在步行/執行時的速度
- 您可以開啟
enable_speed
預設關閉分類器來偵測personcrossingline
和personcrossingpolygon
作業的速度。 輸出會反映在、avgSpeed
和minSpeed
輸出中speed
。
- 您可以開啟
2021 年 4 月
Azure AI 視覺 v3.2 GA
電Azure AI 視覺 API v3.2 現已正式推出,並提供下列更新:
- 改善影像標記模型:分析視覺內容,並根據影像中顯示的對象、動作和內容產生相關的標記。 此模型可透過 標籤映像 API 取得。 若要深入瞭解,請參閱影像分析 操作指南 和 概觀 。
- 更新的 con 帳篷模式 ration 模型:偵測成人內容是否存在,並提供旗標來篩選包含成人、猥褻和 Gory 視覺內容的影像。 此模型可透過 分析 API 取得。 若要深入瞭解,請參閱影像分析 操作指南 和 概觀 。
- OCR(閱讀)適用於73種語言 ,包括簡體中文和繁體中文、日文、韓文和拉丁語言。
- OCR (Read) 也可作為 內部部署的 Distroless 容器 使用。
PersonDirectory 數據結構 (預覽)
- 若要執行臉部辨識作業 (例如識別和尋找類似的項目),臉部 API 客戶必須建立各種 Person 物件清單。 新的 PersonDirectory 是一種資料結構,其中包含新增至目錄之每個 Person 身分識別的唯一識別碼、選擇性的名稱字串和選擇性的使用者中繼資料字串。 目前,臉部 API 提供的 LargePersonGroup 結構具有類似的功能,但受限於 1 百萬個身分識別。 PersonDirectory 結構最多可擴大至 7 千 5 百萬個身分識別。
- PersonDirectory 和先前的資料結構的主要差別在於,在向 Person 物件新增臉部後,您就不再需要進行任何定型呼叫,更新程序會自動發生。 如需詳細資訊,請參閱 使用 PersonDirectory 結構。
2021 年 3 月
Azure AI 視覺 3.2 公開預覽版更新
Azure AI 視覺 API v3.2 公開預覽版已更新。 預覽版本具備所有 Azure AI 視覺功能,以及更新的讀取和分析 API。
2021 年 2 月
使用 OCR 支援 73 種語言讀取 API v3.2 公開預覽
Azure AI 視覺讀取 API v3.2 公開預覽版 (以雲端服務和 Docker 容器形式提供) 包含下列更新:
- 適用於 73 種語言 的 OCR,包括簡體中文和繁體中文、日文、韓文和拉丁語言。
- 文字行輸出的自然閱讀順序(僅限拉丁語言)
- 文字行的手寫樣式分類以及信賴分數(僅限拉丁語言)。
- 僅針對多頁文件選取的頁面擷取文字。
- 可作為 內部部署部署的 Distroless 容器 。
請參閱閱讀 API 操作指南以深入瞭解。
新的臉部 API 偵測模型
- 新的 Detection 03 模型是目前可用的最精確偵測模型。 如果您是新客戶,建議使用此模式。 Detection 03 可改善在影像中找到的較小臉部的召回率和精確度 (64x64 像素)。 其他改進包括整體減少誤判,以及改善旋轉臉部方向的偵測。 將偵測 03 與新的辨識 04 模型結合,也提供改良的辨識精確度。 如需詳細資料,請參閱指定臉部偵測模型。
新可偵測的臉部屬性
- 屬性
faceMask
是最新的偵測 03 模型,以及新增的屬性"noseAndMouthCovered"
,可偵測臉部掩碼是否如預期般佩戴,同時覆蓋鼻子和嘴部。 若要使用最新的口罩偵測功能,使用者必須在 API 要求中指定偵測模型:將具有 detectionModel 參數的模型版本指派為detection_03
。 如需詳細資料,請參閱指定臉部偵測模型。
新的臉部 API 辨識模型
- 新的 Recognition 04 模型是目前可用的最精確辨識模型。 如果您是新客戶,我們建議使用此模型來進行驗證和識別。 這可改善 Recognition 03 的正確性,包括改善在使用者穿戴臉部遮蔽物 (外科口罩、N95 口罩和布口罩) 時的辨識能力。 建議您不註冊戴臉罩的使用者影像,因為這樣會降低辨識品質。 現在您可以建立安全順暢的使用者體驗,這些體驗會使用最新的 Detection 03 模型偵測使用者是否正戴著口罩,然後使用最新的 Recognition 04 模型辨識其身分。 如需詳細資料,請參閱指定臉部辨識模型。
2021 年一月
空間分析容器更新
新的空間分析容器版本已發行,其中包含新的功能集。 此 Docker 容器可讓您分析即時串流影片,以了解人員與其透過實體環境移動之間的空間關聯性。
- 空間分析作業 現在可以設定為偵測人員是否戴著防護面罩,例如遮罩。
- 您可以藉由
ENABLE_FACE_MASK_CLASSIFIER
設定 參數,personcount
personcrossingline
為和personcrossingpolygon
作業啟用遮罩分類器。 - 屬性
face_mask
和face_noMask
會以元數據的形式傳回,並針對在影片串流中偵測到的每個人提供信賴分數
- 您可以藉由
- 人員 交叉波利貢 作業已擴充,以允許計算人員在某個區域所花費的停留時間。 您可以在作業
zonedwelltime
的區域組態中設定type
參數,而personZoneDwellTimeEvent類型的新事件將會包含durationMs
填入填入區域中人員所花費毫秒數的欄位。 - 重大變更: personZoneEvent 事件已重新命名為 personZoneEnterExitEvent。 當人員進入或離開區域時,此事件是由 personcrossingpolygon 作業所引發,並提供方向資訊與交叉區域編號的側邊。
- 視訊 URL 可在所有作業中提供為「私人參數/模糊化」。 模糊化現在是選擇性的,只有在 提供和
IV
做為環境變數時KEY
,才能運作。 - 根據預設,所有作業都會啟用校正。
do_calibration: false
將設定為停用它。 - 已新增透過
enable_recalibration
參數自動重新調整的支援(預設為停用),請參閱 空間分析作業 以取得詳細數據 - 相機的
DETECTOR_NODE_CONFIG
校正參數。 如需詳細資訊, 請參閱空間分析作業 。
緩和延遲
- 臉部小組發佈了一篇新文章,詳述使用服務和可能的風險降低策略時的潛在延遲原因。 請參閱降低使用臉部服務時的延遲。
2020 年 12 月
臉部識別碼儲存體的客戶設定
- 當臉部服務未儲存客戶影像時,已擷取的臉部特徵將會儲存在伺服器上。 臉部識別碼是臉部特徵的識別碼,將用於 Face - Identify (臉部 - 識別)、Face - Verify (臉部 - 驗證) 及 Face - Find Similar (臉部 - 尋找類似的項目)。 儲存的臉部特徵將會在原始偵測呼叫後的 24 小時後過期並遭到刪除。 客戶現在可以決定這些臉部識別碼的快取時間長度。 最大值仍為 24 小時,但現在可以設定最小值 60 秒。 所快取之臉部識別碼的新時間範圍為介於 60 秒到 24 小時之間的任何值。 如需詳細資訊,請參閱 (faceIdTimeToLive 參數) 的Face - Detect (臉部 - 偵測) API 參考。
2020 年 11 月
樣本臉部註冊應用程式
- 小組已發佈樣本臉部註冊應用程式,以示範如何透過高品質的註冊,來建立有意義的同意和建立高正確性臉部辨識系統的最佳做法。 您可以在建立註冊應用程式指南和 GitHub (可供開發人員部署或自訂) 中找到開放原始碼樣本。
2020 年 10 月
Azure AI 視覺 API v3.1 GA
正式運作的 Azure AI 視覺 API 已升級至 v3.1。
2020 年 9 月
空間分析容器預覽
空間分析容器現在處於預覽狀態。 Azure AI 視覺的空間分析功能可讓您分析即時串流影片,透過實體環境了解人員之間的空間關聯性,以及移動情況。 空間分析是您可以使用內部部署的 Docker 容器。
讀取 API v3.1 公開預覽新增適用於日文的 OCR
Azure AI 視覺讀取 API v3.1 公開預覽版新增下列功能:
適用於日文語言的 OCR
針對每個文字行,指出外觀是否為手寫或列印樣式,以及信賴分數(僅限拉丁語言)。
針對多頁檔,僅針對選取的頁面或頁面範圍擷取文字。
此閱讀 API 的預覽版本支援英文、荷蘭文、法文、德文、義大利文、日文、葡萄牙文、簡體中文和西班牙文語言。
請參閱閱讀 API 操作指南以深入瞭解。
2020 年 8 月
客戶管理的待用資料加密
- 臉部服務會在將您的資料保存到雲端時自動加密資料。 臉部服務加密可保護資料安全,並協助您達到組織的安全性和合規性承諾。 根據預設,您的訂用帳戶會使用由 Microsoft 管理的加密金鑰。 此外,您也可以使用您自己名為客戶自控金鑰 (CMK) 的金鑰,來管理訂用帳戶。 您可以在客戶自控金鑰中找到更多詳細資料。
2020 年 7 月
讀取 API v3.1 公開預覽與 OCR for 簡體中文
Azure AI 視覺讀取 API v3.1 公開預覽版新增簡體中文的支援。
- 此閱讀 API 的預覽版本支援英文、荷蘭文、法文、德文、義大利文、葡萄牙文、簡體中文和西班牙文語言。
請參閱閱讀 API 操作指南以深入瞭解。
2020 年 5 月
Azure AI 視覺 API v3.0 已正式發行,並包含讀取 API 的更新:
- 支援英文、荷蘭文、法文、德文、義大利文、葡萄牙文和西班牙文
- 改善的正確性
- 每個擷取字組的信賴分數
- 新的輸出格式
若要深入瞭解, 請參閱 OCR 概觀 。
2020 年 4 月
新的臉部 API 辨識模型
- 新的 recognition 03 模型是目前可用的最精確模型。 如果您是新客戶,建議使用此模式。 辨識 03 可改善相似度比較和人員比對比較的精確度。 如需詳細資料,請參閱指定臉部辨識模型。
2020 年 3 月
- 現在對於此服務的所有 HTTP 要求都會強制執行 TLS 1.2。 如需詳細資訊,請參閱 Azure AI 服務安全性。
2020 年 1 月
讀取 API 3.0 公開預覽
您現在可以使用 3.0 版的讀取 API,從影像中擷取列印或手寫文字。 相較於舊版,3.0 提供:
- 改善的正確性
- 新的輸出格式
- 每個擷取字組的信賴分數
- 支援具有 language 參數的西班牙文和英文語言
請遵循擷 取文字快速入門 ,開始使用3.0 API。
2019 年 6 月
新的臉部 API 偵測模型
- 新的 Detection 02 模型功能改善了小型、並排顯示、遮蔽和模糊臉部的正確性。 透過在
detectionModel
參數中指定新的臉部偵測模型名稱detection_02
,透過 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 加以使用。 詳細資料都在如何指定偵測模型中。
2019 年 4 月
改善的屬性正確性
- 改善
age
和headPose
屬性的整體正確性。headPose
屬性也會更新為現在已啟用的pitch
值。 使用這些屬性,方法是在 Face - DetectreturnFaceAttributes
(臉部 - 偵測) 參數的returnFaceAttributes
參數中進行指定。
改善的處理速度
- 改善 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 的速度。
2019 年 3 月
新的臉部 API 辨識模型
- Recognition 02 模型已改善正確性。 透過在
recognitionModel
參數中指定新的臉部辨識模型名稱recognition_02
,透過 Face - Detect (臉部 - 偵測)、FaceList - Create (FaceList - 建立)、LargeFaceList - Create (LargeFaceList - 建立)、PersonGroup - Create (PersonGroup - 建立) 和 LargePersonGroup - Create (LargePersonGroup - 建立) 加以使用。 詳細資料都在如何指定辨識模型中。
2019 年 1 月
臉部快照集功能
- 此功能允許服務支援訂用帳戶間的資料移轉:快照集。
重要
自 2023 年 6 月 30 日起,臉部快照集 API 已淘汰。
2018 年 10 月
API 訊息
- PersonGroup - 取得訓練狀態、LargePersonGroup - 取得訓練狀態 及 LargeFaceList - 取得訓練狀態 中
status
、createdDateTime
、lastActionDateTime
和lastSuccessfulTrainingDateTime
的精簡描述。
2018 年 5 月
改善的屬性正確性
- 已大幅改善
gender
屬性,並已改善age
、glasses
、facialHair
、hair
、makeup
屬性。 您可以透過 Face - Detect (臉部 - 偵測) 的returnFaceAttributes
參數來使用這些屬性。
檔案大小限制增加
- 在 Face - Detect (臉部 - 偵測)、FaceList - Add Face (FaceList - 新增臉部)、LargeFaceList - Add Face (LargeFaceList - 新增臉部)、PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 和 LargePersonGroup Person - Add Face (LargePersonGroup Person - 新增臉部) 中,輸入影像檔大小限制從 4 MB 提高到 6 MB。
2018 年 3 月
新的資料結構
- LargeFaceList 和 LargePersonGroup。 如何調整以處理更多已註冊的使用者中的詳細數據。
- 將 Face - Identify (臉部 - 識別) 的
maxNumOfCandidatesReturned
參數從 [1, 5] 提高到 [1, 100],預設為 10。
2017 年 5 月
新可偵測的臉部屬性
- 在 Face - Detect (臉部 - 偵測) 的
returnFaceAttributes
參數中新增hair
、makeup
、accessory
、occlusion
、blur
、exposure
和noise
屬性。 - 在 PersonGroup 和 Face - Identify (臉部 - 識別) 中支援 一萬人。
- PersonGroup Person - List (PersonGroup Person - 列出) 支援分頁,其選擇性參數為:
start
和top
。 - 支援同時對不同的 FaceList 和 PersonGroup 中的不同人員新增/刪除臉部。
2017 年 3 月
新可偵測的臉部屬性
- 在 Face - Detect (臉部 - 偵測) 的
returnFaceAttributes
參數中新增emotion
屬性。
已修正的問題
- 無法使用從 Face - Detect (臉部 - 偵測) 傳回的矩形,重新偵測臉部作為 FaceList - Add Face (FaceList - 新增臉部) 和 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 中的
targetFace
。 - 已設定可偵測的臉部大小,確保其完全介於 36x36 到 4096x4096 像素之間。
2016 年 11 月
新的訂用帳戶階層
- 新增臉部儲存體標準訂用帳戶,在使用 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 或 FaceList - Add Face (FaceList - 新增臉部) 時,持續儲存更多的臉部,供比對識別及相似度之用。 儲存影像的計費方式為每 1000 張人臉美金 $0.5,並會依使用天數按比例計算。 免費層訂用帳戶的總人數會繼續僅限 1,000 名。
2016 年 10 月
API 訊息
- 在 FaceList - Add Face (FaceList - 新增臉部) 和 PersonGroup Person - Add Face (PersonGroup Person - 新增臉部) 中,將
targetFace
中有多個臉部的錯誤訊息,從「There are more than one face in the image」變更為「There is more than one face in the image」。
2016 年 7 月
新功能
- 在 Face - Verify (臉部 - 驗證) 中支援 Face 對 Person 物件的驗證。
- 在 Face - Find Similar (臉部 - 尋找類似項目) 中新增選擇性
mode
參數,讓您可以選取兩個工作模式:matchPerson
和matchFace
,預設為matchPerson
。 - 在 Face - Identify (臉部 - 識別) 中新增選擇性
confidenceThreshold
參數,讓使用者可以設定某個臉部是否屬於 Person 物件的閾值。 - 在 PersonGroup - List (PersonGroup - 列出) 中新增選擇性
start
和top
參數,讓使用者可以為清單指定起點和 PersonGroup 總數。
從 V0 變更為 V1.0
- 將服務根端點從
https://westus.api.cognitive.microsoft.com/face/v0/
更新為https://westus.api.cognitive.microsoft.com/face/v1.0/
。 變更適用於:Face - Detect (臉部 - 偵測)、Face - Identify (臉部 - 識別)、Face - Find Similar (臉部 - 尋找類似項目) 和 Face - Group (臉部 - 分組)。 - 將可偵測的臉部大小下限更新為 36x36 像素。 小於 36x36 像素的臉部將無法被偵測。
- 臉部 V0 中的 PersonGroup 和 Person 資料已淘汰。 無法使用臉部 V1.0 服務存取這些資料。
- 臉部 API 的 V0 端點已於 2016 年 6 月 30 日淘汰。