共用方式為


臉部偵測、屬性和輸入資料

警告

臉部辨識服務存取受限於資格和使用準則,以支援我們的「負責任的 AI 原則」。 臉部辨識服務僅供 Microsoft 受管理的客戶和合作夥伴使用。 請使用臉部辨識受理表單以申請存取。 如需詳細資訊,請參閱臉部的有限存取權頁面

重要

臉部屬性是透過使用統計演算法進行預測。 結果可能不一定正確。 當您根據屬性資料進行決策時,請特別小心。 請避免使用這些屬性進行反詐騙。 相反地,我們建議使用臉部活動偵測。 如需詳細資訊,請參閱教學課程:偵測臉部的活動

本文說明臉部偵測和臉部屬性資料的概念。 臉部偵測是找出影像中的人臉,並選擇性傳回不同種類臉部相關資料的流程。

您可以使用偵測 API 來偵測影像中的臉部。 若要開始使用 REST API 或用戶端 SDK,請遵循 臉部服務快速入門。 或如需更深入的指南,請參閱呼叫偵測 API

臉部矩形

每個偵測到的臉部都會對應至 回應中的faceRectangle 字段。 此為已偵測臉部的左側、頂端、寬度與高度的像素座標。 您可以使用這些座標來取得臉部的位置和大小。 在 API 回應中,臉部會按從最大到最小的大小順序列出。

使用 Azure AI Vision Studio 快速且輕鬆地試用臉部偵測的功能。

臉部識別碼

臉部識別碼是在影像中偵測到每個臉部的唯一識別碼字串。 臉部識別碼需要具備核准的有限存取權,您可以填寫受理表單來加以申請。 如需詳細資訊,請參閱臉部 API 有限存取頁面。 您可以在偵測 API 呼叫中要求臉部識別碼。

臉部特徵點

臉部特徵點是臉上一組容易尋找的點,例如瞳孔或鼻尖。 預設會有 27 個預先定義的臉部特徵點。 下圖顯示全部的 27 個點:

已標示所有 27 個地標的臉部圖表。

點的座標會以像素單位傳回。

Detection_03 模型目前有最精確的特徵點偵測。 它傳回的眼睛和學生地標足夠精確,能夠對臉部進行注視追蹤。

屬性

警告

Microsoft 已淘汰或限制可用來試圖推斷情緒狀態和身分識別屬性的臉部辨識功能,此功能若使用不當,可能會使人們遭受刻板印象、歧視或不公平服務遭拒的影響。 淘汰的功能為情感和性別。 限制的功能為年齡、微笑、臉部毛髮、頭髮和化妝。 如果您有負責任的使用案例可受益於使用任何限制的功能,請傳送電子郵件給 Azure 臉部 API。 在這裡深入了解此決策。

屬性是一組功能,可選擇性地透過偵測 API 來偵測。 可以偵測下列屬性:

  • 配件:指出指定的臉部是否有配件。 此屬性會傳回可能的配件,包括頭飾、眼鏡和面具,每個配件的信賴分數介於零到一個之間。

  • 模糊:表示影像中臉部的模糊。 此屬性會傳回介於 0 和 1 之間的值,以及低、中或高的非正式評等。

  • 曝光:表示影像中臉部的曝光。 這個屬性會傳回介於零和一之間的值,以及 underExposure、goodExposure 或 overExposure非正式評等。

  • 眼鏡:指出指定的臉部是否有眼鏡。 可能的值為 NoGlasses、ReadingGlassesSunglassesSwimming Goggles

  • 頭部姿勢:表示 3D 空間中的臉部方向。 此屬性是以翻滾、偏擺和俯仰的角度來描述,並以度為單位,這些角度是根據右手法則而定義。 三個角度的順序為 roll-yaw-pitch,而每個角度的值範圍是從 -180 度到 +180 度。 臉部的 3D 方向是依順序按翻滾、偏擺和俯仰角度進行預估。 請參閱下圖以瞭解角度對應:

    標有傾斜、滾軸和偏轉軸的頭部圖表。

    如需如何使用這些值的詳細資訊,請參閱 使用 HeadPose 屬性

  • 遮罩:指出臉部是否戴著面具。 此屬性會傳回可能的口罩類型,以及指出是否覆蓋鼻子和嘴的布林值。

  • 雜訊:表示臉部影像中偵測到的視覺雜訊。 這個屬性會傳回介於零到一之間的值,以及低、中或高等級的非正式評等。

  • 遮蔽:指出是否有對象封鎖臉部的部分。 此屬性會傳回 eyeOccluded、foreheadOccluded 和 mouthOccluded布爾值。

  • QualityForRecognition:指出要判斷偵測中使用的影像是否足夠品質,以嘗試進行臉部辨識的整體影像品質。 值是低、中或高的非正式評等。 只有 高品質的 影像建議用於人員註冊,而識別案例則建議使用品質或高於 中型

    注意

    各屬性可用性取決於指定的偵測模型。 QualityForRecognition 屬性也取決於辨識模型,因為它目前只有在使用偵測模型的組合detection_01或detection_03,以及辨識模型recognition_03或recognition_04時才能使用。

輸入需求

使用下列秘訣,確定您的輸入影像能提供最精確的偵測結果:

  • 支援的輸入影像格式包括 JPEG、PNG、GIF (第一個畫面格)、BMP。
  • 影像檔案大小應大於 6 MB。
  • 可偵測的臉部大小下限是 36 x 36 像素 (位於不超過 1920 x 1080 像素的影像中)。 大於 1920 x 1080 像素的影像臉部大小下限會按比例調整增大。 減少臉部大小可能導致無法偵測到某些臉部,即使其大於可偵測的臉部大小下限。
  • 可偵測的臉部大小上限為 4096 x 4096 像素。
  • 無法偵測到超出 36 x 36 到 4096 x 4096 像素大小範圍之外的臉部。

使用方向資訊輸入數據

某些具有 JPEG 格式的輸入影像可能包含可交換影像檔案格式 (EXIF) 元數據的方向資訊。 如果有提供 EXIF 方向,在傳送以進行臉部偵測前,會將影像自動旋轉為正確方向。 針對每個偵測到臉部,其臉部矩形、特徵點和頭部姿勢都會依據已旋轉的影像進行預估。

若要適當地顯示臉部矩形和特徵點,您必須確定已正確旋轉影像。 大多數的影像視覺效果工具會預設根據 EXIF 方向自動旋轉影像。 若是其他工具,您可能需要使用自己的程式碼來套用旋轉。 下列範例顯示旋轉影像上的臉部矩形 (左) 和非旋轉影像 (右)。

兩張臉部影像的螢幕快照,其中具有和 沒有旋轉。

視訊輸入

如果您要偵測視訊摘要中的臉部,您可以藉由調整視訊相機上的特定設定來改善效能:

  • 平滑:許多相機都會套用平滑效果。 此功能會在畫面格之間造成模糊並減少清晰度,若可以的話您應關閉此功能。

  • 快門速度:快門速度可降低畫面之間的動作量,並讓每個畫面更清晰。 建議您使用 1/60 秒或更快的快門速度。

  • 快門角度:某些相機會指定快門角度,而不是快門速度。 您應該盡可能使用較低的快門角度,這會導致更清楚的視訊畫面。

    注意

    具有較低快門角度的相機感測器會在每個畫面中接收較少的光線,因此影像較暗。 您必須判斷要使用的正確層級。

後續步驟

現在您已熟悉臉部偵測概念,接下來請瞭解如何撰寫指令碼,以偵測指定影像中的臉部。