Rozpoznávání tváře, atributy a vstupní data

Upozornění

Přístup ke službě Rozpoznávání tváře je omezený na základě kritérií způsobilosti a použití, aby bylo možné podporovat naše zásady zodpovědné umělé inteligence. Služba Rozpoznávání tváře je dostupná jenom pro zákazníky a partnery spravované Microsoftem. Pro přístup použijte formulář pro příjem rozpoznávání tváře. Další informace najdete na stránce s omezeným přístupem k tváři.

Důležité

Atributy tváře se predikují pomocí statistických algoritmů. Nemusí být vždy přesné. Při rozhodování na základě dat atributů buďte opatrní. Vyhýbejte se používání těchto atributů pro falšování identity. Místo toho doporučujeme používat detekci rozpoznávání tváře. Další informace najdete v kurzu: Detekce živých tváří.

Tento článek vysvětluje koncepty rozpoznávání tváře a dat atributů tváře. Rozpoznávání tváře je proces vyhledání lidských tváří na obrázku a volitelně vrácení různých druhů dat souvisejících s tvářemi.

K detekci tváří na obrázku použijete rozhraní API pro rozpoznávání tváře. Pokud chcete začít používat rozhraní REST API nebo klientskou sadu SDK, postupujte podle rychlého startu. Nebo podrobnějšího průvodce najdete v tématu Volání rozhraní API pro detekci.

Obdélník tváře

Každá zjištěná tvář odpovídá faceRectangle poli v odpovědi. Toto je sada souřadnic pixelů pro levou, horní, šířku a výšku rozpoznané tváře. Pomocí těchto souřadnic můžete získat umístění a velikost tváře. V odpovědi rozhraní API jsou tváře uvedené v pořadí od největších po nejmenší.

Vyzkoušejte možnosti rychlého a snadného rozpoznávání tváře pomocí nástroje Vision Studio.

ID tváře

ID tváře je jedinečný řetězec identifikátoru pro každou rozpoznanou tvář na obrázku. Face ID vyžaduje schválení omezeného přístupu, na které můžete požádat vyplněním formuláře pro příjem. Další informace najdete na stránce s omezeným přístupem k tváři. Můžete si vyžádat ID tváře ve tváři – volání rozhraní API pro detekci .

Orientační body tváře

Orientační body tváře jsou sadou snadno najítelné body na obličeji, jako jsou žáky nebo špička nosu. Standardně existuje 27 předdefinovaných orientačních bodů. Následující obrázek znázorňuje všech 27 bodů:

A face diagram with all 27 landmarks labeled

Souřadnice bodů se vrátí v jednotkách pixelů.

Model Detection_03 má aktuálně nejpřesnější detekci orientačních bodů. Oční a žákovské orientační body, které vrací, jsou dostatečně přesné, aby bylo možné sledovat pohled na tvář.

Atributy

Upozornění

Společnost Microsoft vyřadila možnosti rozpoznávání obličeje, které se dají použít k odvozování emocionálních stavů a atributů identity, které mohou v případě zneužití podléhat stereotypům, diskriminaci nebo nespravedlivému odepření služeb. Patří mezi ně funkce, které predikují emoce, pohlaví, věk, úsměv, vlasy a make-up. Další informace o tomto rozhodnutí najdete tady.

Atributy jsou sada funkcí, které je možné volitelně zjistit rozhraním API pro rozpoznávání tváře. Lze zjistit následující atributy:

  • Příslušenství. Určuje, zda má daná tvář příslušenství. Tento atribut vrátí možné příslušenství, včetně sluchátek, brýle a masky, s skóre spolehlivosti mezi nulou a jednou pro každý příslušenství.

  • Rozostřit. Rozmazanost tváře na obrázku Tento atribut vrátí hodnotu mezi nulou a jednou a neformálním hodnocením nízké, střední nebo vysoké.

  • Expozice. Expozice obličeje na obrázku. Tento atribut vrátí hodnotu mezi nulou a jednou a neformálním hodnocením underExposure, goodExposure nebo overExposure.

  • Brýle. Jestli má daná tvář brýle. Možné hodnoty jsou NoGlasses, ReadingGlasses, Sunglasses a Swimming Goggles.

  • Pozice hlavy. Orientace tváře v prostorovém prostoru. Tento atribut popisuje roll, yaw a rozteč úhlů ve stupních, které jsou definovány podle pravého pravidla. Pořadí tří úhlů je roll-yaw-pitch a rozsah hodnot každého úhlu je od -180 stupňů do 180 stupňů. 3D orientace tváře se odhaduje podle úhlů hodů, pil a rozteč. Mapování úhlů najdete v následujícím diagramu:

    A head with the pitch, roll, and yaw axes labeled

    Další informace o tom, jak tyto hodnoty používat, najdete v průvodci postupy.

  • Maska. Určuje, jestli má tvář masku. Tento atribut vrátí možný typ masky a logickou hodnotu označující, zda jsou nos a ústa pokryty.

  • Hluk. Vizuální šum zjištěný na obrázku tváře. Tento atribut vrátí hodnotu mezi nulou a jednou a neformálním hodnocením nízké, střední nebo vysoké.

  • Okluze. Určuje, jestli jsou objekty blokující části tváře. Tento atribut vrátí logickou hodnotu pro eyeOccluded, foreheadOccluded a mouthOccluded.

  • QualityForRecognition Celková kvalita obrázku týkající se toho, jestli je obrázek použitý v detekci dostatečně kvalitní k pokusu o rozpoznávání tváře. Hodnota je neformální hodnocení nízké, střední nebo vysoké. Pro scénáře identifikace se doporučují jenom obrázky s vysokou kvalitou a pro scénáře identifikace se doporučuje kvalita na nebo nad "střední".

    Poznámka:

    Dostupnost jednotlivých atributů závisí na zadaném modelu detekce. Atribut QualityForRecognition také závisí na modelu rozpoznávání, protože je aktuálně k dispozici pouze při použití kombinace detection_01 nebo detection_03 modelu detekce a recognition_03 nebo recognition_04 modelu rozpoznávání.

Požadavky na vstup

Pomocí následujících tipů se ujistěte, že vstupní obrázky poskytují nejpřesnější výsledky detekce:

  • Podporované vstupní formáty obrázků jsou JPEG, PNG, GIF (první snímek), BMP.
  • Velikost souboru obrázku by neměla být větší než 6 MB.
  • Minimální zjistitelná velikost tváře je 36 × 36 pixelů na obrázku, který není větší než 1920 × 1080 pixelů. Obrázky s většími než 1920 x 1080 pixely mají proporcionálně větší minimální velikost obličeje. Zmenšení velikosti tváře může způsobit, že se některé tváře nezjistí, i když jsou větší než minimální zjistitelná velikost tváře.
  • Maximální zjistitelná velikost obličeje je 4096 × 4096 pixelů.
  • Tváře mimo rozsah velikosti 36 x 36 až 4096 x 4096 pixelů nebudou rozpoznány.

Vstupní data s informacemi o orientaci:

Některé vstupní obrázky ve formátu JPEG můžou obsahovat informace o orientaci v metadatech exif (Exchangeable image file format). Pokud je k dispozici orientace EXIF, obrázky se před odesláním rozpoznávání tváře automaticky otočí na správnou orientaci. Obdélník tváře, orientační body a pozice hlavy pro každou rozpoznanou tvář se odhadují na základě otočného obrázku.

Pokud chcete správně zobrazit obdélník tváře a orientační body, musíte se ujistit, že je obrázek otočený správně. Většina nástrojů pro vizualizaci obrázků automaticky otočí obrázek podle orientace EXIF ve výchozím nastavení. U jiných nástrojů možná budete muset použít rotaci pomocí vlastního kódu. Následující příklady ukazují obdélník tváře na otočeném obrázku (vlevo) a ne otočený obrázek (vpravo).

Two face images with and without rotation

Vstup videa

Pokud detekujete tváře z videokanáše, možná budete moct zlepšit výkon úpravou určitých nastavení ve videokamerě:

  • Vyhlazování: Mnoho videokamerů používá vyhlazení efektu. Tuto možnost byste měli vypnout, pokud je to možné, protože vytváří rozostření mezi snímky a snižuje přehlednost.

  • Rychlost závěrky: Rychlejší rychlost závěrky snižuje množství pohybu mezi snímky a zpřesní každý snímek. Doporučujeme rychlost závěrky 1/60 sekund nebo rychlejší.

  • Úhel závěrky: Některé kamery místo rychlosti závěrky určují úhel závěrky. Pokud je to možné, měli byste použít nižší úhel závěru. Výsledkem jsou jasnější snímky videa.

    Poznámka:

    Fotoaparát s nižším úhlem závěrky obdrží v každém snímku méně světla, takže obrázek bude tmavší. Budete muset určit správnou úroveň, kterou chcete použít.

Další kroky

Teď, když znáte koncepty detekce tváří, se naučíte psát skript, který rozpoznává tváře na daném obrázku.