Arcfelismerés, attribútumok és bemeneti adatok

Figyelem

A Face Service hozzáférése a jogosultsági és használati feltételek alapján korlátozott a felelős AI-alapelvek támogatása érdekében. A Face service csak a Microsoft által felügyelt ügyfelek és partnerek számára érhető el. A Hozzáférés igényléséhez használja a Face Recognition beviteli űrlapot . További információt a Face korlátozott hozzáférésű oldalán talál.

Fontos

Az arcattribútumok előrejelzése statisztikai algoritmusok használatával történik. Lehet, hogy nem mindig pontosak. Körültekintően járjon el, ha attribútumadatokon alapuló döntéseket hoz. Ne használja ezeket az attribútumokat a hamisítás elleni hamisításhoz. Ehelyett a Face Liveness detektálását javasoljuk. További információkért tekintse meg a következő oktatóanyagot: Élőség észlelése az arcokban.

Ez a cikk az arcészlelés és az arcattribútum-adatok fogalmait ismerteti. Az arcészlelés az emberi arcok képben való keresésének és opcionálisan az archoz kapcsolódó különböző adatok visszaadásának folyamata.

A Face – Detect API használatával észlelheti a képeken lévő arcokat. A REST API vagy az ügyféloldali SDK használatának megkezdéséhez kövesse a rövid útmutatót. Részletesebb útmutatót az észlelési API meghívása című témakörben talál.

Arc téglalap

Minden észlelt arc egy mezőnek faceRectangle felel meg a válaszban. Ez az észlelt arc bal oldali, felső, szélességi és magassági képpontkoordinátáinak halmaza. Ezekkel a koordinátákkal lekérheti az arc helyét és méretét. Az API-válaszban az arcok méret szerinti sorrendben jelennek meg a legnagyobbtól a legkisebbig.

A Vision Studio használatával gyorsan és egyszerűen kipróbálhatja az arcfelismerés képességeit.

Arc azonosítója

Az arcazonosító egy egyedi azonosító sztring a kép minden észlelt arcához. A face id csak korlátozott hozzáférésű jóváhagyást igényel, amelyre a beviteli űrlap kitöltésével lehet jelentkezni. További információt a Face korlátozott hozzáférésű oldalán talál. Arcazonosítót kérhet a Face - Detect API-hívásban.

Arcrészek

Az arc tájékozódási pontjai könnyen megtalálható pontok az arcon, például a pupillák vagy az orr csúcsa. Alapértelmezés szerint 27 előre meghatározott arcpont van. Az alábbi ábrán mind a 27 pont látható:

A face diagram with all 27 landmarks labeled

A pontok koordinátáit képpontban adja vissza a rendszer.

A Detection_03 modell jelenleg a legpontosabb tájékozódási pontészleléssel rendelkezik. A szem és a pupilla által visszaadott tájékozódási pontok elég pontosak ahhoz, hogy lehetővé tegyék az arc nyomon követését.

Attribútumok

Figyelem

A Microsoft kivezette az arcfelismerési képességeket, amelyekkel megpróbálhatja kikövetkeztetni az érzelmi állapotokat és identitástulajdonságokat, amelyek visszaélve sztereotípiáknak, hátrányos megkülönböztetésnek vagy a szolgáltatások tisztességtelen megtagadásának tehetik ki az embereket. Ezek közé tartoznak az érzelmeket, a nemet, az életkort, a mosolyt, az arcszőrzetet, a hajat és a sminket előrejelző képességek. Erről a döntésről itt olvashat bővebben.

Az attribútumok olyan funkciók, amelyeket a Face – Detect API opcionálisan észlelhet. A következő attribútumok észlelhetők:

  • Tartozékok. Azt jelzi, hogy az adott arc rendelkezik-e tartozékokkal. Ez az attribútum visszaadja a lehetséges tartozékokat, beleértve a fejruhát, a szemüveget és a maszkot, nulla és egy közötti megbízhatósági pontszámmal minden tartozékhoz.

  • Elmosódott. Az arc elmosódottsága a képen. Ez az attribútum nulla és egy közötti értéket, valamint alacsony, közepes vagy magas informális minősítést ad vissza.

  • Expozíció. Az arc expozíciója a képen. Ez az attribútum nulla és egy közötti értéket ad vissza, valamint az underExposure, goodExposure vagy overExposure nem hivatalos minősítését.

  • Szemüveg. Hogy az adott arcnak van-e szemüvege. Lehetséges értékek: NoGlasses, ReadingGlasses, Sunglasses és Swimming Goggles.

  • Fej póz. Az arc tájolása 3D térben. Ezt az attribútumot a roll, a yaw és a pitch szöge határozza meg fokban, amelyek a jobb oldali szabály szerint vannak meghatározva. A három szög sorrendje roll-yaw-pitch, és minden szög értéktartománya -180 fok és 180 fok között van. Az arc térhatású tájolását a roll, a yaw és a dobási szögek alapján becsüljük meg sorrendben. A szögleképezéseket a következő diagramon tekinti meg:

    A head with the pitch, roll, and yaw axes labeled

    Az értékek használatáról további információt a Fej póz útmutatójában talál.

  • Maszk. Azt jelzi, hogy az arc maszkot visel-e. Ez az attribútum egy lehetséges maszktípust és egy logikai értéket ad vissza, amely jelzi, hogy az orr és a száj lefedve van-e.

  • Zaj. Az arcképen észlelt vizuális zaj. Ez az attribútum nulla és egy közötti értéket, valamint alacsony, közepes vagy magas informális minősítést ad vissza.

  • Elzáródás. Azt jelzi, hogy vannak-e olyan objektumok, amelyek blokkolják az arc részeit. Ez az attribútum logikai értéket ad vissza az eyeOccluded, a foreheadOccluded és a mouthOccluded értékhez.

  • QualityForRecognition A teljes képminőség azt illetően, hogy az észlelés során használt kép megfelelő minőségű-e ahhoz, hogy megkísérelje az arcfelismerést. Az érték alacsony, közepes vagy magas nem hivatalos minősítés. Személyregisztrációhoz csak "magas" minőségű képek használata ajánlott, azonosítási forgatókönyvek esetén pedig a "közepes" vagy annál magasabb minőségű képek használata javasolt.

    Feljegyzés

    Az egyes attribútumok elérhetősége a megadott észlelési modelltől függ. A QualityForRecognition attribútum a felismerési modelltől is függ, mivel jelenleg csak az észlelési modell detection_01 vagy detection_03, valamint a felismerési modell recognition_03 vagy recognition_04 használatakor érhető el.

Bemeneti követelmények

Az alábbi tippek segítségével győződjön meg arról, hogy a bemeneti képek a legpontosabb észlelési eredményeket adják:

  • A támogatott bemeneti képformátumok: JPEG, PNG, GIF (az első képkocka), BMP.
  • A képfájl mérete nem lehet nagyobb 6 MB-nál.
  • A minimálisan észlelhető arcméret 36 x 36 képpont egy olyan képen, amely nem nagyobb, mint 1920 x 1080 képpont. Az 1920 x 1080 képpontnál nagyobb méretű képek arányosan nagyobb minimális arcmérettel rendelkeznek. Az arcméret csökkentése esetén előfordulhat, hogy egyes arcok nem észlelhetők, még akkor sem, ha nagyobbak, mint a minimálisan észlelhető arcméret.
  • A maximális észlelhető arcméret 4096 x 4096 képpont.
  • A 36 x 36 és 4096 x 4096 képpont közötti mérettartományon kívüli arcok nem észlelhetők.

Bemeneti adatok tájolási információkkal:

Egyes JPEG formátumú bemeneti képek tartalmazhatnak tájolási információkat exchangeable image file format (EXIF) metaadatokban. Ha az EXIF-tájolás elérhető, a rendszer automatikusan a megfelelő tájolásra elforgatja a képeket, mielőtt arcfelismerésre küldené. Az arc téglalapja, a tájékozódási pontok és a fej póza az egyes észlelt arcokhoz az elforgatott kép alapján van megbecsülve.

Az arc téglalapjának és tájékozódási pontjának megfelelő megjelenítéséhez meg kell győződnie arról, hogy a kép megfelelően van elforgatva. A képvizualizációs eszközök többsége alapértelmezés szerint automatikusan elforgatja a képet az EXIF tájolásának megfelelően. Más eszközök esetében előfordulhat, hogy a rotációt saját kóddal kell alkalmaznia. Az alábbi példák egy elforgatott képen (balra) és egy nem elforgatott képen (jobbra) lévő arc téglalapot mutatnak.

Two face images with and without rotation

Videobemenet

Ha arcokat észlel egy videocsatornából, a videokamera bizonyos beállításainak módosításával javíthatja a teljesítményt:

  • Simítás: Sok videokamera alkalmaz simító hatást. Ezt ki kell kapcsolnia, ha lehetséges, mert elmosódást hoz létre a keretek között, és csökkenti az egyértelműséget.

  • Zársebesség: A gyorsabb zársebesség csökkenti a keretek közötti mozgás mennyiségét, és egyértelműbbé teszi az egyes kereteket. 1/60 másodperces vagy gyorsabb záridőt javasoljuk.

  • Zár szöge: Egyes kamerák a zársebesség helyett zár szöget határoznak meg. Ha lehetséges, alacsonyabb zárszöget kell használnia. Ez tisztább videókereteket eredményez.

    Feljegyzés

    Az alacsonyabb zárszögű fényképezőgépek kevesebb fényt kapnak minden egyes keretben, így a kép sötétebb lesz. Meg kell határoznia a megfelelő szintet.

Következő lépések

Most, hogy már ismeri az arcészlelési fogalmakat, megtudhatja, hogyan írhat olyan szkriptet, amely észleli az arcokat egy adott képen.