Mi az Az Azure AI Vision?

Cikk
04/30/2024

Feljegyzés

2023 júliusától az Azure AI-szolgáltatások a korábban Cognitive Servicesnek és Azure-alkalmazás lied AI-szolgáltatásoknak nevezett összes szolgáltatást magukban foglalják. A díjszabás nem változik. A Cognitive Services és a Azure-alkalmazás lied AI neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistában és az ár API-kban. Az alkalmazásprogramozási felületek (API-k) és az SDK-k nem változnak kompatibilitástörően.

Az Azure Azure AI Vision szolgáltatása olyan fejlett algoritmusokhoz biztosít hozzáférést, amelyek képeket dolgoznak fel, és információkat adnak vissza az Önt érdeklő vizuális funkciók alapján.

Szolgáltatás	Leírás
Optikai karakterfelismerés (OCR)	Az Optikai karakterfelismerés (OCR) szolgáltatás képekből nyer ki szöveget. Az új Read API-val kinyomtatott és kézzel írt szöveget nyerhet ki fényképekből és dokumentumokból. Mélytanuláson alapuló modelleket használ, és különböző felületeken és háttereken lévő szöveggel dolgozik. Ezek közé tartoznak az üzleti dokumentumok, számlák, nyugták, plakátok, névjegykártyák, levelek és rajztáblák. Az OCR API-k számos nyelven támogatják a nyomtatott szövegek kinyerését. Az első lépésekhez kövesse az OCR rövid útmutatót .
Képelemzés	A Képelemzés szolgáltatás számos vizuális funkciót nyer ki képekből, például objektumokból, arcokból, felnőtt tartalmakból és automatikusan létrehozott szöveges leírásokból. Az első lépésekhez kövesse a Képelemzés rövid útmutatót .
Face	A Face szolgáltatás olyan AI-algoritmusokat biztosít, amelyek emberi arcokat észlelnek, ismernek fel és elemeznek képeken. Az arcfelismerő szoftver számos különböző helyzetben fontos, például az azonosítás, az érintés nélküli hozzáférés-vezérlés és az arc elmosódása az adatvédelem érdekében. Az első lépésekhez kövesse a Face rövid útmutatót .
Videóelemzés	A videóelemzés olyan videóval kapcsolatos funkciókat tartalmaz, mint a térbeli elemzés és a videólekérés. A térinformatikai elemzés elemzi az emberek jelenlétét és mozgását egy videócsatornán, és olyan eseményeket hoz létre, amelyekre más rendszerek képesek reagálni. Az első lépésekhez telepítse a térinformatikai tárolót . A Video Retrieveal lehetővé teszi a természetes nyelven kereshető videók indexének létrehozását.

Azure AI Vision digitális eszközkezeléshez

Az Azure AI Vision számos digitális eszközkezelési (DAM) forgatókönyvet képes működtetni. A DAM a gazdag médiaeszközök rendszerezésének, tárolásának és lekérésének, valamint a digitális jogok és engedélyek kezelésének üzleti folyamata. Előfordulhat például, hogy egy vállalat látható emblémák, arcok, objektumok, színek stb. alapján szeretné csoportosítani és azonosítani a képeket. Vagy előfordulhat, hogy automatikusan szeretne képaláírás létrehozni a képekhez, és kulcsszavakat csatolni, hogy azok kereshetők legyenek. Az Azure AI-szolgáltatásokat, az Azure AI Search-t és az intelligens jelentéskészítést használó, minden egyhez készült DAM-megoldásért tekintse meg a Tudásbányászati megoldásgyorsító útmutatót a GitHubon. További DAM-példákért tekintse meg az Azure AI Vision Megoldássablonok adattárát.

Első lépések

A Vision Studióval gyorsan kipróbálhatja az Azure AI Vision funkcióit a webböngészőben.

Az Azure AI Vision alkalmazásba való létrehozásának megkezdéséhez kövesse a rövid útmutatót.

Képpel kapcsolatos követelmények

Az Azure AI Vision az alábbi követelményeknek megfelelő képeket elemezheti:

A képnek JPEG, PNG, GIF vagy BMP formátumúnak kell lennie
A fájlméret nem érheti el a 4 megabájtot (MB)
A kép méretének 50 x 50 képpontnál nagyobbnak kell lennie
- A Read API esetében a kép méretének 50 x 50 és 10 000 x 10 000 képpont között kell lennie.

Adatvédelem és biztonság

Az Azure AI-szolgáltatásokhoz hasonlóan az Azure AI Vision szolgáltatást használó fejlesztőknek is tisztában kell lenniük a Microsoft ügyféladatokra vonatkozó szabályzataival. További információért tekintse meg az Azure AI-szolgáltatások oldalát a Microsoft Adatvédelmi központban.

Következő lépések

Rövid útmutatót követve implementálhat és futtathat egy szolgáltatást az előnyben részesített fejlesztési nyelven.

Megosztás a következőn keresztül: