Mi az Az Azure AI Vision?
Az Azure AI Vision szolgáltatás olyan fejlett algoritmusokhoz biztosít hozzáférést, amelyek képeket dolgoznak fel, és információkat adnak vissza az Önt érdeklő vizuális funkciók alapján. Az alábbi táblázat a főbb termékkategóriákat sorolja fel.
Szolgáltatás | Leírás |
---|---|
Optikai karakterfelismerés (OCR) | Az Optikai karakterfelismerés (OCR) szolgáltatás képekből nyer ki szöveget. A Read API használatával kinyomtatott és kézzel írt szöveget nyerhet ki fényképekből és dokumentumokból. Mélytanuláson alapuló modelleket használ, és különböző felületeken és háttereken lévő szöveggel dolgozik. Ezek közé tartoznak az üzleti dokumentumok, számlák, nyugták, plakátok, névjegykártyák, levelek és rajztáblák. Az OCR API-k számos nyelven támogatják a nyomtatott szövegek kinyerését. Az első lépésekhez kövesse az OCR rövid útmutatót . |
Képelemzés | A Képelemzés szolgáltatás számos vizuális funkciót nyer ki képekből, például objektumokból, arcokból, felnőtt tartalmakból és automatikusan létrehozott szöveges leírásokból. Az első lépésekhez kövesse a Képelemzés rövid útmutatót . |
Face | A Face szolgáltatás olyan AI-algoritmusokat biztosít, amelyek emberi arcokat észlelnek, ismernek fel és elemeznek képeken. Az arcfelismerő szoftver számos különböző helyzetben fontos, ilyenek például az azonosítás, az érintés nélküli hozzáférés-vezérlés és az arc elmosódása az adatvédelem érdekében. Az első lépésekhez kövesse a Face rövid útmutatót . |
Videóelemzés | A videóelemzés olyan videóval kapcsolatos funkciókat tartalmaz, mint a térbeli elemzés és a videólekérés. A térinformatikai elemzés elemzi az emberek jelenlétét és mozgását egy videócsatornán, és olyan eseményeket hoz létre, amelyekre más rendszerek képesek reagálni. Az első lépésekhez telepítse a térinformatikai tárolót . A Video Retrieveal lehetővé teszi a természetes nyelven kereshető videók indexének létrehozását. |
Azure AI Vision digitális eszközkezeléshez
Az Azure AI Vision számos digitális eszközkezelési (DAM) forgatókönyvet képes működtetni. A DAM a gazdag médiaeszközök rendszerezésének, tárolásának és lekérésének, valamint a digitális jogok és engedélyek kezelésének üzleti folyamata. Előfordulhat például, hogy egy vállalat látható emblémák, arcok, objektumok, színek stb. alapján szeretné csoportosítani és azonosítani a képeket. Vagy érdemes lehet automatikusan feliratokat létrehozni a képekhez , és kulcsszavakat csatolni, hogy azok kereshetők legyenek. Az Azure AI-szolgáltatásokat, az Azure AI Search-t és az intelligens jelentéskészítést használó, minden egyhez készült DAM-megoldásért tekintse meg a Tudásbányászati megoldásgyorsító útmutatót a GitHubon. További DAM-példákért tekintse meg az Azure AI Vision Megoldássablonok adattárát.
Első lépések
A Vision Studióval gyorsan kipróbálhatja az Azure AI Vision funkcióit a webböngészőben.
Az Azure AI Vision alkalmazásba való létrehozásának megkezdéséhez kövesse a rövid útmutatót.
- Rövid útmutató: Optikai karakterfelismerés (OCR)
- Rövid útmutató: Képelemzés
- Rövid útmutató: Azure Face
- Rövid útmutató: Térbeli elemzési tároló
Képpel kapcsolatos követelmények
Az Azure AI Vision az alábbi követelményeknek megfelelő képeket elemezheti:
- A képnek JPEG, PNG, GIF vagy BMP formátumúnak kell lennie
- A fájlméret nem érheti el a 4 megabájtot (MB)
- A kép méretének 50 x 50 képpontnál nagyobbnak kell lennie
- A Read API esetében a kép méretének 50 x 50 és 10 000 x 10 000 képpont között kell lennie.
Adatvédelem és biztonság
Az Azure AI-szolgáltatásokhoz hasonlóan az Azure AI Vision szolgáltatást használó fejlesztőknek is tisztában kell lenniük a Microsoft ügyféladatokra vonatkozó szabályzataival. További információért tekintse meg az Azure AI-szolgáltatások oldalát a Microsoft Adatvédelmi központban.
Következő lépések
Rövid útmutatót követve implementálhat és futtathat egy szolgáltatást az előnyben részesített fejlesztési nyelven.