Bevezetés
A számítógépes látás a mesterséges intelligencia (AI) egyik alapvető területe, és olyan megoldások létrehozására összpontosít, amelyek lehetővé teszik az AI-alkalmazások számára a vizuális információk feldolgozását.
Vegye figyelembe az alábbi forgatókönyveket:
- Egy önvezető járműnek észlelnie kell a forgalmat és a gyalogosokat, és reagálnia kell rájuk.
- Az áruházak intelligens pénztárokkal és kamerákkal határozzák meg az ügyfél kosarában lévő termékeket.
- A kapucsengő kamera a bejárati ajtó előtt lévő emberek észlelésére használható.
Ezek a használati esetek és sok más a számítógépes látásra támaszkodnak.
Természetesen a számítógépeknek nincsenek biológiai szemeik, amelyek ugyanúgy működnek, mint a miénk, de képesek képek feldolgozására; vagy élő kamerafelvételről, vagy digitális fényképekről vagy videókról. A képek feldolgozásának képessége kulcsfontosságú az emberi vizuális észlelést emuláló szoftverek létrehozásához. Ebben a modulban a modern számítógépes látási megoldások alapját képező építőelemeket vizsgáljuk meg.
Megjegyzés:
Felismerjük, hogy a különböző emberek különböző módokon szeretnek tanulni. Dönthet úgy, hogy ezt a modult videóalapú formátumban hajtja végre, vagy elolvashatja a tartalmat szövegként és képként. A szöveg részletesebb, mint a videók, ezért bizonyos esetekben érdemes lehet kiegészítő anyagként hivatkozni rá a videóbemutatóhoz.