Bevezetés

Befejeződött

A számítógépes látás a mesterséges intelligencia (AI) egyik alapvető területe, és olyan megoldások létrehozására összpontosít, amelyek lehetővé teszik az AI-alkalmazások számára a vizuális információk feldolgozását.

Vegye figyelembe az alábbi forgatókönyveket:

  • Egy önvezető járműnek észlelnie kell a forgalmat és a gyalogosokat, és reagálnia kell rájuk.
  • Az áruházak intelligens pénztárokkal és kamerákkal határozzák meg az ügyfél kosarában lévő termékeket.
  • A kapucsengő kamera a bejárati ajtó előtt lévő emberek észlelésére használható.

Ezek a használati esetek és sok más a számítógépes látásra támaszkodnak.

Természetesen a számítógépeknek nincsenek biológiai szemeik, amelyek ugyanúgy működnek, mint a miénk, de képesek képek feldolgozására; vagy élő kamerafelvételről, vagy digitális fényképekről vagy videókról. A képek feldolgozásának képessége kulcsfontosságú az emberi vizuális észlelést emuláló szoftverek létrehozásához. Ebben a modulban a modern számítógépes látási megoldások alapját képező építőelemeket vizsgáljuk meg.

Megjegyzés:

Felismerjük, hogy a különböző emberek különböző módokon szeretnek tanulni. Dönthet úgy, hogy ezt a modult videóalapú formátumban hajtja végre, vagy elolvashatja a tartalmat szövegként és képként. A szöveg részletesebb, mint a videók, ezért bizonyos esetekben érdemes lehet kiegészítő anyagként hivatkozni rá a videóbemutatóhoz.