Összefoglalás

Befejeződött

Megjegyzés:

További részletekért tekintse meg a Szöveg és képek lapot!

A számítógépes látás a képek numerikus képpontértékeinek elemzésére és kezelésére épül. A gépi tanulási modelleket nagy mennyiségű képpel tanítják be, hogy lehetővé tegyék a számítógépes látás gyakori forgatókönyveit, például a képbesorolást, az objektumészlelést, a szemantikai szegmentálást, a feliratgenerálást és egyebeket.

A számítógépes látási feladatokhoz használt modellek a statisztikaalapú képosztályozóktól a konvolúciós neurális hálózatokon át a mai transzformátoralapú multimodális modellekig fejlődött. Az élvonalbeli modellek nem csak a vizuális bemenetet képesek értelmezni, hanem vizuális kimenetet is generálnak.

Jótanács

További információ: Mi az Azure Vision?