Resumé
Notat
Se fanen Tekst og billeder for flere detaljer!
Computer vision er bygget på analyse og manipulation af numeriske pixelværdier i billeder. Modeller til maskinel indlæring trænes ved hjælp af en stor mængde billeder for at muliggøre almindelige computervisionsscenarier, f.eks. billedklassificering, objektregistrering, semantisk segmentering, generering af billedtekster og andre.
De modeller, der bruges til computervisionsopgaver, har udviklet sig fra statistikbaserede billedklassificeringer gennem konvolutionelle neurale netværk til nutidens transformatorbaserede multimodale modeller. Banebrydende modeller kan ikke kun fortolke visuelt input, men også generere visuelt output.
Tips
For mere information, se Hvad er Azure Vision?.