Wat is afbeeldingsanalyse?
De service Afbeeldingsanalyse in Computer Vision kan een groot aantal visuele functies extraheren uit uw afbeeldingen. Het kan bijvoorbeeld bepalen of een afbeelding inhoud voor volwassenen bevat, specifieke merken of objecten zoeken of menselijke gezichten vinden.
De nieuwste versie van Afbeeldingsanalyse, 4.0, die nu in openbare preview is, heeft nieuwe functies, zoals synchrone OCR en personendetectie. We raden u aan deze versie in de toekomst te gebruiken.
U kunt Afbeeldingsanalyse gebruiken via een clientbibliotheek-SDK of door de REST API rechtstreeks aan te roepen. Volg de quickstart om aan de slag te gaan.
Of u kunt de mogelijkheden van Afbeeldingsanalyse snel en eenvoudig uitproberen in uw browser met behulp van Vision Studio.
Deze documentatie bevat de volgende typen artikelen:
- De quickstarts zijn stapsgewijze instructies waarmee u de service kunt aanroepen en in korte tijd resultaten kunt krijgen.
- De handleidingen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
- De conceptuele artikelen bieden uitgebreide uitleg over de functionaliteit en functies van de service.
- De zelfstudies zijn langere handleidingen die u laten zien hoe u deze service kunt gebruiken als onderdeel van bredere bedrijfsoplossingen.
Voor een meer gestructureerde aanpak volgt u een trainingsmodule voor afbeeldingsanalyse.
Versies van afbeeldingsanalyse
Belangrijk
Selecteer de versie van de Image Analysis-API die het beste bij uw vereisten past.
Versie | Beschikbare functies | Aanbeveling |
---|---|---|
versie 4.0 | Tekst lezen, Bijschriften, Compacte bijschriften, Tags, Objectdetectie, Aangepaste afbeeldingsclassificatie/objectdetectie, Mensen, Slim bijsnijden | Betere modellen; gebruik versie 4.0 als deze uw use-case ondersteunt. |
versie 3.2 | Tags, Objecten, Beschrijvingen, Merken, Gezichten, Afbeeldingstype, Kleurenschema, Oriëntatiepunten, Beroemdheden, Inhoud voor volwassenen, Slim bijsnijden | Breder scala aan functies; versie 3.2 gebruiken als uw use-case nog niet wordt ondersteund in versie 4.0 |
U wordt aangeraden de Image Analysis 4.0-API te gebruiken als deze ondersteuning biedt voor uw use-case. Gebruik versie 3.2 als uw use-case nog niet wordt ondersteund door 4.0.
U moet ook versie 3.2 gebruiken als u ondertiteling van afbeeldingen wilt uitvoeren en uw Azure Computer Vision-resource zich buiten deze Azure-regio's bevindt: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west en VS - west. De functie bijschriften van afbeeldingen in Afbeeldingsanalyse 4.0 wordt alleen ondersteund in deze Azure-regio's. Bijschriften van afbeeldingen in versie 3.2 zijn beschikbaar in alle Computer Vision regio's.
Analyze Image
U kunt afbeeldingen analyseren om inzicht te krijgen in de visuele kenmerken en eigenschappen van die afbeeldingen. Alle functies in de onderstaande lijst worden geleverd door de Analyze Image-API. Volg een snelstart om aan de slag te gaan.
Naam | Beschrijving | Conceptpagina |
---|---|---|
Modelaanpassing (alleen v4.0 preview) | U kunt aangepaste modellen maken en trainen om afbeeldingsclassificatie of objectdetectie uit te voeren. Gebruik uw eigen afbeeldingen, label ze met aangepaste tags. Met Afbeeldingsanalyse wordt een model getraind dat is aangepast aan uw use-case. | Modelaanpassing |
Tekst lezen uit afbeeldingen (alleen voorbeeld v4.0) | Versie 4.0 preview van Afbeeldingsanalyse biedt de mogelijkheid om leesbare tekst uit afbeeldingen te extraheren. Vergeleken met de asynchrone Computer Vision 3.2 Read-API biedt de nieuwe versie de vertrouwde READ OCR-engine in een geïntegreerde, verbeterde synchrone API die het gemakkelijk maakt om OCR samen met andere inzichten in één API-aanroep te krijgen. | OCR voor afbeeldingen |
Personen detecteren in afbeeldingen (alleen voorbeeld v4.0) | Versie 4.0 van Afbeeldingsanalyse biedt de mogelijkheid om personen te detecteren die in afbeeldingen worden weergegeven. De coördinaten van het begrenzingsvak van elke gedetecteerde persoon worden geretourneerd, samen met een betrouwbaarheidsscore. | Persoonsherkenning |
Bijschriften voor afbeeldingen genereren | Genereer een onderschrift van een afbeelding in door mensen leesbare taal, met behulp van volledige zinnen. de algoritmen van Computer Vision genereren bijschriften op basis van de objecten die in de afbeelding zijn geïdentificeerd. Het bijschriftmodel voor afbeeldingen van versie 4.0 is een geavanceerdere implementatie en werkt met een breder scala aan invoerafbeeldingen. Het is alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west. Met versie 4.0 kunt u ook compacte ondertiteling gebruiken, waarmee gedetailleerde bijschriften worden gegenereerd voor afzonderlijke objecten die in de afbeelding worden gevonden. De API retourneert de coördinaten van het begrenzingsvak (in pixels) van elk object in de afbeelding, plus een onderschrift. U kunt deze functionaliteit gebruiken om beschrijvingen van afzonderlijke delen van een installatiekopie te genereren. ![]() |
Bijschriften voor afbeeldingen genereren (v3.2) (v4.0 preview) |
Objecten detecteren | Objectdetectie is vergelijkbaar met het gebruik van tags, maar de API retourneert de coördinaten van de omsluitende box voor elke tag die wordt toegepast. Als een afbeelding bijvoorbeeld een hond, kat en persoon bevat, zal de detectiebewerking deze objecten vermelden, samen met hun coördinaten in de afbeelding. U kunt deze functie gebruiken om verdere relaties tussen de objecten in een afbeelding te verwerken. Ook weet u daardoor wanneer er meerdere exemplaren van dezelfde tag in een afbeelding voorkomen. ![]() |
Objecten detecteren (v3.2) (v4.0 preview) |
Visuele kenmerken taggen | Identificeer en tag visuele kenmerken in een afbeelding op basis van een set met duizenden herkenbare objecten, levende wezens, landschappen en acties. Als de tags dubbelzinnig of niet algemeen bekend zijn, worden via de API-reactie tips gegeven om de context van de tag te verduidelijken. U kunt tagging niet alleen gebruiken voor het hoofdonderwerp, zoals een persoon op de voorgrond, maar ook voor de omgeving (binnen of buiten), meubels, gereedschap, planten, dieren, accessoires, gadgets en enzovoort.![]() |
Visuele functies taggen (v3.2) (v4.0 preview) |
Het interessegebied/slimme oogst ophalen | Analyseer de inhoud van een afbeelding om de coördinaten te retourneren van het interessegebied dat overeenkomt met een opgegeven hoogte-breedteverhouding. Computer Vision retourneert de coördinaten van het begrenzingsvak van de regio, zodat de aanroepende toepassing de oorspronkelijke afbeelding naar wens kan wijzigen. Het model voor slim bijsnijden van versie 4.0 is een geavanceerdere implementatie en werkt met een breder scala aan invoerafbeeldingen. Het is alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west. |
Een miniatuur genereren (v3.2) (v4.0 preview) |
Merken detecteren (alleen v3.2) | Identificeer commerciële merken in afbeeldingen of video's met behulp van een database met duizenden logo's. U kunt deze functie bijvoorbeeld gebruiken om te ontdekken welke merken het populairst zijn op sociale media of het meest voorkomen in productplaatsing in de media. | Merken detecteren |
Een afbeelding categoriseren (alleen v3.2) | Identificeer en categoriseer een volledige afbeelding met behulp van een categorietaxonomie met bovenliggende/onderliggende erfelijke hiërarchieën. Categorieën kunnen zelfstandig worden gebruikt of met onze nieuwe tagmodellen. Engels is momenteel de enige ondersteunde taal voor het taggen en categoriseren van afbeeldingen. |
Een afbeelding categoriseren |
Gezichten detecteren (alleen v3.2) | Detecteer gezichten in een afbeelding en geef informatie op over elk gedetecteerd gezicht. Met Computer Vision worden de coördinaten, de rechthoek, het geslacht en de leeftijd van elk gedetecteerd gezicht geretourneerd. U kunt voor deze doeleinden ook de toegewezen Face-API gebruiken. Het biedt gedetailleerdere analyses, zoals gezichtsidentificatie en houdingsdetectie. |
Gezichten detecteren |
Afbeeldingstypen detecteren (alleen v3.2) | Detecteer kenmerken van een afbeelding, bijvoorbeeld of een afbeelding een lijntekening of een illustratie is. | Afbeeldingstypen detecteren |
Domeinspecifieke inhoud detecteren (alleen v3.2) | Gebruik domeinmodellen om domeinspecifieke inhoud in een afbeelding te detecteren en te identificeren, zoals beroemdheden en oriëntatiepunten. Als een afbeelding bijvoorbeeld mensen bevat, kan Computer Vision een domeinmodel gebruiken voor beroemdheden om te bepalen of de personen die in de afbeelding worden gedetecteerd, overeenkomen met bekende beroemdheden. | Domeinspecifieke inhoud detecteren |
Het kleurenschema detecteren (alleen v3.2) | Analyseer het kleurgebruik in een afbeelding. Computer Vision kunt bepalen of een afbeelding zwart & wit of van kleur is en voor kleurafbeeldingen de dominante en accentkleuren identificeren. | Het kleurenschema detecteren |
Inhoud in afbeeldingen beheren (alleen v3.2) | U kunt Computer Vision gebruiken om erotische inhoud te detecteren in een afbeelding en vertrouwensscores voor verschillende classificaties te retourneren. De drempel voor het markeren van inhoud kan worden ingesteld met een glijdende schaal om uw voorkeuren aan te geven. | Inhoud voor volwassenen detecteren |
Productherkenning (alleen v4.0 preview)
Met de Product Recognition-API's kunt u foto's van schappen in een winkel analyseren. U kunt de aanwezigheid of afwezigheid van producten detecteren en de coördinaten van het begrenzingsvak ophalen. Gebruik het in combinatie met modelaanpassing om een model te trainen om uw specifieke producten te identificeren. U kunt de resultaten van productherkenning ook vergelijken met het planogram van uw winkel.
Installatiekopie ophalen (alleen v4.0 preview)
Met de API's voor het ophalen van afbeeldingen kunt u afbeeldingen en tekstquery's vectoriseren . Ze converteren afbeeldingen naar coördinaten in een multidimensionale vectorruimte. Vervolgens kunnen binnenkomende tekstquery's ook worden geconverteerd naar vectoren en kunnen afbeeldingen worden vergeleken met de tekst op basis van semantische nabijheid. Hierdoor kan de gebruiker een set afbeeldingen doorzoeken met behulp van tekst, zonder dat ze afbeeldingstags of andere metagegevens hoeven te gebruiken. Semantische nabijheid levert vaak betere resultaten op in zoekopdrachten.
Deze API's zijn alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west.
Achtergrond verwijderen (alleen v4.0 preview)
Image Analysis 4.0 (preview) biedt de mogelijkheid om de achtergrond van een afbeelding te verwijderen. Deze functie kan een afbeelding uitvoeren van het gedetecteerde voorgrondobject met een transparante achtergrond of een grijswaarden alfamatafbeelding met de dekking van het gedetecteerde voorgrondobject. Achtergrond verwijderen
Oorspronkelijke afbeelding | Achtergrond verwijderd | Alfa mat |
---|
![]() |
![]() |
![]() |
Vereisten voor installatiekopieën
Afbeeldingsanalyse werkt voor afbeeldingen die voldoen aan de volgende vereisten:
- De afbeelding moet worden weergegeven in de indeling JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF of MPO
- De bestandsgrootte van de installatiekopieën moet kleiner zijn dan 20 MEGAbytes (MB)
- De afmetingen van de afbeelding moeten groter zijn dan 50 x 50 pixels, en kleiner dan 16.000 x 16.000 pixels
Gegevensprivacy en -beveiliging
Zoals geldt voor alle Cognitive Services, dienen ontwikkelaars die de Computer Vision-service gebruiken op de hoogte te zijn van het beleid van Microsoft inzake klantgegevens. Zie de pagina Cognitive Services (Engelstalig) in het Microsoft Trust Center voor meer informatie.
Volgende stappen
Ga aan de slag met Afbeeldingsanalyse door de snelstartgids te volgen in de ontwikkeltaal van uw voorkeur: