Dela via


Typer av API-tjänster för visuellt innehåll

Azure Cognitive Service for Vision är en av de bredaste kategorierna i Cognitive Services. Du kan använda API:erna för att införliva visionsfunktioner som bildanalys, ansiktsigenkänning, rumslig analys och optisk teckenigenkänning (OCR) i dina program, även om du har begränsad kunskap om maskininlärning.

Tjänster

Här är några breda kategorier av visions-API:er:

  • Visuellt innehåll tillhandahåller avancerade algoritmer som bearbetar bilder och returnerar information baserat på de visuella funktioner som du är intresserad av. Den tillhandahåller fyra tjänster: OCR, ansiktstjänst, bildanalys och rumslig analys. Formigenkänning är en avancerad version av OCR.
  • Custom Vision är en tjänst för bildigenkänning som du kan använda för att skapa, distribuera och förbättra dina egna bildidentifierarmodeller.
  • Ansiktstjänsten tillhandahåller AI-algoritmer som identifierar, känner igen och analyserar mänskliga ansikten i bilder.

Så väljer du tjänst

Följande flödesdiagram kan hjälpa dig att välja en visionstjänst för ditt specifika användningsfall:

Diagram that shows how to choose a vision service.

Vanliga användningsfall

  • Visuellt innehåll

    • Beskriv en bild. Analysera en bild, utvärdera de objekt som identifieras och generera en mänsklig läsbar fras eller mening som beskriver bilden.
    • Tagga visuella funktioner. Använd taggar som baseras på en uppsättning med tusentals igenkännliga objekt.
    • kategorisera bilder Kategorisera bilder baserat på deras innehåll.
    • Implementera OCR. Identifiera tryckt och handskriven text i bilder.
    • Identifiera bildtyper. Du kan till exempel identifiera ClipArt-bilder eller linjeritningar.
    • Identifiera färgscheman. Identifiera de dominerande förgrunds-, bakgrunds- och dekorfärgerna och dekorfärgerna i en bild.
    • Generera miniatyrbilder. Skapa små versioner av avbildningar.
    • Måttligt innehåll. Identifiera bilder som innehåller vuxet innehåll eller avbilda blodiga scener.
    • Identifiera domänspecifikt innehåll. Använd två specialiserade domänmodeller:
      • Kändisar. Identifiera tusentals välkända kändisar från sport-, underhållnings- och affärsdomäner.
      • Landmärken. Identifiera kända landmärken, som Taj Mahal och Frihetsgudinnan.
    • Identifiera objekt. Identifiera vanliga objekt och returnera koordinaterna för en avgränsningsruta.
    • Identifiera varumärken. Identifiera logotyper från en befintlig databas med tusentals globalt identifierade produktlogotyper.
    • Identifiera ansikten. Identifiera och analysera mänskliga ansikten i en bild. Du kan fastställa ämnets ålder och returnera en avgränsningsruta som anger platserna för ansikten. Funktionerna för ansiktsanalys i Visuellt innehåll-tjänsten är en delmängd av de som tillhandahålls av den dedikerade ansiktstjänsten.
  • Custom Vision

    • Klassificera bilder. Förutsäga en kategori, eller klass, baserat på en uppsättning indata, som kallas funktioner. Beräkna en sannolikhetspoäng för varje möjlig klass och returnera en etikett som anger vilken klass objektet troligen tillhör. För att använda den här modellen behöver du data som består av funktioner och deras etiketter.
    • Identifiera objekt. Hämta koordinaterna för ett objekt i en bild. För att använda den här modellen behöver du data som består av funktioner och deras etiketter.
  • Ansiktstjänster

    • Identifiera ansikten. Identifiera regionerna i en bild som innehåller ett mänskligt ansikte, vanligtvis genom att returnera koordinater för avgränsningsrutor som bildar en rektangel runt ansiktet.
    • Analysera ansikten. Returnera information, till exempel ansiktsmärken (näsa, ögon, ögonbryn, läppar med mera). Du kan använda dessa ansiktslandmärken som funktioner för att träna en maskininlärningsmodell som kan härleda information om människor, till exempel deras upplevda ålder eller känslomässiga tillstånd.
    • Identifiera ansikten. Träna en maskininlärningsmodell för att identifiera kända personer från deras ansiktsdrag.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudsakliga författare:

Övriga medarbetare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg