Menganalisis gambar

3 menit

Untuk menganalisis gambar, Anda dapat menggunakan metode REST Analisis Gambar atau metode yang setara dalam SDK untuk bahasa pemrograman pilihan Anda, dengan menentukan fitur visual yang ingin Anda sertakan dalam analisis (dan jika Anda memilih kategori, Anda bebas untuk menyertakan atau tidak menyertakan detail selebriti atau landmark). Metode ini mengembalikan dokumen JSON yang berisi informasi yang diminta.

Catatan

Deteksi selebriti akan mengharuskan disetujui melalui kebijakan Akses Terbatas. Anda dapat membaca selengkapnya tentang tambahan dari kebijakan ini ke standar AI Yang Bertanggung Jawab kami. Pengenalan selebriti terlihat dalam beberapa cuplikan layar, namun tidak termasuk dalam lab.

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });

from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

Fitur visual yang tersedia terkandung dalam VisualFeatures enum:

VisualFeatures.Tags: Mengidentifikasi tag tentang gambar, termasuk objek, pemandangan, pengaturan, dan tindakan
VisualFeatures.Objects: Mengembalikan kotak pembatas untuk setiap objek yang terdeteksi
VisualFeatures.Caption: Menghasilkan keterangan gambar dalam bahasa alami
VisualFeatures.DenseCaptions: Menghasilkan keterangan yang lebih rinci untuk objek yang terdeteksi
VisualFeatures. Orang: Mengembalikan kotak pembatas untuk orang yang terdeteksi
VisualFeatures.SmartCrops: Mengembalikan kotak pembatas dari rasio aspek yang ditentukan untuk area yang diminati
VisualFeatures.Read: Mengekstrak teks yang dapat dibaca

VisualFeatures.TAGS: Mengidentifikasi tag tentang gambar, termasuk objek, pemandangan, pengaturan, dan tindakan
VisualFeatures.OBJECTS: Mengembalikan kotak pembatas untuk setiap objek yang terdeteksi
VisualFeatures.CAPTION: Menghasilkan keterangan gambar dalam bahasa alami
VisualFeatures.DENSE_CAPTIONS: Menghasilkan keterangan yang lebih rinci untuk objek yang terdeteksi
VisualFeatures.PEOPLE: Mengembalikan kotak pembatas untuk orang yang terdeteksi
VisualFeatures.SMART_CROPS: Mengembalikan kotak pembatas dari rasio aspek yang ditentukan untuk area yang diminati
VisualFeatures.READ: Mengekstrak teks yang dapat dibaca

Menentukan fitur visual yang ingin Anda analisis dalam gambar menentukan informasi apa yang akan dimuat respons. Sebagian besar respons akan berisi kotak pembatas (jika lokasi dalam gambar masuk akal) atau skor keyakinan (untuk fitur seperti tag atau keterangan).

Respons JSON untuk analisis gambar terlihat mirip dengan contoh ini, tergantung pada fitur yang Anda minta:

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}

Lanjutkan

Menganalisis gambar

Saran dan Komentar