تحليل صورة

3 دقائق

لتحليل صورة، يمكنك استخدام تحليل صورة أسلوب REST أو الطريقة المكافئة في SDK للغة البرمجة المفضلة لديك، تحديد المعالم المرئية التي تريد تضمينها في التحليل (وإذا قمت بتحديد فئات، سواء كان سيتم تضمين تفاصيل المشاهير أو المعالم أم لا). هذا الأسلوب يقوم بإرجاع مستند JSON محتوياً على المعلومات المطلوبة.

إشعار

سيتطلب الكشف عن المشاهير الحصول على الموافقة من خلال Limited Access policy. يمكنك قراءة المزيد عن إضافة هذا النهج إلى معيار الذكاء الاصطناعي المسؤول لدينا. يظهر التعرف على المشاهير في بعض لقطات الشاشة، ومع ذلك لا يتم تضمينه في التمرين المعملي.

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });

from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

يتم تضمين الميزات المرئية المتوفرة VisualFeatures في قائمة التعداد:

VisualFeatures.Tags: يحدد العلامات حول الصورة، بما في ذلك العناصر والمناظر الطبيعية والإعدادات والإجراءات
VisualFeatures.Objects: إرجاع المربع المحيط لكل كائن تم اكتشافه
VisualFeatures.Caption: ينشئ تسمية توضيحية للصورة بلغة طبيعية
VisualFeatures.DenseCaptions: ينشئ تسميات توضيحية أكثر تفصيلا للكائنات التي تم اكتشافها
VisualFeatures. الأشخاص: إرجاع المربع المحيط للأشخاص المكتشفين
VisualFeatures.SmartCrops: إرجاع المربع المحيط لنسبة العرض إلى الارتفاع المحددة لمساحة الاهتمام
VisualFeatures.Read: استخراج نص قابل للقراءة

VisualFeatures.TAGS: يحدد العلامات حول الصورة، بما في ذلك العناصر والمناظر الطبيعية والإعدادات والإجراءات
VisualFeatures.OBJECTS: إرجاع المربع المحيط لكل كائن تم اكتشافه
VisualFeatures.CAPTION: ينشئ تسمية توضيحية للصورة باللغة الطبيعية
VisualFeatures.DENSE_CAPTIONS: إنشاء تسميات توضيحية أكثر تفصيلا للكائنات التي تم اكتشافها
VisualFeatures.PEOPLE: إرجاع المربع المحيط للأشخاص المكتشفين
VisualFeatures.SMART_CROPS: إرجاع المربع المحيط لنسبة العرض إلى الارتفاع المحددة لمجال الاهتمام
VisualFeatures.READ: استخراج نص قابل للقراءة

تحديد الميزات المرئية التي تريد تحليلها في الصورة يحدد المعلومات التي ستحتوي عليها الاستجابة. ستحتوي معظم الاستجابات على مربع إحاطة (إذا كان الموقع في الصورة معقولا) أو درجة ثقة (لميزات مثل العلامات أو التسميات التوضيحية).

تبدو استجابة JSON لتحليل الصور مشابهة لهذا المثال، اعتمادا على الميزات المطلوبة:

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}

متابعة

الملاحظات