ما هو تحليل الصور؟

2025-04-17

يمكن لخدمة Azure الذكاء الاصطناعي Vision Image Analysis استخراج مجموعة واسعة من الميزات المرئية من صورك. على سبيل المثال، يمكنه تحديد ما إذا كانت الصورة تحتوي على محتوى للبالغين، أو العثور على علامات تجارية أو عناصر معينة، أو العثور على وجوه بشرية.

يحتوي الإصدار الأخير من Image Analysis، 4.0، والذي يتوفر الآن بشكل عام، على ميزات جديدة مثل التعرف البصري على الحروف المتزامنة والكشف عن الأشخاص. نوصي باستخدام هذا الإصدار من الآن فصاعدا.

يمكنك استخدام تحليل الصور من خلال مكتبة عميل SDK أو عن طريق استدعاء واجهة برمجة تطبيقات REST مباشرة. اتبع التشغيل السريع للبدء.

التشغيل السريع

أو يمكنك تجربة قدرات تحليل الصور بسرعة وسهولة في متصفحك باستخدام Vision Studio.

جرب Vision Studio

تحتوي هذه الوثائق على أنواع المقالات التالية:

يُعد برنامج quickstarts بمثابة إرشادات خطوة بخطوة تسمح لك بإجراء مكالمات مع الخدمة والحصول على النتائج في فترة زمنية قصيرة.
تحتوي أدلة الاستخدامعلى إرشادات لاستخدام الخدمة بطرق أكثر تحديداً أو تخصيصاً.
توفر المقالات المفاهيمية تفسيرات متعمقة لوظائف الخدمة وميزاتها.

للحصول على نهج أكثر تنظيما، اتبع وحدة تدريب لتحليل الصور.

تحليل الصور باستخدام خدمة Azure الذكاء الاصطناعي Vision

إصدارات تحليل الصور

مهم

حدد إصدار واجهة برمجة تطبيقات تحليل الصور الذي يناسب متطلباتك على أفضل نحو.

الإصدار	الميزات المتوفرة	التوصيه
الإصدار 4.0	قراءة النص، التسميات التوضيحية، التسميات التوضيحية الكثيفة، العلامات، الكشف عن الكائنات، الأشخاص، الاقتصاص الذكي	نماذج أفضل؛ استخدم الإصدار 4.0 إذا كان يدعم حالة الاستخدام الخاصة بك.
الإصدار 3.2	العلامات والكائنات والأوصاف والعلامات التجارية والوجوه ونوع الصورة ونظام الألوان والمعالم والمشاهير ومحتوى البالغين والقص الذكي	نطاق أوسع من الميزات؛ استخدام الإصدار 3.2 إذا كانت حالة الاستخدام غير مدعومة بعد في الإصدار 4.0

نوصي باستخدام واجهة برمجة تطبيقات تحليل الصور 4.0 إذا كانت تدعم حالة الاستخدام الخاصة بك. استخدم الإصدار 3.2 إذا كانت حالة الاستخدام الخاصة بك غير مدعومة بعد من قبل 4.0.

ستحتاج أيضا إلى استخدام الإصدار 3.2 إذا كنت تريد إجراء تسمية توضيحية للصور وكان مورد الرؤية خارج مناطق Azure المدعومة. يتم دعم ميزة التسمية التوضيحية للصورة في Image Analysis 4.0 فقط في مناطق Azure معينة. تتوفر التسمية التوضيحية للصورة في الإصدار 3.2 في جميع مناطق Azure الذكاء الاصطناعي Vision. راجع توفر المنطقة.

تحليل الصورة

يمكنك تحليل الصور لتوفير رؤى حول ميزاتها وخصائصها المرئية. يتم توفير جميع الميزات في هذا الجدول بواسطة واجهة برمجة تطبيقات تحليل الصور. اتبع التشغيل السريع للبدء.

اسم	الوصف	صفحة المفهوم
تخصيص النموذج (معاينة الإصدار 4.0 فقط) (مهمل)	يمكنك إنشاء نماذج مخصصة وتدريبها للقيام بتصنيف الصور أو الكشف عن الكائنات. أحضر صورك الخاصة، وقم بتسميةها بعلامات مخصصة، ويدرب تحليل الصور نموذجا مخصصا لحالة الاستخدام الخاصة بك.	تخصيص النموذج
قراءة النص من الصور (الإصدار 4.0 فقط)	توفر معاينة الإصدار 4.0 من Image Analysis القدرة على استخراج نص قابل للقراءة من الصور. بالمقارنة مع واجهة برمجة تطبيقات القراءة غير المتزامنة ل Computer Vision 3.2، يوفر الإصدار الجديد محرك القراءة OCR المألوف في واجهة برمجة تطبيقات متزامنة محسنة للأداء تجعل من السهل الحصول على التعرف البصري على الحروف مع رؤى أخرى في استدعاء واجهة برمجة تطبيقات واحد.	التعرف البصري على الحروف للصور
الكشف عن الأشخاص في الصور (الإصدار 4.0 فقط)	يوفر الإصدار 4.0 من Image Analysis القدرة على اكتشاف الأشخاص الذين يظهرون في الصور. يتم إرجاع إحداثيات المربع المحيط لكل شخص تم اكتشافه، جنبا إلى جنب مع درجة الثقة.	الكشف عن الأشخاص
إنشاء تسميات توضيحية للصور	إنشاء تسمية توضيحية لصورة بلغة يمكن للبشر قراءتها، باستخدام الجمل الكاملة. تنشئ خوارزميات Computer Vision تسميات توضيحية استنادا إلى الكائنات المحددة في الصورة. يعد نموذج التسمية التوضيحية للصورة الإصدار 4.0 تطبيقا أكثر تقدما ويعمل مع مجموعة أوسع من صور الإدخال. وهي متوفرة فقط في مناطق جغرافية معينة. راجع توفر المنطقة. يتيح لك الإصدار 4.0 أيضا استخدام التسمية التوضيحية الكثيفة، والتي تنشئ تسميات توضيحية مفصلة للكائنات الفردية الموجودة في الصورة. تقوم واجهة برمجة التطبيقات بإرجاع إحداثيات المربع المحيط (بالبكسل) لكل كائن موجود في الصورة، بالإضافة إلى تسمية توضيحية. يمكنك استخدام هذه الوظيفة لإنشاء أوصاف لأجزاء منفصلة من الصورة.	إنشاء تسميات توضيحية للصور (الإصدار 3.2) (v4.0)
الكشف عن الكائنات	يشبه الكشف عن الكائنات وضع العلامات، ولكن API ترجع إحداثيات مربع الإحاطة لكل علامة تم تطبيقها. على سبيل المثال، إذا كانت الصورة تحتوي على وقطة وشخص، فإن عملية الكشف تسرد هذه العناصر مع إحداثياتها في الصورة. يمكنك استخدام هذه الوظيفة لمعالجة المزيد من العلاقات بين الكائنات في صورة. كما يتيح لك معرفة متى توجد مثيلات متعددة لنفس العلامة في صورة.	الكشف عن الكائنات (الإصدار 3.2) (v4.0)
وضع علامة على الميزات المرئية	تحديد الميزات المرئية ووضع علامة عليها في صورة، من مجموعة من الآلاف من العناصر التي يمكن التعرف عليها، والأشياء الحية، والمناظر الطبيعية، والإجراءات. عندما تكون العلامات غامضة أو غير شائعة، توفر استجابة واجهة برمجة التطبيقات تلميحات لتوضيح سياق العلامة. لا يقتصر وضع العلامات على الموضوع الرئيسي، مثل الشخص في المقدمة، ولكنه يتضمن أيضا الإعداد (داخلي أو خارجي)، والأثاث، والأدوات، والنباتات،، والملحقات، والأدوات، وما إلى ذلك.	وضع علامة على الميزات المرئية (الإصدار 3.2) (v4.0)
الحصول على منطقة الاهتمام / الاقتصاص الذكي	تحليل محتويات صورة لإرجاع إحداثيات منطقة الاهتمام التي تطابق نسبة عرض إلى ارتفاع محددة. ترجع Computer Vision إحداثيات مربع الإحاطة للمنطقة، بحيث يمكن لتطبيق الاستدعاء تعديل الصورة الأصلية حسب الرغبة. يعد نموذج الاقتصاص الذكي للإصدار 4.0 تطبيقا أكثر تقدما ويعمل مع مجموعة أوسع من صور الإدخال. وهي متوفرة فقط في مناطق جغرافية معينة. راجع توفر المنطقة.	إنشاء صورة مصغرة (إصدار 3.2) (معاينة الإصدار 4.0)
الكشف عن العلامات التجارية (الإصدار 3.2 فقط)	تحديد العلامات التجارية في الصور أو مقاطع الفيديو من قاعدة بيانات آلاف الشعارات العالمية. يمكنك استخدام هذه الميزة، على سبيل المثال، لاكتشاف العلامات التجارية الأكثر شيوعا على وسائل التواصل الاجتماعي أو الأكثر انتشارا في موضع منتج الوسائط.	الكشف عن العلامات التجارية
تصنيف صورة (إصدار 3.2 فقط)	تحديد صورة بأكملها وتصنيفها، باستخدام تصنيف فئة مع التسلسلات الهرمية الوراثية الأصلية/التابعة. يمكن استخدام الفئات وحدها، أو مع نماذج وضع العلامات الجديدة. حاليا، اللغة الإنجليزية هي اللغة الوحيدة المدعومة لوضع علامات على الصور وتصنيفها.	تصنيف صورة
الكشف عن الوجوه (الإصدار 3.2 فقط)	الكشف عن الوجوه في صورة وتوفير معلومات حول كل وجه تم اكتشافه. ترجع Azure الذكاء الاصطناعي Vision الإحداثيات والمستطيل والجنس والعمر لكل وجه تم اكتشافه. يمكنك أيضا استخدام واجهة برمجة تطبيقات Face المخصصة لهذه الأغراض. ويوفر تحليلا أكثر تفصيلا، مثل التعرف على الوجه والكشف عن الوضع.	الكشف عن الوجوه
الكشف عن أنواع الصور (الإصدار 3.2 فقط)	الكشف عن خصائص الصورة، مثل ما إذا كانت الصورة رسم خط أو احتمالية ما إذا كانت الصورة قصاصة فنية.	الكشف عن أنواع الصور
الكشف عن المحتوى الخاص بالمجال (الإصدار 3.2 فقط)	استخدم نماذج النطاقات للكشف عن المحتوى الخاص بالمجال وتحديده في صورة، مثل المشاهير والمعالم. على سبيل المثال، إذا كانت الصورة تحتوي على أشخاص، فيمكن ل Azure الذكاء الاصطناعي Vision استخدام نموذج مجال للمشاهير لتحديد ما إذا كان الأشخاص الذين تم اكتشافهم في الصورة من المشاهير المعروفين.	الكشف عن محتوى خاص بالمجال
الكشف عن نظام الألوان (الإصدار 3.2 فقط)	تحليل استخدام الألوان داخل صورة. يمكن ل Azure الذكاء الاصطناعي Vision تحديد ما إذا كانت الصورة باللون الأسود والأبيض أو اللون، وبالنسبة للصور الملونة، حدد الألوان المهيمنة واللهجة.	الكشف عن نظام الألوان
الإشراف على المحتوى في الصور (الإصدار 3.2 فقط)	يمكنك استخدام Azure الذكاء الاصطناعي Vision للكشف عن محتوى البالغين في صورة وإرجاع درجات الثقة لتصنيفات مختلفة. يمكن تعيين حد وضع علامة على المحتوى على مقياس منزلق لاستيعاب تفضيلاتك.	الكشف عن محتوى البالغين

التعرف على المنتج (معاينة الإصدار 4.0 فقط) (مهمل)

مهم

هذه الميزة مهملة الآن. في 31 مارس 2025، سيتم إيقاف Azure الذكاء الاصطناعي Image Analysis 4.0 Custom Image Classification، وCustom Object Detection، وواجهة برمجة تطبيقات معاينة التعرف على المنتج. بعد هذا التاريخ، ستفشل استدعاءات واجهة برمجة التطبيقات إلى هذه الخدمات.

للحفاظ على التشغيل السلس للنماذج الخاصة بك، انتقل إلى Azure الذكاء الاصطناعي Custom Vision، والتي تتوفر الآن بشكل عام. توفر Custom Vision وظائف مشابهة لهذه الميزات المتوقفة.

تتيح لك واجهات برمجة التطبيقات التعرف على المنتجات تحليل صور الرفوف في متجر بيع بالتجزئة. يمكنك الكشف عن وجود المنتجات أو غيابها والحصول على إحداثيات المربع المحيط بها. استخدمه بالاشتراك مع تخصيص النموذج لتدريب نموذج لتحديد منتجاتك المحددة. يمكنك أيضا مقارنة نتائج التعرف على المنتجات بمستند مخطط مخطط متجرك.

التعرف على المنتج

التضمينات متعددة الوسائط (الإصدار 4.0 فقط)

تمكن واجهات برمجة تطبيقات التضمينات متعددة الوسائط من توجيه الصور واستعلامات النص. إنها تحول الصور إلى إحداثيات في مساحة متجه متعددة الأبعاد. بعد ذلك، يمكن أيضا تحويل استعلامات النص الواردة إلى خطوط متجهة، ويمكن مطابقة الصور مع النص استنادا إلى التقارب الدلالي. يسمح هذا للمستخدم بالبحث في مجموعة من الصور باستخدام النص، دون الحاجة إلى استخدام علامات الصور أو بيانات التعريف الأخرى. غالبا ما ينتج عن التقارب الدلالي نتائج أفضل في البحث.

2024-02-01 تتضمن واجهة برمجة التطبيقات نموذجا متعدد اللغات يدعم البحث عن النص ب 102 لغة. لا يزال النموذج الأصلي باللغة الإنجليزية فقط متوفرا، ولكن لا يمكن دمجه مع النموذج الجديد في نفس فهرس البحث. إذا قمت بتصوير النصوص والصور الموجهة باستخدام النموذج باللغة الإنجليزية فقط، فلن تكون هذه المتجهات متوافقة مع متجهات النص والصور متعددة اللغات.

لا تتوفر واجهات برمجة التطبيقات هذه إلا في مناطق جغرافية معينة. راجع توفر المنطقة.

التضمينات متعددة الوسائط

إزالة الخلفية (معاينة الإصدار 4.0 فقط)

مهم

هذه الميزة مهملة الآن. في 31 مارس 2025، سيتم إيقاف Azure الذكاء الاصطناعي Image Analysis 4.0 Segment API وخدمة إزالة الخلفية. ستفشل جميع طلبات هذه الخدمة بعد هذا التاريخ.

قد تلبي ميزة التجزئة لنموذج فلورنسا 2 مفتوح المصدر احتياجاتك. تقوم بإرجاع خريطة ألفا تميز الفرق بين المقدمة والخلفية، ولكنها لا تقوم بتحرير الصورة الأصلية لإزالة الخلفية. تثبيت نموذج فلورنسا 2 وتجربة المنطقة الخاصة به إلى ميزة التجزئة.

لإزالة الخلفية كاملة الميزات، ضع في اعتبارك أداة مساعدة تابعة لجهة خارجية مثل BiRefNet.

حدود الخدمة

يعمل تحليل الصور على الصور التي تفي بالمتطلبات التالية:

يجب تقديم الصورة بتنسيق JPEG أو PNG أو GIF أو BMP أو WEBP أو ICO أو TIFF أو MPO
يجب أن يكون حجم ملف الصورة أقل من 20 ميغابايت (ميغابايت)
يجب أن تكون أبعاد الصورة أكبر من 50 × 50 بكسل وأقل من 16000 × 16000 بكسل

تلميح

متطلبات الإدخال للتضمينات متعددة الوسائط مختلفة ويتم سردها في التضمينات متعددة الوسائط

دعم اللغة

تتوفر ميزات مختلفة لتحليل الصور بلغات مختلفة. راجع صفحة دعم اللغة .

توافر المناطق

لاستخدام واجهات برمجة تطبيقات تحليل الصور، يجب إنشاء مورد Azure الذكاء الاصطناعي Vision في منطقة مدعومة. تتوفر ميزات تحليل الصور في المناطق التالية:

المنطقة	تحليل الصورة (ناقص 4.0 تسمية توضيحية)	تحليل الصورة (بما في ذلك 4.0 تسمية توضيحية)	التعرف على المنتج	التضمينات متعددة الوسائط
شرق الولايات المتحدة	✅	✅	✅	✅
غرب الولايات المتحدة	✅	✅		✅
غرب الولايات المتحدة 2	✅		✅	✅
وسط فرنسا	✅	✅		✅
أوروبا الشمالية	✅	✅		✅
أوروبا الغربية	✅	✅		✅
منطقة السويد الوسطى	✅			✅
شمال سويسرا	✅			✅
شرق أستراليا	✅			✅
جنوب شرق آسيا	✅	✅		✅
شرق آسيا	✅	✅
وسط كوريا	✅	✅		✅
شرق اليابان	✅			✅

خصوصية البيانات وأمنها

كما هو الحال مع جميع خدمات Azure الذكاء الاصطناعي، يجب أن يكون المطورون الذين يستخدمون خدمة Azure الذكاء الاصطناعي Vision على دراية بسياسات Microsoft بشأن بيانات العملاء. راجع صفحة خدمات Azure الذكاء الاصطناعي في مركز توثيق Microsoft لمعرفة المزيد.

الخطوات التَالية

ابدأ باستخدام تحليل الصور باتباع دليل التشغيل السريع بلغة التطوير المفضلة لديك وإصدار واجهة برمجة التطبيقات: