إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
Caution
خدمة تحليل الصور 4.0 في Azure Vision في أدوات Foundry Tools مهجورة وسيتم إيقافها في 25 سبتمبر 2028، وبعد ذلك ستفشل المكالمات التي تجرى على الخدمة. نوصيك بالتحول إلى أحد البدائل المتاحة الموضحة في دليل الهجرة.
يمكن لخدمة تحليل الصور Azure Vision في أدوات Foundry استخراج مجموعة واسعة من الميزات البصرية من صورك. على سبيل المثال، يمكنه تحديد ما إذا كانت الصورة تحتوي على محتوى للبالغين، أو العثور على علامات تجارية أو عناصر معينة، أو العثور على وجوه بشرية.
يحتوي أحدث إصدار من Image Analysis ، 4.0 ، المتاح الآن بشكل عام ، على ميزات جديدة مثل التعرف الضوئي على الحروف المتزامن واكتشاف الأشخاص.
يمكنك استخدام تحليل الصور من خلال مكتبة عميل SDK أو عن طريق استدعاء واجهة برمجة تطبيقات REST مباشرة. اتبع التشغيل السريع للبدء.
تحتوي هذه الوثائق على أنواع المقالات التالية:
- يُعد برنامج quickstarts بمثابة إرشادات خطوة بخطوة تسمح لك بإجراء مكالمات مع الخدمة والحصول على النتائج في فترة زمنية قصيرة.
- تحتوي أدلة الاستخدامعلى إرشادات لاستخدام الخدمة بطرق أكثر تحديداً أو تخصيصاً.
- توفر المقالات المفاهيمية تفسيرات متعمقة لوظائف الخدمة وميزاتها.
للحصول على نهج أكثر تنظيما، اتبع وحدة تدريب لتحليل الصور.
إصدارات تحليل الصور
Important
حدد إصدار واجهة برمجة تطبيقات تحليل الصور الذي يناسب متطلباتك على أفضل نحو.
| Version | الميزات المتاحة | Recommendation |
|---|---|---|
| الإصدار 4.0 | قراءة النص، التسميات التوضيحية، التسميات التوضيحية الكثيفة، العلامات، الكشف عن الكائنات، الأشخاص، الاقتصاص الذكي | نماذج أفضل؛ استخدم الإصدار 4.0 إذا كان يدعم حالة الاستخدام الخاصة بك. |
| الإصدار 3.2 | العلامات والكائنات والأوصاف والعلامات التجارية والوجوه ونوع الصورة ونظام الألوان والمعالم والمشاهير ومحتوى البالغين والقص الذكي | نطاق أوسع من الميزات؛ استخدام الإصدار 3.2 إذا كانت حالة الاستخدام غير مدعومة بعد في الإصدار 4.0 |
نوصي باستخدام واجهة برمجة تطبيقات تحليل الصور 4.0 إذا كانت تدعم حالة الاستخدام الخاصة بك. استخدم الإصدار 3.2 إذا كانت حالة الاستخدام الخاصة بك غير مدعومة بعد من قبل 4.0.
ستحتاج أيضا إلى استخدام الإصدار 3.2 إذا كنت تريد إجراء تسمية توضيحية للصور وكان مورد الرؤية خارج مناطق Azure المدعومة. يتم دعم ميزة التسمية التوضيحية للصورة في Image Analysis 4.0 فقط في مناطق Azure معينة. الترجمة التوضيحية للصور في الإصدار 3.2 متاحة في جميع مناطق Azure Vision. راجع توفر المنطقة.
Analyze Image
يمكنك تحليل الصور للحصول على رؤى حول ميزاتها وخصائصها المرئية. توفر واجهة برمجة تطبيقات تحليل الصور جميع الميزات في هذا الجدول. للبدء، اتبع البدء السريع.
| Name | Description | صفحة المفهوم |
|---|---|---|
| تخصيص النموذج (معاينة الإصدار 4.0 فقط) (مهمل) | إنشاء نماذج مخصصة وتدريبها لتصنيف الصور أو اكتشاف الكائنات. أحضر صورك الخاصة، وقم بتسميةها بعلامات مخصصة، ويدرب تحليل الصور نموذجا مخصصا لحالة الاستخدام الخاصة بك. | تخصيص النموذج |
| قراءة النص من الصور (الإصدار 4.0 فقط) | توفر معاينة الإصدار 4.0 من Image Analysis القدرة على استخراج نص قابل للقراءة من الصور. بالمقارنة مع واجهة برمجة تطبيقات القراءة غير المتزامنة ل رؤية الكمبيوتر 3.2، يوفر الإصدار الجديد محرك القراءة OCR المألوف في واجهة برمجة تطبيقات متزامنة محسنة للأداء تجعل من السهل الحصول على التعرف البصري على الحروف مع رؤى أخرى في استدعاء واجهة برمجة تطبيقات واحد. | التعرف البصري على الحروف للصور |
| الكشف عن الأشخاص في الصور (الإصدار 4.0 فقط) | يوفر الإصدار 4.0 من Image Analysis القدرة على اكتشاف الأشخاص الذين يظهرون في الصور. تقوم واجهة برمجة التطبيقات بإرجاع إحداثيات المربع المحيط لكل شخص تم اكتشافه، بالإضافة إلى درجة الثقة. | اكتشاف الأشخاص |
| إنشاء تسميات توضيحية للصور | إنشاء تسمية توضيحية لصورة بلغة يمكن للبشر قراءتها، باستخدام الجمل الكاملة. تنشئ خوارزميات رؤية الكمبيوتر تسميات توضيحية استنادا إلى الكائنات المحددة في الصورة. يعد نموذج التسمية التوضيحية للصورة الإصدار 4.0 تطبيقا أكثر تقدما ويعمل مع مجموعة أوسع من صور الإدخال. وهي متوفرة فقط في مناطق جغرافية معينة. راجع توفر المنطقة. يتيح لك الإصدار 4.0 أيضا استخدام التسمية التوضيحية الكثيفة، والتي تنشئ تسميات توضيحية مفصلة للكائنات الفردية الموجودة في الصورة. تقوم واجهة برمجة التطبيقات بإرجاع إحداثيات المربع المحيط (بالبكسل) لكل كائن موجود في الصورة، بالإضافة إلى تسمية توضيحية. يمكنك استخدام هذه الوظيفة لإنشاء أوصاف لأجزاء منفصلة من الصورة.
|
إنشاء تسميات توضيحية للصور (الإصدار 3.2) (v4.0) |
| كشف الكائنات | يشبه الكشف عن الكائنات وضع العلامات، ولكن API ترجع إحداثيات مربع الإحاطة لكل علامة تم تطبيقها. على سبيل المثال، إذا كانت الصورة تحتوي على وقطة وشخص، فإن عملية الاكتشاف تسرد هذه الكائنات مع إحداثياتها في الصورة. يمكنك استخدام هذه الوظيفة لمعالجة المزيد من العلاقات بين الكائنات في صورة. كما يتيح لك معرفة متى توجد مثيلات متعددة لنفس العلامة في صورة.
|
الكشف عن الكائنات (الإصدار 3.2) (v4.0) |
| وضع علامة على الميزات المرئية | تحديد الميزات المرئية ووضع علامة عليها في صورة، من مجموعة من الآلاف من العناصر التي يمكن التعرف عليها، والأشياء الحية، والمناظر الطبيعية، والإجراءات. عندما تكون العلامات غامضة أو غير شائعة، توفر استجابة واجهة برمجة التطبيقات تلميحات لتوضيح سياق العلامة. لا يقتصر وضع العلامات على الموضوع الرئيسي، مثل الشخص في المقدمة، ولكنه يتضمن أيضا الإعداد (داخلي أو خارجي)، والأثاث، والأدوات، والنباتات،، والملحقات، والأدوات، وما إلى ذلك.
|
وضع علامة على الميزات المرئية (الإصدار 3.2) (v4.0) |
| الحصول على منطقة الاهتمام / الاقتصاص الذكي | تحليل محتويات صورة لإرجاع إحداثيات منطقة الاهتمام التي تطابق نسبة عرض إلى ارتفاع محددة. ترجع رؤية الكمبيوتر إحداثيات مربع الإحاطة للمنطقة، بحيث يمكن لتطبيق الاستدعاء تعديل الصورة الأصلية حسب الرغبة. يعد نموذج الاقتصاص الذكي للإصدار 4.0 تطبيقا أكثر تقدما ويعمل مع مجموعة أوسع من صور الإدخال. وهي متوفرة فقط في مناطق جغرافية معينة. راجع توفر المنطقة. |
إنشاء صورة مصغرة (إصدار 3.2) (معاينة الإصدار 4.0) |
| الكشف عن العلامات التجارية (الإصدار 3.2 فقط) | تحديد العلامات التجارية في الصور أو مقاطع الفيديو من قاعدة بيانات آلاف الشعارات العالمية. يمكنك استخدام هذه الميزة، على سبيل المثال، لاكتشاف العلامات التجارية الأكثر شيوعا على وسائل التواصل الاجتماعي أو الأكثر انتشارا في موضع منتج الوسائط. | اكتشاف العلامات التجارية |
| تصنيف صورة (إصدار 3.2 فقط) | تحديد صورة بأكملها وتصنيفها، باستخدام تصنيف فئة مع التسلسلات الهرمية الوراثية الأصلية/التابعة. يمكن استخدام الفئات وحدها، أو مع نماذج وضع العلامات الجديدة. حاليا، اللغة الإنجليزية هي اللغة الوحيدة المدعومة لوضع علامات على الصور وتصنيفها. |
تصنيف صورة |
| الكشف عن الوجوه (الإصدار 3.2 فقط) | الكشف عن الوجوه في صورة وتوفير معلومات حول كل وجه تم اكتشافه. يعيد Azure Vision الإحداثيات، المستطيل، الجنس، والعمر لكل وجه تم اكتشافه. يمكنك أيضا استخدام واجهة برمجة تطبيقات Face المخصصة لهذه الأغراض. ويوفر تحليلا أكثر تفصيلا، مثل التعرف على الوجه والكشف عن الوضع. |
اكتشاف الوجوه |
| الكشف عن أنواع الصور (الإصدار 3.2 فقط) | الكشف عن خصائص الصورة، مثل ما إذا كانت الصورة رسم خط أو احتمالية ما إذا كانت الصورة قصاصة فنية. | الكشف عن أنواع الصور |
| الكشف عن المحتوى الخاص بالمجال (الإصدار 3.2 فقط) | استخدم نماذج النطاقات للكشف عن المحتوى الخاص بالمجال وتحديده في صورة، مثل المشاهير والمعالم. على سبيل المثال، إذا كانت الصورة تحتوي على أشخاص، يمكن ل Azure Vision استخدام نموذج نطاق للمشاهير لتحديد ما إذا كان الأشخاص الذين تم اكتشافهم في الصورة هم مشاهير معروفون. | الكشف عن محتوى خاص بالمجال |
| الكشف عن نظام الألوان (الإصدار 3.2 فقط) | تحليل استخدام الألوان داخل صورة. يمكن لرؤية الأزور تحديد ما إذا كانت الصورة بالأبيض والأسود أو ملونة، وبالنسبة للصور الملونة، تحديد الألوان السائدة والألوان البارزة. | الكشف عن نظام الألوان |
| الإشراف على المحتوى في الصور (الإصدار 3.2 فقط) | استخدم Azure Vision لاكتشاف محتوى البالغين في صورة وإرجاع درجات الثقة لتصنيفات مختلفة. يمكن تعيين حد وضع علامة على المحتوى على مقياس منزلق لاستيعاب تفضيلاتك. | الكشف عن محتوى البالغين |
التعرف على المنتج (معاينة الإصدار 4.0 فقط) (مهمل)
Important
تم إيقاف هذه الميزة الآن. في 31 مارس 2025، تم إيقاف تصنيف الصور المخصص لتحليل صور الذكاء الاصطناعي Azure 4.0 واكتشاف الكائنات المخصصة وواجهة برمجة تطبيقات معاينة التعرف على المنتج. ستفشل استدعاءات واجهة برمجة التطبيقات لهذه الخدمات.
الانتقال إلى Azure الذكاء الاصطناعي Custom Vision، المتوفر بشكل عام. توفر Custom Vision وظائف مشابهة لهذه الميزات المتوقفة.
تتيح لك واجهات برمجة التطبيقات التعرف على المنتجات تحليل صور الرفوف في متجر بيع بالتجزئة. يمكنك الكشف عن وجود المنتجات أو غيابها والحصول على إحداثيات المربع المحيط بها. استخدمه بالاشتراك مع تخصيص النموذج لتدريب نموذج لتحديد منتجاتك المحددة. يمكنك أيضا مقارنة نتائج التعرف على المنتجات بمستند مخطط مخطط متجرك.
التضمينات متعددة الوسائط (الإصدار 4.0 فقط)
تمكن واجهات برمجة تطبيقات التضمينات متعددة الوسائط من توجيه الصور واستعلامات النص. يقومون بتحويل الصور إلى إحداثيات في مساحة متجهة متعددة الأبعاد. بعد ذلك ، يمكنك تحويل استعلامات النص الواردة إلى متجهات ، ومطابقة الصور بالنص بناء على التقارب الدلالي. تتيح لك هذه الإمكانية البحث في مجموعة من الصور باستخدام النص، دون الحاجة إلى استخدام علامات الصور أو بيانات التعريف الأخرى. غالبا ما ينتج عن التقارب الدلالي نتائج أفضل في البحث.
2024-02-01 تتضمن واجهة برمجة التطبيقات نموذجا متعدد اللغات يدعم البحث عن النص ب 102 لغة. لا يزال الطراز الأصلي باللغة الإنجليزية فقط متاحا ، ولكن لا يمكنك دمجه مع النموذج الجديد في نفس فهرس البحث. إذا قمت بتوجيه النص والصور باستخدام النموذج باللغة الإنجليزية فقط، فلن تكون هذه المتجهات متوافقة مع متجهات النص والصور متعددة اللغات.
لا تتوفر واجهات برمجة التطبيقات هذه إلا في مناطق جغرافية معينة. راجع توفر المنطقة.
إزالة الخلفية (معاينة الإصدار 4.0 فقط)
Important
تم إيقاف هذه الميزة الآن. في 31 مارس 2025، تم إيقاف واجهة برمجة تطبيقات Azure الذكاء الاصطناعي Image Analysis 4.0 وخدمة إزالة الخلفية. ستفشل استدعاءات واجهة برمجة التطبيقات لهذه الخدمات.
قد تلبي ميزة التجزئة لنموذج فلورنسا 2 مفتوح المصدر احتياجاتك. تقوم بإرجاع خريطة ألفا تميز الفرق بين المقدمة والخلفية، ولكنها لا تقوم بتحرير الصورة الأصلية لإزالة الخلفية. تثبيت نموذج فلورنسا 2 وتجربة المنطقة الخاصة به إلى ميزة التجزئة.
لإزالة الخلفية كاملة الميزات، ضع في اعتبارك أداة مساعدة تابعة لجهة خارجية مثل BiRefNet.
حدود الخدمة
متطلبات الإدخال
يعمل تحليل الصور على الصور التي تفي بالمتطلبات التالية:
- يجب أن تكون الصورة بتنسيق JPEG أو PNG أو GIF أو BMP أو WEBP أو ICO أو TIFF أو MPO
- يجب أن يكون حجم ملف الصورة أقل من 20 ميغابايت (ميغابايت)
- يجب أن تكون أبعاد الصورة أكبر من 50 × 50 بكسل وأقل من 16000 × 16000 بكسل
Tip
تختلف متطلبات الإدخال للتضمينات متعددة الوسائط وهي مدرجة في عمليات التضمين متعددة الوسائط.
دعم اللغة
تتوفر ميزات مختلفة لتحليل الصور بلغات مختلفة. راجع صفحة دعم اللغة .
توافر المناطق
لاستخدام واجهات برمجة تطبيقات تحليل الصور، يجب عليك إنشاء مورد Azure Vision الخاص بك في أدوات Foundry في منطقة مدعومة. تتوفر ميزات تحليل الصور في المناطق التالية:
| Region | Analyze Image (ناقص 4.0 تسمية توضيحية) |
Analyze Image (بما في ذلك 4.0 تسمية توضيحية) |
التعرف على المنتج | التضمينات متعددة الوسائط |
|---|---|---|---|---|
| East US | ✅ | ✅ | ✅ | ✅ |
| West US | ✅ | ✅ | ✅ | |
| غرب الولايات المتحدة 2 | ✅ | ✅ | ✅ | |
| France Central | ✅ | ✅ | ✅ | |
| North Europe | ✅ | ✅ | ✅ | |
| West Europe | ✅ | ✅ | ✅ | |
| Sweden Central | ✅ | ✅ | ||
| Switzerland North | ✅ | ✅ | ||
| Australia East | ✅ | ✅ | ||
| Southeast Asia | ✅ | ✅ | ✅ | |
| East Asia | ✅ | ✅ | ||
| Korea Central | ✅ | ✅ | ✅ | |
| Japan East | ✅ | ✅ |
خصوصية البيانات وأمنها
كما هو الحال مع جميع أدوات Foundry، يجب على المطورين الذين يستخدمون خدمة Azure Vision أن يكونوا على دراية بسياسات مايكروسوفت المتعلقة ببيانات العملاء. لمعرفة المزيد، راجع صفحة أدوات الصبك في مركز الثقة الخاص بمايكروسوفت.
الخطوات التالية
ابدأ باستخدام تحليل الصور باتباع دليل التشغيل السريع بلغة التطوير المفضلة لديك وإصدار واجهة برمجة التطبيقات: