الملخص
نصيحة
راجع علامة التبويب النص والصور لمزيد من التفاصيل!
في هذه الوحدة، استكشفنا النماذج القادرة على الرؤية في Microsoft Foundry وكيفية استخدامها لتحليل الصور وتوليد صور وفيديوهات أصلية.
غطت الوحدة نماذج متعددة الوسائط التي تدعم تحليل الصور. كما غطينا نماذج توليد الصور، مثل تلك الموجودة في عائلة GPT-Image، لإنشاء وتحرير الصور من المحفزات باستخدام أدوات وواجهات برمجة التطبيقات من Foundry. وأخيرا، قدمنا توليد الفيديو باستخدام نماذج Sora، التي تتيح إنشاء النص إلى فيديو والصورة إلى فيديو من خلال ملاعب تفاعلية وسير عمل REST غير متزامن وبرمجي.
بشكل عام، تساعد نماذج الذكاء الاصطناعي البصري في Microsoft Foundry في سد الفجوة بين البيانات البصرية والذكاء الاصطناعي القائم على اللغة. تمكن هذه التقنيات سيناريوهات مثل تحليل المستندات والصور، والمساعدين البصريين، وأدوات الوصول، وعوامل الذكاء الاصطناعي متعددة الوسائط—مما يجعل فهم الصور امتدادا طبيعيا لتطبيقات الذكاء الاصطناعي الحديثة.
لمعرفة المزيد، اطلع على الروابط التالية:
- جرب تحليل الصور السريع من التوثيق.
- تعرف أكثر على نماذج الدردشة المدعومة بالرؤية.
- تعرف أكثر على نماذج توليد الصور في Azure OpenAI.
- تعرف أكثر على توليد الفيديو مع سورا.