סיכום
עצה
עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!
במודול זה חקרנו מודלים בעלי יכולת ראייה ב-Microsoft Foundry וכיצד להשתמש בהם לניתוח תמונות וליצירת תמונות וסרטונים מקוריים.
המודול כיסה מודלים מולטימודליים, התומכים בניתוח תמונה. כיסינו גם מודלים ליצירת תמונות, כמו אלה ממשפחת GPT-Image, ליצירה ועריכה של תמונות מתוך הנחיות באמצעות כלים ו-APIs של Foundry. לבסוף, הצגנו יצירת וידאו עם מודלים של Sora, שמאפשרים יצירת טקסט לווידאו ותמונה לווידאו באמצעות מגרשי משחקים אינטראקטיביים וזרימות עבודה תכנותיות ואסינכרוניות של REST.
בסך הכל, מודלים ויזואליים של בינה מלאכותית ב-Microsoft Foundry מסייעים לגשר על הפער בין נתונים חזותיים לבינה מלאכותית מבוססת שפה. הם מאפשרים תרחישים כמו ניתוח מסמכים ותמונות, עוזרים חזותיים, כלי נגישות וסוכני בינה מלאכותית רב-מודלית—מה שהופך את הבנת התמונה להרחבה טבעית של יישומי AI מודרניים.
למידע נוסף, עיינו בקישורים הבאים:
- נסה ניתוח תמונות מהיר מהתיעוד.
- למדו עוד על מודלים של צ'אט עם יכולת ראייה.
- למדו עוד על מודלים ליצירת תמונות ב-Azure OpenAI.
- למדו עוד על יצירת וידאו עם סורה.