Ringkasan

1 menit

Tip

Lihat tab Teks dan gambar untuk detail selengkapnya!

Dalam modul ini, kami menjelajahi model berkemampuan penglihatan di Microsoft Foundry dan cara menggunakannya untuk menganalisis gambar dan menghasilkan gambar dan video asli.

Modul ini mencakup model multimodal, yang mendukung analisis gambar. Kami juga membahas model pembuatan gambar, seperti yang ada di keluarga GPT-Image, untuk membuat dan mengedit gambar dari perintah menggunakan alat dan API Foundry. Terakhir, kami memperkenalkan pembuatan video dengan model Sora, yang memungkinkan pembuatan teks ke video dan gambar ke video melalui taman bermain interaktif dan alur kerja REST asinkron yang terprogram.

Secara keseluruhan, model AI visual di Microsoft Foundry membantu menjegal kesenjangan antara data visual dan AI berbasis bahasa. Mereka memungkinkan skenario seperti analisis dokumen dan gambar, asisten visual, alat aksesibilitas, dan agen AI multimodal—menjadikan pemahaman gambar sebagai perpanjangan alami dari aplikasi AI modern.

Untuk mempelajari selengkapnya, lihat tautan berikut:

Cobalah panduan cepat analisis gambar di dokumentasi.
Pelajari selengkapnya tentang model obrolan yang mendukung visi.
Pelajari selengkapnya tentang model pembuatan gambar Azure OpenAI.
Pelajari selengkapnya tentang pembuatan video dengan Sora.

Saran dan Komentar

Apakah halaman ini membantu?