Jenis layanan API visi
Azure AI Vision adalah salah satu kategori terluas dalam layanan Azure AI. Anda dapat menggunakan API untuk menggabungkan fitur visi seperti analisis gambar, deteksi wajah, analisis spasial, dan pengenalan karakter optik (OCR) dalam aplikasi Anda, bahkan jika Anda memiliki pengetahuan terbatas tentang pembelajaran mesin.
Layanan
Berikut adalah beberapa kategori API visi yang luas:
- Computer Vision menyediakan algoritma tingkat lanjut yang memproses gambar dan mengembalikan informasi berdasarkan fitur visual yang Anda minati. Ini menyediakan empat layanan: OCR, layanan Wajah, Analisis Gambar, dan Analisis Spasial. Kecerdasan Dokumen adalah versi lanjutan dari OCR.
- Custom Vision adalah layanan pengenalan gambar yang dapat Anda gunakan untuk membangun, menyebarkan, dan meningkatkan model pengidentifikasi gambar Anda sendiri.
- Layanan wajah menyediakan algoritma AI yang mendeteksi, mengenali, dan menganalisis wajah manusia dalam gambar.
Cara memilih layanan
Bagan alur berikut ini dapat membantu Anda memilih layanan visi untuk kasus penggunaan spesifik Anda:
Kasus penggunaan umum
Visi Komputer
- Menjelaskan gambar. Analisis gambar, evaluasi objek yang terdeteksi, dan hasilkan frasa atau kalimat yang dapat dibaca manusia yang menjelaskan gambar.
- Tag fitur visual. Terapkan tag yang didasarkan pada sekumpulan ribuan objek yang dapat dikenali.
- Mengategorikan gambar. Mengategorikan gambar berdasarkan kontennya.
- Menerapkan OCR. Mendeteksi teks cetak dan tulisan tangan dalam gambar.
- Mendeteksi jenis gambar. Misalnya, identifikasi gambar clip art atau gambar garis.
- Mendeteksi skema warna. Identifikasi warna latar depan, latar belakang, dan dominan serta aksen dominan dalam gambar.
- Hasilkan gambar mini. Buat versi kecil gambar.
- Memoderasi konten. Mendeteksi gambar yang berisi konten dewasa atau menggambarkan adegan gory.
- Mendeteksi konten khusus domain. Gunakan dua model domain khusus:
- Selebriti. Identifikasi ribuan selebriti terkenal dari domain olahraga, hiburan, dan bisnis.
- Landmark. Identifikasi landmark terkenal, seperti Taj Mahal dan Patung Liberty.
- Mendeteksi objek. Identifikasi objek umum dan kembalikan koordinat kotak pembatas.
- Deteksi merek. Identifikasi logo dari database yang ada dari ribuan logo produk yang diakui secara global.
- Mendeteksi wajah. Mendeteksi dan menganalisis wajah manusia dalam gambar. Anda dapat menentukan usia subjek dan mengembalikan kotak pembatas yang menentukan lokasi wajah. Kemampuan analisis wajah layanan Computer Vision adalah subset dari yang disediakan oleh layanan Face khusus.
Visi Kustom
- Mengklasifikasikan gambar. Memprediksi kategori, atau kelas, berdasarkan serangkaian input, yang disebut fitur. Hitung skor probabilitas untuk setiap kelas yang mungkin dan kembalikan label yang menunjukkan kelas tempat objek kemungkinan besar berada. Untuk menggunakan model ini, Anda memerlukan data yang terdiri dari fitur dan labelnya.
- Mendeteksi objek. Dapatkan koordinat objek dalam gambar. Untuk menggunakan model ini, Anda memerlukan data yang terdiri dari fitur dan labelnya.
Layanan wajah
- Mendeteksi wajah. Identifikasi wilayah gambar yang berisi wajah manusia, biasanya dengan mengembalikan koordinat kotak pembatas yang membentuk persegi panjang di sekitar wajah.
- Menganalisis wajah. Mengembalikan informasi, seperti tengara wajah (hidung, mata, alis, bibir, dan banyak lagi). Anda dapat menggunakan landmark wajah ini sebagai fitur untuk melatih model pembelajaran mesin yang dapat menyimpulkan informasi tentang orang-orang, seperti usia yang dirasakan atau keadaan emosional mereka.
- Mengenali wajah. Latih model pembelajaran mesin untuk mengidentifikasi individu yang dikenal dari fitur wajah mereka.
Kontributor
Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.
Penulis utama:
- Ashish Chahuan | Arsitek Solusi Cloud Senior
- Kruti Mehta | Insinyur Fast-Track Senior Azure
Kontributor lain:
- Mick Alberts | Penulis Teknis
- Brandon Cowen | Arsitek Solusi Cloud Senior
- Oscar Shimabukuro | Arsitek Solusi Cloud Senior
- Manjit Singh | Insinyur Perangkat Lunak
- Christina Skarpathiotaki | Arsitek Solusi Cloud Senior
- Nathan Widdup | Insinyur Fast-Track Senior Azure
Untuk melihat profil LinkedIn non-publik, masuk ke LinkedIn.
Langkah berikutnya
- Apa itu Computer Vision?
- Posting blog Vision API
- Jalur pembelajaran: Membuat solusi Pemahaman Bahasa dengan Azure Cognitive Services
- Jalur pembelajaran: Menyediakan dan mengelola Azure Cognitive Services
- Jalur pembelajaran: Menjelajahi visi komputer
- Jalur pembelajaran: Membuat solusi visi komputer dengan Azure Cognitive Services
- Jalur pembelajaran: Membuat solusi pengenalan gambar dengan Azure IoT Edge dan Azure Cognitive Services
Sumber daya terkait
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk