Jenis layanan API visi

Artikel
07/23/2024

Azure AI Vision adalah salah satu kategori terluas dalam layanan Azure AI. Anda dapat menggunakan API untuk menggabungkan fitur visi seperti analisis gambar, deteksi wajah, analisis spasial, dan pengenalan karakter optik (OCR) dalam aplikasi Anda, bahkan jika Anda memiliki pengetahuan terbatas tentang pembelajaran mesin.

Layanan

Berikut adalah beberapa kategori API visi yang luas:

Computer Vision menyediakan algoritma tingkat lanjut yang memproses gambar dan mengembalikan informasi berdasarkan fitur visual yang Anda minati. Ini menyediakan empat layanan: OCR, layanan Wajah, Analisis Gambar, dan Analisis Spasial. Kecerdasan Dokumen adalah versi lanjutan dari OCR.
Custom Vision adalah layanan pengenalan gambar yang dapat Anda gunakan untuk membangun, menyebarkan, dan meningkatkan model pengidentifikasi gambar Anda sendiri.
Layanan wajah menyediakan algoritma AI yang mendeteksi, mengenali, dan menganalisis wajah manusia dalam gambar.

Cara memilih layanan

Bagan alur berikut ini dapat membantu Anda memilih layanan visi untuk kasus penggunaan spesifik Anda:

Kasus penggunaan umum

Visi Komputer
- Menjelaskan gambar. Analisis gambar, evaluasi objek yang terdeteksi, dan hasilkan frasa atau kalimat yang dapat dibaca manusia yang menjelaskan gambar.
- Tag fitur visual. Terapkan tag yang didasarkan pada sekumpulan ribuan objek yang dapat dikenali.
- Mengategorikan gambar. Mengategorikan gambar berdasarkan kontennya.
- Menerapkan OCR. Mendeteksi teks cetak dan tulisan tangan dalam gambar.
- Mendeteksi jenis gambar. Misalnya, identifikasi gambar clip art atau gambar garis.
- Mendeteksi skema warna. Identifikasi warna latar depan, latar belakang, dan dominan serta aksen dominan dalam gambar.
- Hasilkan gambar mini. Buat versi kecil gambar.
- Memoderasi konten. Mendeteksi gambar yang berisi konten dewasa atau menggambarkan adegan gory.
- Mendeteksi konten khusus domain. Gunakan dua model domain khusus:
  - Selebriti. Identifikasi ribuan selebriti terkenal dari domain olahraga, hiburan, dan bisnis.
  - Landmark. Identifikasi landmark terkenal, seperti Taj Mahal dan Patung Liberty.
- Mendeteksi objek. Identifikasi objek umum dan kembalikan koordinat kotak pembatas.
- Deteksi merek. Identifikasi logo dari database yang ada dari ribuan logo produk yang diakui secara global.
- Mendeteksi wajah. Mendeteksi dan menganalisis wajah manusia dalam gambar. Anda dapat menentukan usia subjek dan mengembalikan kotak pembatas yang menentukan lokasi wajah. Kemampuan analisis wajah layanan Computer Vision adalah subset dari yang disediakan oleh layanan Face khusus.
Visi Kustom
- Mengklasifikasikan gambar. Memprediksi kategori, atau kelas, berdasarkan serangkaian input, yang disebut fitur. Hitung skor probabilitas untuk setiap kelas yang mungkin dan kembalikan label yang menunjukkan kelas tempat objek kemungkinan besar berada. Untuk menggunakan model ini, Anda memerlukan data yang terdiri dari fitur dan labelnya.
- Mendeteksi objek. Dapatkan koordinat objek dalam gambar. Untuk menggunakan model ini, Anda memerlukan data yang terdiri dari fitur dan labelnya.
Layanan wajah
- Mendeteksi wajah. Identifikasi wilayah gambar yang berisi wajah manusia, biasanya dengan mengembalikan koordinat kotak pembatas yang membentuk persegi panjang di sekitar wajah.
- Menganalisis wajah. Mengembalikan informasi, seperti tengara wajah (hidung, mata, alis, bibir, dan banyak lagi). Anda dapat menggunakan landmark wajah ini sebagai fitur untuk melatih model pembelajaran mesin yang dapat menyimpulkan informasi tentang orang-orang, seperti usia yang dirasakan atau keadaan emosional mereka.
- Mengenali wajah. Latih model pembelajaran mesin untuk mengidentifikasi individu yang dikenal dari fitur wajah mereka.

Kontributor

Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.

Penulis utama:

Ashish Chahuan | Arsitek Solusi Cloud Senior
Kruti Mehta | Insinyur Fast-Track Senior Azure

Kontributor lain:

Mick Alberts | Penulis Teknis
Brandon Cowen | Arsitek Solusi Cloud Senior
Oscar Shimabukuro | Arsitek Solusi Cloud Senior
Manjit Singh | Insinyur Perangkat Lunak
Christina Skarpathiotaki | Arsitek Solusi Cloud Senior
Nathan Widdup | Insinyur Fast-Track Senior Azure

Untuk melihat profil LinkedIn non-publik, masuk ke LinkedIn.

Bagikan melalui

Jenis layanan API visi

Layanan

Cara memilih layanan

Kasus penggunaan umum

Kontributor

Langkah berikutnya

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan:

Bagikan melalui

Jenis layanan API visi

Layanan

Cara memilih layanan

Kasus penggunaan umum

Kontributor

Langkah berikutnya

Sumber daya terkait

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: