Mulai menggunakan deteksi objek di Azure

Selesai

Anda dapat membuat model pembelajaran mesin deteksi objek menggunakan teknik pembelajaran mendalam tingkat lanjut. Namun, pendekatan ini memerlukan keahlian yang signifikan dan data pelatihan dalam jumlah besar. Layanan Azure AI Custom Vision di Azure memungkinkan Anda membuat model deteksi objek yang memenuhi kebutuhan banyak skenario visi komputer dengan keahlian pembelajaran mendalam minimal dan lebih sedikit gambar pelatihan.

Sumber daya Azure untuk Azure AI Custom Vision

Membuat solusi deteksi objek dengan Azure AI Custom Vision terdiri dari tiga tugas utama:

  • Mengunggah dan menandai gambar
  • Melatih model
  • Menerbitkan model terlatih sehingga aplikasi klien dapat menggunakannya untuk menghasilkan prediksi

Untuk setiap tugas ini, Anda memerlukan sumber daya di langganan Azure Anda. Anda dapat menggunakan jenis sumber daya berikut:

  • Custom Vision: Sumber daya khusus untuk Azure AI Custom Vision. Anda dapat membuat sumber daya pelatihan , sumber daya prediksi , atau sumber daya pelatihan dan prediksi .
  • Layanan Azure AI: Sumber daya umum yang menyertakan Visi Kustom Azure AI bersama dengan banyak layanan Azure AI lainnya. Anda dapat menggunakan jenis sumber daya ini untuk pelatihan,prediksi, atau keduanya.

Pemisahan sumber daya pelatihan dan prediksi berguna ketika Anda ingin melacak pemanfaatan sumber daya untuk pelatihan model secara terpisah dari aplikasi klien menggunakan model untuk memprediksi kelas gambar. Namun, hal tersebut dapat membuat pengembangan solusi klasifikasi gambar sedikit membingungkan.

Pendekatan paling sederhana adalah menggunakan sumber daya layanan Azure AI umum untuk pelatihan dan prediksi. Ketika Anda menggunakan sumber daya umum, Anda hanya perlu khawatir dengan satu titik akhir (alamat HTTP tempat layanan Anda dihosting) dan kunci (nilai rahasia yang digunakan oleh aplikasi klien untuk mengautentikasi diri mereka sendiri).

Jika Anda memilih untuk membuat sumber daya Custom Vision, Anda dapat memilih pelatihan, prediksi, atau keduanya. Penting untuk dicatat bahwa jika Anda memilih "keduanya", maka dua sumber daya dibuat - satu untuk pelatihan dan satu untuk prediksi.

Dimungkinkan juga untuk mengambil pendekatan mix-and-match di mana Anda menggunakan sumber daya Custom Vision khusus untuk pelatihan, tetapi menyebarkan model Anda ke sumber daya layanan Azure AI untuk prediksi. Dengan pendekatan ini, pastikan sumber daya pelatihan dan prediksi dibuat di wilayah yang sama.

Penandaan gambar

Sebelum dapat melatih model deteksi objek, Anda harus menandai kelas dan koordinat kotak pembatas dalam serangkaian gambar pelatihan. Proses ini bisa memakan waktu, tetapi portal Custom Vision menyediakan antarmuka grafis yang memudahkannya. Antarmuka dapat secara otomatis mendeteksi objek diskrit dalam gambar dan menyarankan area tersebut kepada Anda. Anda dapat menerapkan label kelas ke kotak pembatas yang disarankan ini atau menyeret untuk menyesuaikan area kotak pembatas. Selain itu, setelah memberi tag dan pelatihan dengan himpunan data awal, Azure AI Computer Vision dapat menggunakan penandaan cerdas untuk menyarankan kelas dan kotak pembatas untuk gambar yang Anda tambahkan ke himpunan data pelatihan.

Perlu diingat beberapa pertimbangan utama saat menandai gambar pelatihan untuk deteksi objek. Pastikan Anda memiliki gambar objek yang memadai yang dimaksud, sebaiknya dari beberapa sudut. Penting juga untuk memastikan bahwa kotak pembatas ketat di sekitar setiap objek.

Pelatihan dan evaluasi model

Untuk melatih model, Anda dapat menggunakan portal Custom Vision, atau jika Anda memiliki pengalaman pengodean yang diperlukan, Anda dapat menggunakan salah satu kit pengembangan perangkat lunak (SDK) khusus bahasa pemrograman Azure AI Custom Vision. Melatih model deteksi objek dapat memakan waktu, tergantung pada jumlah gambar pelatihan, kelas, dan objek dalam setiap gambar.

Proses pelatihan model adalah proses berulang. Azure AI Custom Vision berulang kali melatih model menggunakan beberapa data, tetapi menahan beberapa untuk mengevaluasi model. Di akhir proses pelatihan, Anda dapat menggunakan metrik evaluasi berikut untuk menilai performa model terlatih:

  • Presisi: Berapa persentase prediksi kelas yang diidentifikasi model dengan benar? Misalnya, jika model memprediksi bahwa 10 gambar adalah jeruk, dengan delapan di antaranya sebenarnya adalah jeruk, presisinya adalah 0,8 (80%).
  • Pengenalan: Berapa persentase prediksi kelas yang dibuat model yang benar? Misalnya, jika ada 10 gambar apel, dan model menemukan 7 di antaranya, pengenalannya adalah 0,7 (70%).
  • Presisi Rata-Rata Rata (mAP): Metrik keseluruhan yang memperhitungkan presisi dan pengenalan di semua kelas.

Menggunakan model untuk prediksi

Setelah melatih model, dan puas dengan evaluasi performanya, Anda dapat menerbitkan model ke sumber daya prediksi Anda. Saat menerbitkan model, Anda dapat memberi nama model tersebut (defaultnya adalah "PerulanganX", dengan X adalah berapa kali Anda sudah melatih model).

Untuk menggunakan model Anda, pengembang aplikasi klien memerlukan informasi berikut:

  • ID Proyek: ID unik proyek Custom Vision yang Anda buat untuk melatih model.
  • Nama model: Nama yang Anda tetapkan ke model selama penerbitan.
  • Titik akhir prediksi: Alamat HTTP titik akhir untuk sumber daya prediksi tempat Anda menerbitkan model (bukan sumber daya pelatihan).
  • Kunci prediksi: Kunci autentikasi untuk sumber daya prediksi tempat Anda menerbitkan model (bukan sumber daya pelatihan).