Melatih detektor objek

5 menit

Deteksi objek adalah bentuk penglihatan komputer ketika model dilatih untuk mendeteksi keberadaan dan lokasi salah satu atau beberapa kelas objek dalam gambar.

Foto dengan lokasi dan jenis buah yang terdeteksi.

Ada dua komponen untuk prediksi deteksi objek:

Label kelas tiap objek yang terdeteksi dalam gambar. Misalnya, Anda mungkin memastikan bahwa gambar berisi apel, jeruk, dan pisang.
Lokasi setiap objek dalam gambar, ditunjukkan sebagai koordinat kotak batas yang mengapit objek.

Untuk melatih model deteksi objek, Anda dapat menggunakan portal Azure AI Custom Vision untuk mengunggah dan memberi label gambar sebelum melatih, mengevaluasi, menguji, dan menerbitkan model; atau Anda dapat menggunakan REST API atau SDK khusus bahasa untuk menulis kode yang melakukan tugas pelatihan.

Pelabelan gambar

Anda dapat menggunakan Visi Kustom Azure AI untuk membuat proyek untuk klasifikasi gambar atau deteksi objek. Perbedaan paling signifikan antara melatih model klasifikasi gambar dan melatih model deteksi objek adalah pelabelan gambar dengan tag. Meskipun klasifikasi gambar memerlukan satu atau beberapa tag yang berlaku untuk seluruh gambar, deteksi objek mengharuskan setiap label terdiri dari tag dan wilayah yang menentukan kotak pembatas untuk setiap objek dalam gambar.

Melabeli gambar di portal Visi Kustom Azure AI

Portal Azure AI Custom Vision menyediakan antarmuka grafis yang dapat Anda gunakan untuk memberi label gambar pelatihan Anda.

Cuplikan layar gambar yang diberi tag di portal Visi Kustom Azure AI.

Opsi term mudah untuk melabeli gambar untuk deteksi objek adalah menggunakan antarmuka interaktif di portal Azure AI Custom Vision. Antarmuka ini secara otomatis menyarankan wilayah yang berisi objek, yang dapat Anda tetapkan tagnya atau sesuaikan dengan menyeret kotak pembatas untuk mengapit objek yang ingin Anda beri label.

Selain itu, setelah menandai kumpulan pertama gambar, Anda dapat melatih model tersebut. Pelabelan gambar baru berikutnya dapat memperoleh manfaat dari alat pelabel pintar di portal, yang dapat menyarankan tidak hanya wilayah, tetapi kelas objek yang dikandungnya.

Pendekatan pelabelan alternatif

Atau, Anda dapat menggunakan alat pelabelan kustom atau pihak ketiga, atau memilih untuk memberi label gambar secara manual, untuk memanfaatkan fitur lain, seperti menetapkan tugas pelabelan gambar ke beberapa anggota tim.

Jika Anda memilih untuk menggunakan alat pelabelan selain portal Azure AI Custom Vision, Anda mungkin perlu menyesuaikan output agar sesuai dengan unit pengukuran yang diharapkan oleh Azure AI Custom Vision API. Kotak pembatas ditentukan oleh empat nilai yang mewakili koordinat kiri (X) dan atas (Y) dari sudut kiri atas kotak pembatas, dan lebar dan tinggi kotak pembatas. Nilai-nilai ini dinyatakan sebagai nilai proporsional relatif terhadap ukuran gambar sumber. Misalnya, pertimbangkan kotak pembatas ini:

Kiri: 0,1
Atas: 0,5
Lebar: 0,5
Tinggi: 0,25

Ini mendefinisikan kotak di mana sisi kiri terletak 0,1 (satu persepuluh) dari tepi kiri gambar, dan sisi atas terletak 0,5 (setengah tinggi gambar) dari atas. Kotak memiliki setengah dari lebar dan seperempat dari tinggi gambar keseluruhan.

Gambar berikut menunjukkan informasi pelabelan dalam format JSON untuk objek dalam gambar.

Foto dengan label JSON untuk objek yang dikandungnya.

Saran dan Komentar

Apakah halaman ini membantu?