Mendapatkan wawasan deteksi objek

2025-06-05

Artikel ini memperlihatkan kepada Anda cara mendapatkan wawasan deteksi objek Azure AI Video Indexer. Deteksi objek adalah fitur yang mendeteksi dan melacak objek dalam video. Ini dapat digunakan untuk menemukan benda-benda seperti mobil, tas tangan, ranjang, dan laptop.

Objek yang didukung

pesawat
apel
ransel
pisang
sarung tangan bisbol
tempat tidur
bangku
sepeda
perahu
buku
botol
mangkok
brokoli
bis
kue

mobil
wortel
telepon genggam
kursi
Jam
tetikus komputer
Sofa
cangkir
meja makan
Donat
hidran api
garpu
frisbee

pengering rambut
tas tangan
sosis panggang
papan ketik
layang-layang
pisau
komputer jinjing
Mikrogelombang
sepeda motor
tetikus komputer
dasi
jeruk / oranye
pemanggang
meter parkir
pizza
tanaman pot

sandwich
gunting
wastafel
papan luncur
Ski
papan salju
sendok
bola olahraga
Tanda berhenti
koper
papan selancar
boneka beruang

raket tenis
pemanggang roti
kamar kecil
sikat gigi
lampu lalu lintas
kereta api
payung
vas
gelas anggur

Menampilkan insight JSON dengan portal web

Setelah Anda mengunggah dan mengindeks video, unduh wawasan dalam format JSON dari portal web.

Pilih tab Pustaka .
Pilih media yang Anda inginkan.
Pilih Unduh, lalu pilih Insight (JSON). File JSON terbuka di tab browser baru.
Temukan pasangan kunci yang dijelaskan dalam contoh respons.

Gunakan API

Gunakan permintaan Dapatkan Indeks Video . Teruskan &includeSummarizedInsights=false.
Temukan pasangan kunci yang dijelaskan dalam contoh respons.

Contoh tanggapan

Objek yang terdeteksi dan terlacak muncul di bawah detectedObjects dalam file insights.json yang diunduh. Setiap kali objek unik terdeteksi, objek diberi ID. Objek itu juga dilacak, yang berarti bahwa model mengawasi ketika objek yang terdeteksi kembali ke bingkai. Jika demikian, instans lain ditambahkan ke objek dengan waktu mulai dan akhir yang berbeda.

Dalam contoh ini, mobil pertama terdeteksi dan diberi ID 1 karena juga merupakan objek pertama yang terdeteksi. Kemudian, mobil yang berbeda terdeteksi dan mobil itu diberi ID 23 karena itu adalah objek dua puluh tiga yang terdeteksi. Kemudian, mobil pertama muncul lagi dan instans lain ditambahkan ke JSON. Berikut adalah JSON yang dihasilkan:

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]

Kunci	Definisi
Nomor Identitas	Jumlah ID yang bertambah secara berurutan dari objek yang terdeteksi dalam file media
Jenis	Jenis objek, misalnya, Mobil
ThumbnailID	GUID yang mewakili deteksi tunggal terhadap objek
nama tampil	Nama yang akan ditampilkan dalam pengalaman portal VI
WikiDataID	Pengidentifikasi unik dalam struktur WikiData
Contoh	Daftar semua instans yang dilacak
Keyakinan	Skor antara 0-1 menunjukkan keyakinan deteksi objek
Mulai Disesuaikan	waktu mulai video yang disesuaikan saat menggunakan editor
akhirDisesuaikan	waktu akhir video yang disesuaikan saat menggunakan editor
mulai	waktu objek muncul dalam bingkai
akhir	waktu objek tidak lagi muncul dalam bingkai

Komponen

Tidak ada komponen yang didefinisikan untuk deteksi objek.

Catatan transparansi

Penting

Baca ringkasan catatan transparansi untuk semua fitur VI. Setiap wawasan juga memiliki catatan transparansinya sendiri.

Ada hingga 20 deteksi per bingkai untuk pemrosesan standar dan tingkat lanjut, serta 35 lintasan per kelas.
Ukuran objek tidak boleh lebih besar dari 90 persen dari bingkai. Objek besar yang secara konsisten menjangkau sebagian besar bingkai mungkin tidak dikenali.
Objek kecil atau buram bisa sulit dideteksi. Mereka dapat dilewatkan atau salah diklasifikasikan (gelas anggur, cangkir).
Objek yang bersifat sementara dan muncul dalam beberapa bingkai mungkin tidak dikenali.
Faktor lain yang mungkin memengaruhi akurasi deteksi objek termasuk kondisi cahaya rendah, gerakan kamera, dan oklusi.
Azure AI Video Indexer hanya mendukung objek dunia nyata. Tidak ada dukungan untuk animasi atau CGI. Grafik yang dihasilkan komputer (seperti stiker berita) mungkin menghasilkan hasil yang aneh.
Pengikat, brosur, dan bahan tertulis lainnya cenderung terdeteksi sebagai Book.

Kode Sampel

Lihat semua sampel untuk VI