Bagikan melalui


Mendapatkan wawasan deteksi objek

Artikel ini memperlihatkan kepada Anda cara mendapatkan wawasan deteksi objek Azure AI Video Indexer. Deteksi objek adalah fitur yang mendeteksi dan melacak objek dalam video. Ini dapat digunakan untuk menemukan benda-benda seperti mobil, tas tangan, ranjang, dan laptop.

Objek yang didukung

  • pesawat
  • apel
  • ransel
  • pisang
  • sarung tangan bisbol
  • tempat tidur
  • bangku
  • sepeda
  • perahu
  • buku
  • botol
  • mangkok
  • brokoli
  • bis
  • kue
  • mobil
  • wortel
  • telepon genggam
  • kursi
  • Jam
  • tetikus komputer
  • Sofa
  • cangkir
  • meja makan
  • Donat
  • hidran api
  • garpu
  • frisbee
  • pengering rambut
  • tas tangan
  • sosis panggang
  • papan ketik
  • layang-layang
  • pisau
  • komputer jinjing
  • Mikrogelombang
  • sepeda motor
  • tetikus komputer
  • dasi
  • jeruk / oranye
  • pemanggang
  • meter parkir
  • pizza
  • tanaman pot
  • sandwich
  • gunting
  • wastafel
  • papan luncur
  • Ski
  • papan salju
  • sendok
  • bola olahraga
  • Tanda berhenti
  • koper
  • papan selancar
  • boneka beruang
  • raket tenis
  • pemanggang roti
  • kamar kecil
  • sikat gigi
  • lampu lalu lintas
  • kereta api
  • payung
  • vas
  • gelas anggur

Menampilkan insight JSON dengan portal web

Setelah Anda mengunggah dan mengindeks video, unduh wawasan dalam format JSON dari portal web.

  1. Pilih tab Pustaka .
  2. Pilih media yang Anda inginkan.
  3. Pilih Unduh, lalu pilih Insight (JSON). File JSON terbuka di tab browser baru.
  4. Temukan pasangan kunci yang dijelaskan dalam contoh respons.

Gunakan API

  1. Gunakan permintaan Dapatkan Indeks Video . Teruskan &includeSummarizedInsights=false.
  2. Temukan pasangan kunci yang dijelaskan dalam contoh respons.

Contoh tanggapan

Objek yang terdeteksi dan terlacak muncul di bawah detectedObjects dalam file insights.json yang diunduh. Setiap kali objek unik terdeteksi, objek diberi ID. Objek itu juga dilacak, yang berarti bahwa model mengawasi ketika objek yang terdeteksi kembali ke bingkai. Jika demikian, instans lain ditambahkan ke objek dengan waktu mulai dan akhir yang berbeda.

Dalam contoh ini, mobil pertama terdeteksi dan diberi ID 1 karena juga merupakan objek pertama yang terdeteksi. Kemudian, mobil yang berbeda terdeteksi dan mobil itu diberi ID 23 karena itu adalah objek dua puluh tiga yang terdeteksi. Kemudian, mobil pertama muncul lagi dan instans lain ditambahkan ke JSON. Berikut adalah JSON yang dihasilkan:

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]
Kunci Definisi
Nomor Identitas Jumlah ID yang bertambah secara berurutan dari objek yang terdeteksi dalam file media
Jenis Jenis objek, misalnya, Mobil
ThumbnailID GUID yang mewakili deteksi tunggal terhadap objek
nama tampil Nama yang akan ditampilkan dalam pengalaman portal VI
WikiDataID Pengidentifikasi unik dalam struktur WikiData
Contoh Daftar semua instans yang dilacak
Keyakinan Skor antara 0-1 menunjukkan keyakinan deteksi objek
Mulai Disesuaikan waktu mulai video yang disesuaikan saat menggunakan editor
akhirDisesuaikan waktu akhir video yang disesuaikan saat menggunakan editor
mulai waktu objek muncul dalam bingkai
akhir waktu objek tidak lagi muncul dalam bingkai

Komponen

Tidak ada komponen yang didefinisikan untuk deteksi objek.

Catatan transparansi

Penting

Baca ringkasan catatan transparansi untuk semua fitur VI. Setiap wawasan juga memiliki catatan transparansinya sendiri.

  • Ada hingga 20 deteksi per bingkai untuk pemrosesan standar dan tingkat lanjut, serta 35 lintasan per kelas.
  • Ukuran objek tidak boleh lebih besar dari 90 persen dari bingkai. Objek besar yang secara konsisten menjangkau sebagian besar bingkai mungkin tidak dikenali.
  • Objek kecil atau buram bisa sulit dideteksi. Mereka dapat dilewatkan atau salah diklasifikasikan (gelas anggur, cangkir).
  • Objek yang bersifat sementara dan muncul dalam beberapa bingkai mungkin tidak dikenali.
  • Faktor lain yang mungkin memengaruhi akurasi deteksi objek termasuk kondisi cahaya rendah, gerakan kamera, dan oklusi.
  • Azure AI Video Indexer hanya mendukung objek dunia nyata. Tidak ada dukungan untuk animasi atau CGI. Grafik yang dihasilkan komputer (seperti stiker berita) mungkin menghasilkan hasil yang aneh.
  • Pengikat, brosur, dan bahan tertulis lainnya cenderung terdeteksi sebagai Book.

Kode Sampel

Lihat semua sampel untuk VI