Bagikan melalui


Kualitas data dan pemantauan kualitas

Setiap Produk Data yang bekerja pada platform Azure Operator Insights memiliki dukungan bawaan untuk pemantauan kualitas data. Kualitas data sangat penting karena memastikan informasi yang akurat, andal, dan dapat dipercaya untuk pengambilan keputusan. Ini mencegah kesalahan yang mahal, membangun kredibilitas dengan pelanggan dan regulator, dan memungkinkan pengalaman yang dipersonalisasi.

Platform Azure Operator Insights memantau kualitas data saat data diserap ke dalam penyimpanan input Produk Data (blok Input Produk Data dalam gambar berikut) dan setelah data diproses dan disediakan untuk pelanggan (blok Komputasi Produk Data dalam gambar berikut).

Diagram agen penyerapan dan Produk Data untuk Wawasan Operator Azure

Dimensi kualitas

Dimensi kualitas data adalah berbagai aspek atau karakteristik yang menentukan kualitas data. Azure Operator Insights mendukung dimensi berikut:

  • Akurasi - Mengacu pada seberapa baik data mencerminkan realitas, misalnya, nama, alamat, dan data terbaru yang benar. Akurasi data yang tinggi memungkinkan Anda menghasilkan analitik yang dapat dipercaya dan mengarah pada pelaporan yang benar dan pengambilan keputusan yang percaya diri.
  • Kelengkapan - Mengacu pada apakah semua data yang diperlukan untuk penggunaan tertentu ada dan tersedia untuk digunakan. Kelengkapan tidak hanya berlaku di tingkat item data tetapi juga pada tingkat rekaman. Kelengkapan membantu memahami apakah data yang hilang akan memengaruhi keandalan wawasan dari data.
  • Keunikan - Mengacu pada tidak adanya duplikat dalam himpunan data.
  • Konsistensi - Mengacu pada apakah elemen data yang sama tidak bertentangan di berbagai sumber atau dari waktu ke waktu. Konsistensi memastikan bahwa data seragam dan dapat dibandingkan di berbagai sumber.
  • Kewajaran waktu - Mengacu pada apakah data sudah diperbarui dan tersedia saat diperlukan. Kewajaran waktu memastikan bahwa data relevan dan berguna untuk pengambilan keputusan.
  • Validitas - Mengacu pada apakah data sesuai dengan sekumpulan aturan atau batasan yang ditentukan.

Metrik

Semua dimensi kualitas data dicakup oleh metrik berkualitas yang diproduksi oleh platform Azure Operator Insights. Ada dua jenis metrik kualitas:

  • Dasar - Kumpulan pemeriksaan standar di semua Produk Data.
  • Kustom - Serangkaian pemeriksaan kustom, memungkinkan semua Produk Data untuk menerapkan pemeriksaan yang khusus untuk produk mereka.

Metrik kualitas dasar yang dihasilkan oleh platform tersedia dalam tabel berikut.

Metrik Dimensi Sumber data
Jumlah baris yang diserap Ketepatan waktu Tertelan
Jumlah baris yang berisi null untuk kolom yang diperlukan Kelengkapan Tertelan
Jumlah baris yang gagal divalidasi terhadap skema Validitas Tertelan
Jumlah baris yang difilter Kelengkapan Tertelan
Jumlah baris yang diproses Ketepatan waktu Diproses
Jumlah baris yang tidak lengkap, yang tidak berisi data yang diperlukan Kelengkapan Diproses
Jumlah baris duplikat Keunikan Diproses
Persentil untuk jeda keseluruhan antara pembuatan rekaman dan tersedia untuk kueri Ketepatan waktu Diproses
Persentil untuk jeda antara pembuatan rekaman dan diserap ke dalam penyimpanan input Ketepatan waktu Diproses
Persentil untuk jeda antara data yang diserap dan diproses Ketepatan waktu Diproses
Persentil untuk jeda antara data yang diproses dan tersedia untuk kueri Ketepatan waktu Diproses
Usia untuk tampilan materialisasi Ketepatan waktu Diproses

Metrik kualitas data kustom diimplementasikan berdasarkan per Produk Data. Metrik ini mencakup dimensi akurasi dan konsistensi. Dokumentasi Produk Data berisi deskripsi untuk metrik kualitas kustom yang tersedia.

Pemantauan

Semua Produk Data Wawasan Operator Azure disebarkan dengan dasbor yang menunjukkan metrik berkualitas. Anda dapat menggunakan dasbor untuk memantau kualitas data mereka.

Semua metrik kualitas data disimpan ke tabel Data Product ADX. Untuk eksplorasi metrik kualitas data, Anda dapat menggunakan titik akhir KQL Produk Data standar lalu memperluas dasbor jika perlu.