Bagikan melalui


Distribusi Kolom (Penambangan Data)

Berlaku untuk: SQL Server 2019 dan versi Analysis Services sebelumnya Azure Analysis Services Fabric/Power BI Premium

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Di Microsoft SQL Server SQL Server Analysis Services, Anda dapat menentukan distribusi kolom dalam struktur penambangan, untuk memengaruhi cara algoritma memproses data di kolom tersebut saat membuat model penambangan. Untuk beberapa algoritma, berguna untuk menentukan distribusi kolom berkelanjutan sebelum Anda memproses model, jika kolom diketahui berisi distribusi nilai umum. Jika Anda tidak menentukan distribusi, model penambangan yang dihasilkan dapat menghasilkan prediksi yang kurang akurat daripada jika distribusi ditentukan, karena algoritma akan memiliki lebih sedikit informasi untuk menginterpretasikan data.

Algoritma yang tersedia di SQL Server Analysis Services mendukung jenis distribusi berikut:

Normal
Nilai untuk kolom berkelanjutan membentuk histogram dengan distribusi normal.

Histogram dengan distribusi normal

Log Normal
Nilai untuk kolom berkelanjutan membentuk histogram, di mana kurva memanjang di ujung atas dan condong ke ujung bawah.

Histogram dengan distribusi log-normal

Seragam
Nilai untuk kolom berkelanjutan membentuk kurva datar, di mana semua nilai kemungkinannya sama.

Histogram dengan distribusi seragam

Untuk informasi selengkapnya tentang algoritma yang disediakan SQL Server Analysis Services, lihat Algoritma Penggalian Data (Analysis Services - Data Mining).

Lihat Juga

Tipe Konten (Penggalian Data)
Struktur Pertambangan (Analysis Services - Penggalian Data)
Metode Diskretisasi (Penggalian Data)
Distribusi (DMX)
Kolom Struktur Penambangan