Bagikan melalui


Distribusi Kolom (Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Di Microsoft SQL Server SQL Server Analysis Services, Anda dapat menentukan distribusi kolom dalam struktur penambangan, untuk memengaruhi cara algoritma memproses data di kolom tersebut saat membuat model penambangan. Untuk beberapa algoritma, berguna untuk menentukan distribusi kolom berkelanjutan apa pun sebelum Anda memproses model, jika kolom diketahui berisi distribusi nilai umum. Jika Anda tidak menentukan distribusi, model penambangan yang dihasilkan dapat menghasilkan prediksi yang kurang akurat daripada jika distribusi ditentukan, karena algoritma akan memiliki lebih sedikit informasi untuk menginterpretasikan data.

Algoritma yang tersedia di SQL Server Analysis Services mendukung jenis distribusi berikut:

Normal
Nilai untuk kolom berkelanjutan membentuk histogram dengan distribusi normal.

Histogram dengan histogram distribusi normal

Log Normal
Nilai untuk kolom berkelanjutan membentuk histogram, di mana kurva memanjang di ujung atas dan condong ke ujung bawah.

Histogram dengan histogram distribusi normal log

Seragam
Nilai untuk kolom berkelanjutan membentuk kurva datar, di mana semua nilai sama-sama mungkin.

Histogram dengan distribusi

Untuk informasi selengkapnya tentang algoritma yang SQL Server Analysis Services sediakan, lihat Algoritma Penggalian Data (Analysis Services - Penggalian Data).

Lihat juga

Tipe Isi (Penggalian Data)
Struktur Penambangan (Analysis Services - Penggalian Data)
Metode Diskretisasi (Penggalian Data)
Distribusi (DMX)
Kolom Struktur Penambangan