Contoh Kueri Model Pengklusteran
Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Saat Membuat kueri terhadap model penggalian data, Anda dapat mengambil metadata tentang model, atau membuat kueri konten yang menyediakan detail tentang pola yang ditemukan dalam analisis. Atau, Anda dapat membuat kueri prediksi, yang menggunakan pola dalam model untuk membuat prediksi untuk data baru. Setiap jenis kueri akan memberikan informasi yang berbeda. Misalnya, kueri konten mungkin memberikan detail tambahan tentang kluster yang ditemukan, sedangkan kueri prediksi mungkin memberi tahu Anda di kluster mana titik data baru kemungkinan besar berada.
Bagian ini menjelaskan cara membuat kueri untuk model yang didasarkan pada algoritma Pengklusteran Microsoft.
Kueri Konten
Mendapatkan Metadata Model dengan Menggunakan DMX
Mengambil Metadata Model dari Set Baris Skema
Mengembalikan Kluster atau Daftar Kluster
Mengembalikan Atribut untuk Kluster
Mengembalikan Profil Kluster Menggunakan Prosedur Tersimpan Sistem
Menemukan Faktor Diskriminasi untuk Kluster
Mengembalikan Kasus yang Termasuk dalam Kluster
Kueri Prediksi
Memprediksi Hasil dari Model Pengklusteran
Menentukan Keanggotaan Kluster
Mengembalikan Semua Kluster yang Mungkin dengan Probabilitas dan Jarak
Menemukan Informasi tentang Model
Semua model penambangan mengekspos konten yang dipelajari oleh algoritma sesuai dengan skema standar, set baris skema model penambangan. Anda dapat membuat kueri terhadap kumpulan baris skema model penambangan dengan menggunakan pernyataan Ekstensi Penggalian Data (DMX). Pada SQL Server 2017, Anda juga dapat mengkueri kumpulan baris skema secara langsung sebagai tabel sistem.
Kueri Sampel 1: Mendapatkan Metadata Model dengan Menggunakan DMX
Kueri berikut mengembalikan metadata dasar tentang model pengklusteran, TM_Clustering
, yang Anda buat di Tutorial Penggalian Data Dasar. Metadata yang tersedia dalam simpul induk model pengklusteran mencakup nama model, database tempat model disimpan, dan jumlah simpul anak dalam model. Kueri ini menggunakan kueri konten DMX untuk mengambil metadata dari simpul induk model:
SELECT MODEL_CATALOG, MODEL_NAME, NODE_CAPTION,
NODE_SUPPORT, [CHILDREN_CARDINALITY], NODE_DESCRIPTION
FROM TM_Clustering.CONTENT
WHERE NODE_TYPE = 1
Catatan
Anda harus menyertakan nama kolom, CHILDREN_CARDINALITY, dalam tanda kurung siku untuk membedakannya dari kata kunci yang dicadangkan Ekspresi Multidimensi (MDX) dengan nama yang sama.
Contoh hasil:
Baris | Metadata |
---|---|
MODEL_CATALOG | TM_Clustering |
MODEL_NAME | Adventure Works DW |
NODE_CAPTION | Model Kluster |
NODE_SUPPORT | 12939 |
CHILDREN_CARDINALITY | 10 |
NODE_DESCRIPTION | Semua |
Untuk definisi apa arti kolom ini dalam model pengklusteran, lihat Menambang Konten Model untuk Model Pengklusteran (Analysis Services - Penggalian Data).
Kueri Sampel 2: Mengambil Metadata Model dari Set Baris Skema
Dengan mengkueri himpunan baris skema penggalian data, Anda bisa menemukan informasi yang sama yang dikembalikan dalam kueri konten DMX. Namun, kumpulan baris skema menyediakan beberapa kolom tambahan. Ini termasuk parameter yang digunakan saat model dibuat, tanggal dan waktu model terakhir diproses, dan pemilik model.
Contoh berikut mengembalikan tanggal model dibuat, dimodifikasi, dan terakhir diproses, bersama dengan parameter pengklusteran yang digunakan untuk membangun model, dan ukuran set pelatihan. Informasi ini dapat berguna untuk mendikumentasikan model, atau untuk menentukan opsi pengklusteran mana yang digunakan untuk membuat model yang ada.
SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_Clustering'
Contoh hasil:
Baris | Metadata |
---|---|
MODEL_NAME | TM_Clustering |
DATE_CREATED | 12/10/2007 19:42:51 WIB |
LAST_PROCESSED | 12/10/2007 20:09:54 PM |
PREDICTION_ENTITY | Pembeli Sepeda |
MINING_PARAMETERS | CLUSTER_COUNT=10, CLUSTER_SEED=0, CLUSTERING_METHOD=1, MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_STATES=100, MINIMUM_SUPPORT=1, MODELLING_CARDINALITY=10, SAMPLE_SIZE=50000, STOPPING_TOLERANCE=10 |
Menemukan Informasi tentang Kluster
Kueri konten yang paling berguna pada model pengklusteran umumnya mengembalikan jenis informasi yang sama yang dapat Anda telusuri dengan menggunakan Penampil Kluster. Ini termasuk profil kluster, karakteristik kluster, dan diskriminasi kluster. Bagian ini menyediakan contoh kueri yang mengambil informasi ini.
Kueri Sampel 3: Mengembalikan Kluster atau Daftar Kluster
Karena semua kluster memiliki jenis node 5, Anda dapat dengan mudah mengambil daftar kluster dengan mengkueri konten model hanya untuk simpul jenis tersebut. Anda juga dapat memfilter simpul yang dikembalikan oleh probabilitas atau dukungan, seperti yang ditunjukkan dalam contoh ini.
SELECT NODE_NAME, NODE_CAPTION ,NODE_SUPPORT, NODE_DESCRIPTION
FROM TM_Clustering.CONTENT
WHERE NODE_TYPE = 5 AND NODE_SUPPORT > 1000
Contoh hasil:
Baris | Metadata |
---|---|
NODE_NAME | 002 |
NODE_CAPTION | Kluster 2 |
NODE_SUPPORT | 1649 |
NODE_DESCRIPTION | Pendidikan Bahasa Inggris=Gelar Pascasarjana , 32 <=Usia <=48 , Jumlah Mobil Yang Dimiliki=0 , 35964.0771121808 <=Pendapatan Tahunan <=97407.7163393957 , English Occupation=Professional , Perjalanan Distance=2-5 Miles , Region=Amerika Utara , Pembeli Sepeda=1 , Jumlah Anak Di Rumah=0 , Nomor Mobil Yang Dimiliki=1 , Perjalanan Distance=0-1 Miles , English Education=Bachelors , Total Children=1 , Number Children At Home=2 , English Occupation=Skilled Manual , Marital Status=S , Total Children=0 , House Owner Flag=0 , Gender=F , Total Children=2 , Region=Pacific |
Atribut yang menentukan kluster dapat ditemukan dalam dua kolom dalam himpunan baris skema penambangan data.
Kolom NODE_DESCRIPTION berisi daftar atribut yang dipisahkan koma. Perhatikan bahwa daftar atribut mungkin disingkat untuk tujuan tampilan.
Tabel berlapis di kolom NODE_DISTRIBUTION berisi daftar lengkap atribut untuk kluster. Jika klien Anda tidak mendukung kumpulan baris hierarkis, Anda dapat mengembalikan tabel berlapis dengan menambahkan kata kunci FLATTENED sebelum daftar kolom SELECT. Untuk informasi selengkapnya tentang penggunaan kata kunci FLATTENED, lihat MODEL> SELECT FROM<. KONTEN (DMX).
Kueri Sampel 4: Mengembalikan Atribut untuk Kluster
Untuk setiap kluster, Penampil Kluster menampilkan profil yang mencantumkan atribut dan nilainya. Penampil juga menampilkan histogram yang menunjukkan distribusi nilai untuk seluruh populasi kasus dalam model. Jika Anda menelusuri model di penampil, Anda dapat dengan mudah menyalin histogram dari Legenda Penambangan lalu menempelkannya ke Excel atau dokumen Word. Anda juga dapat menggunakan panel Karakteristik Kluster penampil untuk membandingkan atribut kluster yang berbeda secara grafis.
Namun, jika Anda harus mendapatkan nilai untuk lebih dari satu kluster sekaligus, lebih mudah untuk mengkueri model. Misalnya, ketika Anda menelusuri model, Anda mungkin melihat bahwa dua kluster teratas berbeda sehubungan dengan satu atribut, Number Cars Owned
. Oleh karena itu, Anda ingin mengekstrak nilai untuk setiap kluster.
SELECT TOP 2 NODE_NAME,
(SELECT ATTRIBUTE_VALUE, [PROBABILITY] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Number Cars Owned')
AS t
FROM [TM_Clustering].CONTENT
WHERE NODE_TYPE = 5
Baris pertama kode menentukan bahwa Anda hanya menginginkan dua kluster teratas.
Catatan
Secara default, kluster diurutkan berdasarkan dukungan. Oleh karena itu, kolom NODE_SUPPORT dapat dihilangkan.
Baris kedua kode menambahkan pernyataan sub-pilih yang hanya mengembalikan kolom tertentu dari kolom tabel berlapis. Selain itu, ini membatasi baris dari tabel berlapis untuk yang terkait dengan atribut target, Number Cars Owned
. Untuk menyederhanakan tampilan, tabel berlapis diberi alias.
Catatan
Kolom tabel berlapis, PROBABILITY
, harus diapit dalam tanda kurung siku karena juga merupakan nama kata kunci MDX yang dipesan.
Contoh hasil:
NODE_NAME | T.ATTRIBUTE_VALUE | PROBABILITAS T. |
---|---|---|
001 | 2 | 0.829207754 |
001 | 1 | 0.109354156 |
001 | 3 | 0.034481552 |
001 | 4 | 0.013503302 |
001 | 0 | 0.013453236 |
001 | Tidak ada | 0 |
002 | 0 | 0.576980023 |
002 | 1 | 0.406623939 |
002 | 2 | 0.016380082 |
002 | 3 | 1,60E-05 |
002 | 4 | 0 |
002 | Tidak ada | 0 |
Kueri Sampel 5: Mengembalikan Profil Kluster Menggunakan Prosedur Tersimpan Sistem
Sebagai pintasan, daripada menulis kueri Anda sendiri dengan menggunakan DMX, Anda juga dapat memanggil prosedur tersimpan sistem yang SQL Server Analysis Services gunakan untuk bekerja dengan kluster. Contoh berikut menggambarkan cara menggunakan prosedur tersimpan internal untuk mengembalikan profil untuk kluster dengan ID 002.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterProfiles('TM_Clustering", '002',0.0005
Demikian pula, Anda dapat menggunakan prosedur tersimpan sistem untuk mengembalikan karakteristik kluster tertentu, seperti yang ditunjukkan dalam contoh berikut:
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('TM_Clustering", '009',0.0005
Contoh hasil:
Atribut | Nilai | Frekuensi | Dukungan |
---|---|---|---|
Jumlah Anak di Rumah | 0 | 0.999999829076798 | 899 |
Wilayah | Amerika Utara | 0.999852875241508 | 899 |
Total Anak | 0 | 0.993860958572323 | 893 |
Catatan
Prosedur tersimpan sistem penggalian data adalah untuk penggunaan internal dan Microsoft berhak untuk mengubahnya sesuai kebutuhan. Untuk penggunaan produksi, kami sarankan Anda membuat kueri dengan menggunakan DMX, AMO, atau XMLA.
Kueri Sampel 6: Menemukan Faktor Diskriminasi untuk Kluster
Tab Diskriminasi Kluster dari Penampil Kluster memungkinkan Anda untuk dengan mudah membandingkan kluster dengan kluster lain, atau membandingkan kluster dengan semua kasus yang tersisa (pelengkap kluster).
Namun, membuat kueri untuk mengembalikan informasi ini bisa rumit, dan Anda mungkin memerlukan beberapa pemrosesan tambahan pada klien untuk menyimpan hasil sementara dan membandingkan hasil dua kueri atau lebih. Sebagai pintasan, Anda dapat menggunakan prosedur tersimpan sistem.
Kueri berikut mengembalikan satu tabel yang menunjukkan faktor diskriminasi utama antara dua kluster yang memiliki ID simpul 009 dan 007. Atribut dengan nilai positif mendukung kluster 009, sedangkan atribut dengan nilai negatif mendukung kluster 007.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('TM_Clustering','009','007',0.0005,true)
Contoh hasil:
Atribut | Nilai | Skor |
---|---|---|
Wilayah | Amerika Utara | 100 |
Pekerjaan Bahasa Inggris | Manual Terampil | 94.9003803898654 |
Wilayah | Eropa | -72.5041051379789 |
Pekerjaan Bahasa Inggris | Manual | -69.6503163202722 |
Ini adalah informasi yang sama yang disajikan dalam bagan penampil Diskriminasi Kluster jika Anda memilih Kluster 9 dari daftar drop-down pertama dan Kluster 7 dari daftar drop-down kedua. Untuk membandingkan kluster 9 dengan pelengkapnya, Anda menggunakan string kosong di parameter kedua, seperti yang ditunjukkan dalam contoh berikut:
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('TM_Clustering','009','',0.0005,true)
Catatan
Prosedur tersimpan sistem penggalian data adalah untuk penggunaan internal dan Microsoft berhak untuk mengubahnya sesuai kebutuhan. Untuk penggunaan produksi, kami sarankan Anda membuat kueri dengan menggunakan DMX, AMO, atau XMLA.
Kueri Sampel 7: Mengembalikan Kasus milik Kluster
Jika penelusuran telah diaktifkan pada model penambangan, Anda dapat membuat kueri yang mengembalikan informasi terperinci tentang kasus yang digunakan dalam model. Selain itu, jika penelusuran telah diaktifkan pada struktur penambangan, Anda dapat menyertakan kolom dari struktur dasar dengan menggunakan fungsi StructureColumn (DMX).
Contoh berikut mengembalikan dua kolom yang digunakan dalam model, Usia dan Wilayah, dan satu kolom lagi, Nama Depan, yang tidak digunakan dalam model. Kueri hanya mengembalikan kasus yang diklasifikasikan ke dalam Kluster 1.
SELECT [Age], [Region], StructureColumn('First Name')
FROM [TM_Clustering].CASES
WHERE IsInNode('001')
Untuk mengembalikan kasus yang termasuk dalam kluster, Anda harus mengetahui ID kluster. Anda dapat memperoleh ID kluster dengan menelusuri model di salah satu pemirsa. Atau, Anda dapat mengganti nama kluster untuk referensi yang lebih mudah, setelah itu Anda dapat menggunakan nama sebagai pengganti nomor ID. Namun, ketahuilah bahwa nama yang Anda tetapkan ke kluster akan hilang jika model diproses ulang.
Membuat Prediksi menggunakan Model
Meskipun pengklusteran biasanya digunakan untuk menjelaskan dan memahami data, implementasi Microsoft juga memungkinkan Anda membuat prediksi tentang keanggotaan kluster, dan mengembalikan probabilitas yang terkait dengan prediksi. Bagian ini menyediakan contoh cara membuat kueri prediksi pada model pengklusteran. Anda bisa membuat prediksi untuk beberapa kasus, dengan menentukan sumber data tabular, atau Anda bisa memberikan nilai baru pada satu waktu dengan membuat kueri singleton. Untuk kejelasan, contoh di bagian ini adalah semua kueri singleton.
Untuk informasi selengkapnya tentang cara membuat kueri prediksi menggunakan DMX, lihat Alat Kueri Penggalian Data.
Kueri Sampel 8: Memprediksi Hasil dari Model Pengklusteran
Jika model pengklusteran yang Anda buat berisi atribut yang dapat diprediksi, Anda dapat menggunakan model untuk membuat prediksi tentang hasil. Namun, model menangani atribut yang dapat diprediksi secara berbeda tergantung pada apakah Anda mengatur kolom yang dapat diprediksi ke Predict atau PredictOnly. Jika Anda mengatur penggunaan kolom ke Prediksi, nilai untuk atribut tersebut ditambahkan ke model pengklusteran dan muncul sebagai atribut dalam model yang sudah selesai. Namun, jika Anda mengatur penggunaan kolom ke PredictOnly, nilai tidak digunakan untuk membuat kluster. Sebaliknya, setelah mode selesai, algoritma pengklusteran membuat nilai baru untuk atribut PredictOnly berdasarkan kluster tempat setiap kasus berada.
Kueri berikut ini menyediakan satu kasus baru untuk model, di mana satu-satunya informasi tentang kasus ini adalah usia dan jenis kelamin. Pernyataan SELECT menentukan pasangan atribut/nilai yang dapat diprediksi yang Anda minati, dan fungsi PredictProbability (DMX) memberi tahu Anda probabilitas bahwa kasus dengan atribut tersebut akan memiliki hasil yang ditargetkan.
SELECT
[TM_Clustering].[Bike Buyer], PredictProbability([Bike Buyer],1)
FROM
[TM_Clustering]
NATURAL PREDICTION JOIN
(SELECT 40 AS [Age],
'F' AS [Gender]) AS t
Contoh hasil saat penggunaan diatur ke Prediksi:
Pembeli Sepeda | Ekspresi |
---|---|
1 | 0.592924735740338 |
Contoh hasil saat penggunaan diatur ke PredictOnly dan model diolah ulang:
Pembeli Sepeda | Ekspresi |
---|---|
1 | 0.55843544003102 |
Dalam contoh ini, perbedaan dalam model tidak signifikan. Namun, terkadang penting untuk mendeteksi perbedaan antara distribusi nilai aktual dan apa yang diprediksi model. Fungsi PredictCaseLikelihood (DMX) berguna dalam skenario ini, karena memberi tahu Anda seberapa besar kemungkinan kasus, mengingat model.
Angka yang dikembalikan oleh fungsi PredictCaseLikelihood adalah probabilitas, dan oleh karena itu selalu antara 0 dan 1, dengan nilai .5 mewakili hasil acak. Oleh karena itu, skor kurang dari .5 berarti bahwa kasus yang diprediksi tidak mungkin, mengingat model, dan skor di atas.5 menunjukkan bahwa kasus yang diprediksi lebih mungkin daripada tidak sesuai dengan model.
Misalnya, kueri berikut mengembalikan dua nilai yang mencirikan kemungkinan kasus sampel baru. Nilai yang tidak dinormalisasi mewakili probabilitas mengingat model saat ini. Saat Anda menggunakan kata kunci NORMALIZED, skor kemungkinan yang dikembalikan oleh fungsi disesuaikan dengan membalik "probabilitas dengan model" dengan "probabilitas tanpa model".
SELECT
PredictCaseLikelihood(NORMALIZED) AS [NormalizedValue], PredictCaseLikelihood(NONNORMALIZED) AS [NonNormalizedValue]
FROM
[TM_Clustering_PredictOnly]
NATURAL PREDICTION JOIN
(SELECT 40 AS [Age],
'F' AS [Gender]) AS t
Contoh hasil:
NormalizedValue | NonNormalizedValue |
---|---|
5.56438372679893E-11 | 8.65459953145182E-68 |
Perhatikan bahwa angka-angka dalam hasil ini dinyatakan dalam notasi ilmiah.
Kueri Sampel 9: Menentukan Keanggotaan Kluster
Contoh ini menggunakan fungsi Cluster (DMX) untuk mengembalikan kluster tempat kasus baru kemungkinan besar berada, dan menggunakan fungsi ClusterProbability (DMX) untuk mengembalikan probabilitas untuk keanggotaan dalam kluster tersebut.
SELECT Cluster(), ClusterProbability()
FROM
[TM_Clustering]
NATURAL PREDICTION JOIN
(SELECT 40 AS [Age],
'F' AS [Gender],
'S' AS [Marital Status]) AS t
Contoh hasil:
$CLUSTER | Ekspresi |
---|---|
Kluster 2 | 0.397918596951617 |
Catatan Secara default, fungsi ClusterProbability mengembalikan probabilitas kluster yang paling mungkin. Namun, Anda dapat menentukan kluster yang berbeda dengan menggunakan sintaks ClusterProbability('cluster name')
. Jika Anda melakukan ini, ketahuilah bahwa hasil dari setiap fungsi prediksi tidak bergantung pada hasil lainnya. Oleh karena itu, skor probabilitas di kolom kedua dapat merujuk ke kluster yang berbeda dari kluster yang dinamai di kolom pertama.
Kueri Sampel 10: Mengembalikan Semua Kluster yang Mungkin dengan Probabilitas dan Jarak
Dalam contoh sebelumnya, skor probabilitas tidak terlalu tinggi. Untuk menentukan apakah ada kluster yang lebih baik, Anda dapat menggunakan fungsi PredictHistogram (DMX) bersama dengan fungsi Kluster (DMX) untuk mengembalikan tabel berlapis yang mencakup semua kluster yang mungkin, bersama dengan probabilitas bahwa kasus baru milik setiap kluster. Kata kunci FLATTENED digunakan untuk mengubah kumpulan baris hierarkis menjadi tabel datar untuk tampilan yang lebih mudah.
SELECT FLATTENED PredictHistogram(Cluster())
From
[TM_Clustering]
NATURAL PREDICTION JOIN
(SELECT 40 AS [Age],
'F' AS [Gender],
'S' AS [Marital Status])
Expression.$CLUSTER | Expression.$DISTANCE | Expression.$PROBABILITY |
---|---|---|
Kluster 2 | 0.602081403048383 | 0.397918596951617 |
Kluster 10 | 0.719691686785675 | 0.280308313214325 |
Kluster 4 | 0.867772590378791 | 0.132227409621209 |
Kluster 5 | 0.931039872200985 | 0.0689601277990149 |
Kluster 3 | 0.942359230072167 | 0.0576407699278328 |
Kluster 6 | 0.958973668972756 | 0.0410263310272437 |
Kluster 7 | 0.979081275926724 | 0.0209187240732763 |
Kluster 1 | 0.999169044818624 | 0.000830955181376364 |
Kluster 9 | 0.999831227795894 | 0.000168772204105754 |
Kluster 8 | 1 | 0 |
Secara default, hasilnya diberi peringkat berdasarkan probabilitas. Hasilnya memberi tahu Anda bahwa, meskipun probabilitas untuk Kluster 2 cukup rendah, Kluster 2 masih yang paling cocok untuk titik data baru.
Catatan Kolom tambahan, $DISTANCE
, mewakili jarak dari titik data ke kluster. Secara default, Algoritma Pengklusteran Microsoft menggunakan pengklusteran EM yang dapat diskalakan, yang menetapkan beberapa kluster ke setiap titik data dan memberi peringkat pada kluster yang mungkin. Namun, jika Anda membuat model pengklusteran menggunakan algoritma K-means, hanya satu kluster yang dapat ditetapkan ke setiap titik data, dan kueri ini hanya akan mengembalikan satu baris. Memahami perbedaan ini diperlukan untuk menginterpretasikan hasil fungsi PredictCaseLikelihood (DMX). Untuk informasi selengkapnya tentang perbedaan antara pengklusteran EM dan K-means, lihat Referensi Teknis Algoritma Pengklusteran Microsoft.
Daftar Fungsi
Semua algoritma Microsoft mendukung serangkaian fungsi umum. Namun, model yang dibangun dengan menggunakan algoritma Microsoft Clustering mendukung fungsi tambahan yang tercantum dalam tabel berikut.
Fungsi Prediksi | Penggunaan |
---|---|
Kluster (DMX) | Mengembalikan kluster yang kemungkinan besar berisi kasus input. |
ClusterDistance (DMX) | Mengembalikan jarak kasus input dari kluster yang ditentukan, atau jika tidak ada kluster yang ditentukan, jarak kasus input dari kluster yang paling mungkin. Mengembalikan probabilitas kasus input milik kluster yang ditentukan. |
ClusterProbability (DMX) | Mengembalikan probabilitas kasus input milik kluster yang ditentukan. |
IsDescendant (DMX) | Menentukan apakah satu simpul adalah anak dari simpul lain dalam model. |
IsInNode (DMX) | Menunjukkan apakah simpul yang ditentukan berisi kasus saat ini. |
PredictAdjustedProbability (DMX) | Mengembalikan probabilitas tertimbang. |
PredictAssociation (DMX) | Memprediksi keanggotaan dalam himpunan data asosiatif. |
PredictCaseLikelihood (DMX) | Mengembalikan kemungkinan bahwa kasus input akan cocok dalam model yang ada. |
PredictHistogram (DMX) | Mengembalikan tabel nilai yang terkait dengan nilai yang diprediksi saat ini. |
PredictNodeId (DMX) | Mengembalikan Node_ID untuk setiap kasus. |
PredictProbability (DMX) | Mengembalikan probabilitas untuk nilai yang diprediksi. |
PredictStdev (DMX) | Mengembalikan deviasi standar yang diprediksi untuk kolom yang ditentukan. |
PredictSupport (DMX) | Mengembalikan nilai dukungan untuk status tertentu. |
PredictVariance (DMX) | Mengembalikan varian kolom tertentu. |
Untuk sintaks fungsi tertentu, lihat Referensi Fungsi Ekstensi Penggalian Data (DMX).
Lihat juga
Kueri Penggalian Data
Referensi Teknis Algoritma Pengklusteran Microsoft
Algoritma Pengklusteran Microsoft