Contoh Kueri Model Pengklusteran

Artikel
10/31/2023

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Saat Membuat kueri terhadap model penggalian data, Anda dapat mengambil metadata tentang model, atau membuat kueri konten yang menyediakan detail tentang pola yang ditemukan dalam analisis. Atau, Anda dapat membuat kueri prediksi, yang menggunakan pola dalam model untuk membuat prediksi untuk data baru. Setiap jenis kueri akan memberikan informasi yang berbeda. Misalnya, kueri konten mungkin memberikan detail tambahan tentang kluster yang ditemukan, sedangkan kueri prediksi mungkin memberi tahu Anda di kluster mana titik data baru kemungkinan besar berada.

Bagian ini menjelaskan cara membuat kueri untuk model yang didasarkan pada algoritma Pengklusteran Microsoft.

Kueri Konten

Mendapatkan Metadata Model dengan Menggunakan DMX

Mengambil Metadata Model dari Set Baris Skema

Mengembalikan Kluster atau Daftar Kluster

Mengembalikan Atribut untuk Kluster

Mengembalikan Profil Kluster Menggunakan Prosedur Tersimpan Sistem

Menemukan Faktor Diskriminasi untuk Kluster

Mengembalikan Kasus yang Termasuk dalam Kluster

Kueri Prediksi

Memprediksi Hasil dari Model Pengklusteran

Menentukan Keanggotaan Kluster

Mengembalikan Semua Kluster yang Mungkin dengan Probabilitas dan Jarak

Menemukan Informasi tentang Model

Semua model penambangan mengekspos konten yang dipelajari oleh algoritma sesuai dengan skema standar, set baris skema model penambangan. Anda dapat membuat kueri terhadap kumpulan baris skema model penambangan dengan menggunakan pernyataan Ekstensi Penggalian Data (DMX). Pada SQL Server 2017, Anda juga dapat mengkueri kumpulan baris skema secara langsung sebagai tabel sistem.

Kembali ke Atas

Kueri Sampel 1: Mendapatkan Metadata Model dengan Menggunakan DMX

Kueri berikut mengembalikan metadata dasar tentang model pengklusteran, TM_Clustering, yang Anda buat di Tutorial Penggalian Data Dasar. Metadata yang tersedia dalam simpul induk model pengklusteran mencakup nama model, database tempat model disimpan, dan jumlah simpul anak dalam model. Kueri ini menggunakan kueri konten DMX untuk mengambil metadata dari simpul induk model:

SELECT MODEL_CATALOG, MODEL_NAME, NODE_CAPTION,   
NODE_SUPPORT, [CHILDREN_CARDINALITY], NODE_DESCRIPTION  
FROM TM_Clustering.CONTENT  
WHERE NODE_TYPE = 1

Catatan

Anda harus menyertakan nama kolom, CHILDREN_CARDINALITY, dalam tanda kurung siku untuk membedakannya dari kata kunci yang dicadangkan Ekspresi Multidimensi (MDX) dengan nama yang sama.

Contoh hasil:

Baris	Metadata
MODEL_CATALOG	TM_Clustering
MODEL_NAME	Adventure Works DW
NODE_CAPTION	Model Kluster
NODE_SUPPORT	12939
CHILDREN_CARDINALITY	10
NODE_DESCRIPTION	Semua

Untuk definisi apa arti kolom ini dalam model pengklusteran, lihat Menambang Konten Model untuk Model Pengklusteran (Analysis Services - Penggalian Data).

Kembali ke Atas

Kueri Sampel 2: Mengambil Metadata Model dari Set Baris Skema

Dengan mengkueri himpunan baris skema penggalian data, Anda bisa menemukan informasi yang sama yang dikembalikan dalam kueri konten DMX. Namun, kumpulan baris skema menyediakan beberapa kolom tambahan. Ini termasuk parameter yang digunakan saat model dibuat, tanggal dan waktu model terakhir diproses, dan pemilik model.

Contoh berikut mengembalikan tanggal model dibuat, dimodifikasi, dan terakhir diproses, bersama dengan parameter pengklusteran yang digunakan untuk membangun model, dan ukuran set pelatihan. Informasi ini dapat berguna untuk mendikumentasikan model, atau untuk menentukan opsi pengklusteran mana yang digunakan untuk membuat model yang ada.

SELECT MODEL_NAME, DATE_CREATED, LAST_PROCESSED, PREDICTION_ENTITY, MINING_PARAMETERS   
from $system.DMSCHEMA_MINING_MODELS  
WHERE MODEL_NAME = 'TM_Clustering'

Contoh hasil:

Baris	Metadata
MODEL_NAME	TM_Clustering
DATE_CREATED	12/10/2007 19:42:51 WIB
LAST_PROCESSED	12/10/2007 20:09:54 PM
PREDICTION_ENTITY	Pembeli Sepeda
MINING_PARAMETERS	CLUSTER_COUNT=10, CLUSTER_SEED=0, CLUSTERING_METHOD=1, MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_STATES=100, MINIMUM_SUPPORT=1, MODELLING_CARDINALITY=10, SAMPLE_SIZE=50000, STOPPING_TOLERANCE=10

Kembali ke Atas

Menemukan Informasi tentang Kluster

Kueri konten yang paling berguna pada model pengklusteran umumnya mengembalikan jenis informasi yang sama yang dapat Anda telusuri dengan menggunakan Penampil Kluster. Ini termasuk profil kluster, karakteristik kluster, dan diskriminasi kluster. Bagian ini menyediakan contoh kueri yang mengambil informasi ini.

Kueri Sampel 3: Mengembalikan Kluster atau Daftar Kluster

Karena semua kluster memiliki jenis node 5, Anda dapat dengan mudah mengambil daftar kluster dengan mengkueri konten model hanya untuk simpul jenis tersebut. Anda juga dapat memfilter simpul yang dikembalikan oleh probabilitas atau dukungan, seperti yang ditunjukkan dalam contoh ini.

SELECT NODE_NAME, NODE_CAPTION ,NODE_SUPPORT, NODE_DESCRIPTION  
FROM TM_Clustering.CONTENT  
WHERE NODE_TYPE = 5 AND NODE_SUPPORT > 1000

Contoh hasil:

Baris	Metadata
NODE_NAME	002
NODE_CAPTION	Kluster 2
NODE_SUPPORT	1649
NODE_DESCRIPTION	Pendidikan Bahasa Inggris=Gelar Pascasarjana , 32 <=Usia <=48 , Jumlah Mobil Yang Dimiliki=0 , 35964.0771121808 <=Pendapatan Tahunan <=97407.7163393957 , English Occupation=Professional , Perjalanan Distance=2-5 Miles , Region=Amerika Utara , Pembeli Sepeda=1 , Jumlah Anak Di Rumah=0 , Nomor Mobil Yang Dimiliki=1 , Perjalanan Distance=0-1 Miles , English Education=Bachelors , Total Children=1 , Number Children At Home=2 , English Occupation=Skilled Manual , Marital Status=S , Total Children=0 , House Owner Flag=0 , Gender=F , Total Children=2 , Region=Pacific

Atribut yang menentukan kluster dapat ditemukan dalam dua kolom dalam himpunan baris skema penambangan data.

Kolom NODE_DESCRIPTION berisi daftar atribut yang dipisahkan koma. Perhatikan bahwa daftar atribut mungkin disingkat untuk tujuan tampilan.
Tabel berlapis di kolom NODE_DISTRIBUTION berisi daftar lengkap atribut untuk kluster. Jika klien Anda tidak mendukung kumpulan baris hierarkis, Anda dapat mengembalikan tabel berlapis dengan menambahkan kata kunci FLATTENED sebelum daftar kolom SELECT. Untuk informasi selengkapnya tentang penggunaan kata kunci FLATTENED, lihat MODEL> SELECT FROM<. KONTEN (DMX).

Kembali ke Atas

Kueri Sampel 4: Mengembalikan Atribut untuk Kluster

Untuk setiap kluster, Penampil Kluster menampilkan profil yang mencantumkan atribut dan nilainya. Penampil juga menampilkan histogram yang menunjukkan distribusi nilai untuk seluruh populasi kasus dalam model. Jika Anda menelusuri model di penampil, Anda dapat dengan mudah menyalin histogram dari Legenda Penambangan lalu menempelkannya ke Excel atau dokumen Word. Anda juga dapat menggunakan panel Karakteristik Kluster penampil untuk membandingkan atribut kluster yang berbeda secara grafis.

Namun, jika Anda harus mendapatkan nilai untuk lebih dari satu kluster sekaligus, lebih mudah untuk mengkueri model. Misalnya, ketika Anda menelusuri model, Anda mungkin melihat bahwa dua kluster teratas berbeda sehubungan dengan satu atribut, Number Cars Owned. Oleh karena itu, Anda ingin mengekstrak nilai untuk setiap kluster.

SELECT TOP 2 NODE_NAME,   
(SELECT ATTRIBUTE_VALUE, [PROBABILITY] FROM NODE_DISTRIBUTION WHERE ATTRIBUTE_NAME = 'Number Cars Owned')  
AS t  
FROM [TM_Clustering].CONTENT  
WHERE NODE_TYPE = 5

Baris pertama kode menentukan bahwa Anda hanya menginginkan dua kluster teratas.

Catatan

Secara default, kluster diurutkan berdasarkan dukungan. Oleh karena itu, kolom NODE_SUPPORT dapat dihilangkan.

Baris kedua kode menambahkan pernyataan sub-pilih yang hanya mengembalikan kolom tertentu dari kolom tabel berlapis. Selain itu, ini membatasi baris dari tabel berlapis untuk yang terkait dengan atribut target, Number Cars Owned. Untuk menyederhanakan tampilan, tabel berlapis diberi alias.

Catatan

Kolom tabel berlapis, PROBABILITY, harus diapit dalam tanda kurung siku karena juga merupakan nama kata kunci MDX yang dipesan.

Contoh hasil:

NODE_NAME	T.ATTRIBUTE_VALUE	PROBABILITAS T.
001	2	0.829207754
001	1	0.109354156
001	3	0.034481552
001	4	0.013503302
001	0	0.013453236
001	Tidak ada	0
002	0	0.576980023
002	1	0.406623939
002	2	0.016380082
002	3	1,60E-05
002	4	0
002	Tidak ada	0

Kembali ke Atas

Kueri Sampel 5: Mengembalikan Profil Kluster Menggunakan Prosedur Tersimpan Sistem

Sebagai pintasan, daripada menulis kueri Anda sendiri dengan menggunakan DMX, Anda juga dapat memanggil prosedur tersimpan sistem yang SQL Server Analysis Services gunakan untuk bekerja dengan kluster. Contoh berikut menggambarkan cara menggunakan prosedur tersimpan internal untuk mengembalikan profil untuk kluster dengan ID 002.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterProfiles('TM_Clustering", '002',0.0005

Demikian pula, Anda dapat menggunakan prosedur tersimpan sistem untuk mengembalikan karakteristik kluster tertentu, seperti yang ditunjukkan dalam contoh berikut:

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('TM_Clustering", '009',0.0005

Contoh hasil:

Atribut	Nilai	Frekuensi	Dukungan
Jumlah Anak di Rumah	0	0.999999829076798	899
Wilayah	Amerika Utara	0.999852875241508	899
Total Anak	0	0.993860958572323	893

Catatan

Prosedur tersimpan sistem penggalian data adalah untuk penggunaan internal dan Microsoft berhak untuk mengubahnya sesuai kebutuhan. Untuk penggunaan produksi, kami sarankan Anda membuat kueri dengan menggunakan DMX, AMO, atau XMLA.

Kembali ke Atas

Kueri Sampel 6: Menemukan Faktor Diskriminasi untuk Kluster

Tab Diskriminasi Kluster dari Penampil Kluster memungkinkan Anda untuk dengan mudah membandingkan kluster dengan kluster lain, atau membandingkan kluster dengan semua kasus yang tersisa (pelengkap kluster).

Namun, membuat kueri untuk mengembalikan informasi ini bisa rumit, dan Anda mungkin memerlukan beberapa pemrosesan tambahan pada klien untuk menyimpan hasil sementara dan membandingkan hasil dua kueri atau lebih. Sebagai pintasan, Anda dapat menggunakan prosedur tersimpan sistem.

Kueri berikut mengembalikan satu tabel yang menunjukkan faktor diskriminasi utama antara dua kluster yang memiliki ID simpul 009 dan 007. Atribut dengan nilai positif mendukung kluster 009, sedangkan atribut dengan nilai negatif mendukung kluster 007.

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('TM_Clustering','009','007',0.0005,true)

Contoh hasil:

Atribut	Nilai	Skor
Wilayah	Amerika Utara	100
Pekerjaan Bahasa Inggris	Manual Terampil	94.9003803898654
Wilayah	Eropa	-72.5041051379789
Pekerjaan Bahasa Inggris	Manual	-69.6503163202722

Ini adalah informasi yang sama yang disajikan dalam bagan penampil Diskriminasi Kluster jika Anda memilih Kluster 9 dari daftar drop-down pertama dan Kluster 7 dari daftar drop-down kedua. Untuk membandingkan kluster 9 dengan pelengkapnya, Anda menggunakan string kosong di parameter kedua, seperti yang ditunjukkan dalam contoh berikut:

CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('TM_Clustering','009','',0.0005,true)

Catatan

Kembali ke Atas

Kueri Sampel 7: Mengembalikan Kasus milik Kluster

Jika penelusuran telah diaktifkan pada model penambangan, Anda dapat membuat kueri yang mengembalikan informasi terperinci tentang kasus yang digunakan dalam model. Selain itu, jika penelusuran telah diaktifkan pada struktur penambangan, Anda dapat menyertakan kolom dari struktur dasar dengan menggunakan fungsi StructureColumn (DMX).

Contoh berikut mengembalikan dua kolom yang digunakan dalam model, Usia dan Wilayah, dan satu kolom lagi, Nama Depan, yang tidak digunakan dalam model. Kueri hanya mengembalikan kasus yang diklasifikasikan ke dalam Kluster 1.

SELECT [Age], [Region], StructureColumn('First Name')  
FROM [TM_Clustering].CASES  
WHERE IsInNode('001')

Untuk mengembalikan kasus yang termasuk dalam kluster, Anda harus mengetahui ID kluster. Anda dapat memperoleh ID kluster dengan menelusuri model di salah satu pemirsa. Atau, Anda dapat mengganti nama kluster untuk referensi yang lebih mudah, setelah itu Anda dapat menggunakan nama sebagai pengganti nomor ID. Namun, ketahuilah bahwa nama yang Anda tetapkan ke kluster akan hilang jika model diproses ulang.

Kembali ke Atas

Membuat Prediksi menggunakan Model

Meskipun pengklusteran biasanya digunakan untuk menjelaskan dan memahami data, implementasi Microsoft juga memungkinkan Anda membuat prediksi tentang keanggotaan kluster, dan mengembalikan probabilitas yang terkait dengan prediksi. Bagian ini menyediakan contoh cara membuat kueri prediksi pada model pengklusteran. Anda bisa membuat prediksi untuk beberapa kasus, dengan menentukan sumber data tabular, atau Anda bisa memberikan nilai baru pada satu waktu dengan membuat kueri singleton. Untuk kejelasan, contoh di bagian ini adalah semua kueri singleton.

Untuk informasi selengkapnya tentang cara membuat kueri prediksi menggunakan DMX, lihat Alat Kueri Penggalian Data.

Kembali ke Atas

Kueri Sampel 8: Memprediksi Hasil dari Model Pengklusteran

Jika model pengklusteran yang Anda buat berisi atribut yang dapat diprediksi, Anda dapat menggunakan model untuk membuat prediksi tentang hasil. Namun, model menangani atribut yang dapat diprediksi secara berbeda tergantung pada apakah Anda mengatur kolom yang dapat diprediksi ke Predict atau PredictOnly. Jika Anda mengatur penggunaan kolom ke Prediksi, nilai untuk atribut tersebut ditambahkan ke model pengklusteran dan muncul sebagai atribut dalam model yang sudah selesai. Namun, jika Anda mengatur penggunaan kolom ke PredictOnly, nilai tidak digunakan untuk membuat kluster. Sebaliknya, setelah mode selesai, algoritma pengklusteran membuat nilai baru untuk atribut PredictOnly berdasarkan kluster tempat setiap kasus berada.

Kueri berikut ini menyediakan satu kasus baru untuk model, di mana satu-satunya informasi tentang kasus ini adalah usia dan jenis kelamin. Pernyataan SELECT menentukan pasangan atribut/nilai yang dapat diprediksi yang Anda minati, dan fungsi PredictProbability (DMX) memberi tahu Anda probabilitas bahwa kasus dengan atribut tersebut akan memiliki hasil yang ditargetkan.

SELECT  
  [TM_Clustering].[Bike Buyer], PredictProbability([Bike Buyer],1)  
FROM  
  [TM_Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 40 AS [Age],  
  'F' AS [Gender]) AS t

Contoh hasil saat penggunaan diatur ke Prediksi:

Pembeli Sepeda	Ekspresi
1	0.592924735740338

Contoh hasil saat penggunaan diatur ke PredictOnly dan model diolah ulang:

Pembeli Sepeda	Ekspresi
1	0.55843544003102

Dalam contoh ini, perbedaan dalam model tidak signifikan. Namun, terkadang penting untuk mendeteksi perbedaan antara distribusi nilai aktual dan apa yang diprediksi model. Fungsi PredictCaseLikelihood (DMX) berguna dalam skenario ini, karena memberi tahu Anda seberapa besar kemungkinan kasus, mengingat model.

Angka yang dikembalikan oleh fungsi PredictCaseLikelihood adalah probabilitas, dan oleh karena itu selalu antara 0 dan 1, dengan nilai .5 mewakili hasil acak. Oleh karena itu, skor kurang dari .5 berarti bahwa kasus yang diprediksi tidak mungkin, mengingat model, dan skor di atas.5 menunjukkan bahwa kasus yang diprediksi lebih mungkin daripada tidak sesuai dengan model.

Misalnya, kueri berikut mengembalikan dua nilai yang mencirikan kemungkinan kasus sampel baru. Nilai yang tidak dinormalisasi mewakili probabilitas mengingat model saat ini. Saat Anda menggunakan kata kunci NORMALIZED, skor kemungkinan yang dikembalikan oleh fungsi disesuaikan dengan membalik "probabilitas dengan model" dengan "probabilitas tanpa model".

SELECT  
PredictCaseLikelihood(NORMALIZED) AS [NormalizedValue], PredictCaseLikelihood(NONNORMALIZED) AS [NonNormalizedValue]  
FROM  
  [TM_Clustering_PredictOnly]  
NATURAL PREDICTION JOIN  
(SELECT 40 AS [Age],  
  'F' AS [Gender]) AS t

Contoh hasil:

NormalizedValue	NonNormalizedValue
5.56438372679893E-11	8.65459953145182E-68

Perhatikan bahwa angka-angka dalam hasil ini dinyatakan dalam notasi ilmiah.

Kembali ke Atas

Kueri Sampel 9: Menentukan Keanggotaan Kluster

Contoh ini menggunakan fungsi Cluster (DMX) untuk mengembalikan kluster tempat kasus baru kemungkinan besar berada, dan menggunakan fungsi ClusterProbability (DMX) untuk mengembalikan probabilitas untuk keanggotaan dalam kluster tersebut.

SELECT Cluster(), ClusterProbability()  
FROM  
  [TM_Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 40 AS [Age],  
  'F' AS [Gender],  
  'S' AS [Marital Status]) AS t

Contoh hasil:

$CLUSTER	Ekspresi
Kluster 2	0.397918596951617

Catatan Secara default, fungsi ClusterProbability mengembalikan probabilitas kluster yang paling mungkin. Namun, Anda dapat menentukan kluster yang berbeda dengan menggunakan sintaks ClusterProbability('cluster name'). Jika Anda melakukan ini, ketahuilah bahwa hasil dari setiap fungsi prediksi tidak bergantung pada hasil lainnya. Oleh karena itu, skor probabilitas di kolom kedua dapat merujuk ke kluster yang berbeda dari kluster yang dinamai di kolom pertama.

Kembali ke Atas

Kueri Sampel 10: Mengembalikan Semua Kluster yang Mungkin dengan Probabilitas dan Jarak

Dalam contoh sebelumnya, skor probabilitas tidak terlalu tinggi. Untuk menentukan apakah ada kluster yang lebih baik, Anda dapat menggunakan fungsi PredictHistogram (DMX) bersama dengan fungsi Kluster (DMX) untuk mengembalikan tabel berlapis yang mencakup semua kluster yang mungkin, bersama dengan probabilitas bahwa kasus baru milik setiap kluster. Kata kunci FLATTENED digunakan untuk mengubah kumpulan baris hierarkis menjadi tabel datar untuk tampilan yang lebih mudah.

SELECT FLATTENED PredictHistogram(Cluster())  
From  
  [TM_Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 40 AS [Age],  
  'F' AS [Gender],  
  'S' AS [Marital Status])

Expression.$CLUSTER	Expression.$DISTANCE	Expression.$PROBABILITY
Kluster 2	0.602081403048383	0.397918596951617
Kluster 10	0.719691686785675	0.280308313214325
Kluster 4	0.867772590378791	0.132227409621209
Kluster 5	0.931039872200985	0.0689601277990149
Kluster 3	0.942359230072167	0.0576407699278328
Kluster 6	0.958973668972756	0.0410263310272437
Kluster 7	0.979081275926724	0.0209187240732763
Kluster 1	0.999169044818624	0.000830955181376364
Kluster 9	0.999831227795894	0.000168772204105754
Kluster 8	1	0

Secara default, hasilnya diberi peringkat berdasarkan probabilitas. Hasilnya memberi tahu Anda bahwa, meskipun probabilitas untuk Kluster 2 cukup rendah, Kluster 2 masih yang paling cocok untuk titik data baru.

Catatan Kolom tambahan, $DISTANCE, mewakili jarak dari titik data ke kluster. Secara default, Algoritma Pengklusteran Microsoft menggunakan pengklusteran EM yang dapat diskalakan, yang menetapkan beberapa kluster ke setiap titik data dan memberi peringkat pada kluster yang mungkin. Namun, jika Anda membuat model pengklusteran menggunakan algoritma K-means, hanya satu kluster yang dapat ditetapkan ke setiap titik data, dan kueri ini hanya akan mengembalikan satu baris. Memahami perbedaan ini diperlukan untuk menginterpretasikan hasil fungsi PredictCaseLikelihood (DMX). Untuk informasi selengkapnya tentang perbedaan antara pengklusteran EM dan K-means, lihat Referensi Teknis Algoritma Pengklusteran Microsoft.

Kembali ke Atas

Daftar Fungsi

Semua algoritma Microsoft mendukung serangkaian fungsi umum. Namun, model yang dibangun dengan menggunakan algoritma Microsoft Clustering mendukung fungsi tambahan yang tercantum dalam tabel berikut.

Fungsi Prediksi	Penggunaan
Kluster (DMX)	Mengembalikan kluster yang kemungkinan besar berisi kasus input.
ClusterDistance (DMX)	Mengembalikan jarak kasus input dari kluster yang ditentukan, atau jika tidak ada kluster yang ditentukan, jarak kasus input dari kluster yang paling mungkin. Mengembalikan probabilitas kasus input milik kluster yang ditentukan.
ClusterProbability (DMX)	Mengembalikan probabilitas kasus input milik kluster yang ditentukan.
IsDescendant (DMX)	Menentukan apakah satu simpul adalah anak dari simpul lain dalam model.
IsInNode (DMX)	Menunjukkan apakah simpul yang ditentukan berisi kasus saat ini.
PredictAdjustedProbability (DMX)	Mengembalikan probabilitas tertimbang.
PredictAssociation (DMX)	Memprediksi keanggotaan dalam himpunan data asosiatif.
PredictCaseLikelihood (DMX)	Mengembalikan kemungkinan bahwa kasus input akan cocok dalam model yang ada.
PredictHistogram (DMX)	Mengembalikan tabel nilai yang terkait dengan nilai yang diprediksi saat ini.
PredictNodeId (DMX)	Mengembalikan Node_ID untuk setiap kasus.
PredictProbability (DMX)	Mengembalikan probabilitas untuk nilai yang diprediksi.
PredictStdev (DMX)	Mengembalikan deviasi standar yang diprediksi untuk kolom yang ditentukan.
PredictSupport (DMX)	Mengembalikan nilai dukungan untuk status tertentu.
PredictVariance (DMX)	Mengembalikan varian kolom tertentu.

Untuk sintaks fungsi tertentu, lihat Referensi Fungsi Ekstensi Penggalian Data (DMX).

Lihat juga

Kueri Penggalian Data
Referensi Teknis Algoritma Pengklusteran Microsoft
Algoritma Pengklusteran Microsoft

Bagikan melalui

Contoh Kueri Model Pengklusteran

Menemukan Informasi tentang Model

Kueri Sampel 1: Mendapatkan Metadata Model dengan Menggunakan DMX

Kueri Sampel 2: Mengambil Metadata Model dari Set Baris Skema

Menemukan Informasi tentang Kluster

Kueri Sampel 3: Mengembalikan Kluster atau Daftar Kluster

Kueri Sampel 4: Mengembalikan Atribut untuk Kluster

Kueri Sampel 5: Mengembalikan Profil Kluster Menggunakan Prosedur Tersimpan Sistem

Kueri Sampel 6: Menemukan Faktor Diskriminasi untuk Kluster

Kueri Sampel 7: Mengembalikan Kasus milik Kluster

Membuat Prediksi menggunakan Model

Kueri Sampel 8: Memprediksi Hasil dari Model Pengklusteran

Kueri Sampel 9: Menentukan Keanggotaan Kluster

Kueri Sampel 10: Mengembalikan Semua Kluster yang Mungkin dengan Probabilitas dan Jarak

Daftar Fungsi

Lihat juga

Saran dan Komentar

Sumber Daya Tambahan: