Bagikan melalui


Menambang Konten Model untuk Model Asosiasi (Analysis Services - Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Topik ini menjelaskan konten model penambangan yang khusus untuk model yang menggunakan algoritma Aturan Asosiasi Microsoft. Untuk penjelasan tentang terminologi umum dan statistik yang terkait dengan konten model penambangan yang berlaku untuk semua jenis model, lihat Menambang Konten Model (Analysis Services - Data Mining).

Memahami Struktur Model Asosiasi

Model asosiasi memiliki struktur sederhana. Setiap model memiliki simpul induk tunggal yang mewakili model dan metadatanya, dan setiap simpul induk memiliki daftar item dan aturan yang datar. Item dan aturan tidak diatur di pohon, item diurutkan dengan itemet terlebih dahulu dan aturan berikutnya seperti yang ditunjukkan dalam diagram berikut.

struktur konten model untuk struktur model asosiasi

Setiap item terkandung dalam simpulnya sendiri (NODE_TYPE = 7). Simpul mencakup definisi itemet, jumlah kasus yang berisi itemet ini, dan informasi lainnya.

Setiap aturan juga terkandung dalam simpulnya sendiri (NODE_TYPE = 8). Aturan menjelaskan pola umum tentang bagaimana item dikaitkan. Aturan seperti pernyataan IF-THEN. Sisi kiri aturan menunjukkan kondisi atau sekumpulan kondisi yang ada. Sisi kanan aturan memperlihatkan item dalam himpunan data Anda yang biasanya terkait dengan kondisi di sisi kiri.

Catatan Jika Anda ingin mengekstrak aturan atau item, Anda bisa menggunakan kueri untuk mengembalikan hanya jenis simpul yang Anda inginkan. Untuk informasi selengkapnya, lihat Contoh Kueri Model Asosiasi.

Konten Model untuk Model Asosiasi

Bagian ini menyediakan detail dan contoh hanya untuk kolom tersebut dalam konten model penambangan yang relevan untuk model asosiasi.

Untuk informasi tentang kolom tujuan umum dalam kumpulan baris skema, seperti MODEL_CATALOG dan MODEL_NAME, lihat Menambang Konten Model (Analysis Services - Penggalian Data).

MODEL_CATALOG
Nama database tempat model disimpan.

MODEL_NAME
Nama model.

ATTRIBUTE_NAME
Nama atribut yang sesuai dengan simpul ini.

NODE_NAME
Nama node. Untuk model asosiasi, kolom ini berisi nilai yang sama dengan NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
Nama unik simpul.

NODE_TYPE
Model asosiasi hanya menghasilkan jenis node berikut:

ID Jenis Node Jenis
1 (Model) Simpul akar atau induk.
7 (Itemet) Itemet, atau kumpulan pasangan atribut-nilai. Contoh:

Product 1 = Existing, Product 2 = Existing

atau

Gender = Male.
8 (Aturan) Aturan yang menentukan bagaimana item berhubungan satu sama lain.

Contoh:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.

NODE_CAPTION
Label atau caption yang terkait dengan simpul.

Simpul item Daftar item yang dipisahkan koma.

Node aturan Berisi sisi kiri dan kanan aturan.

CHILDREN_CARDINALITY
Menunjukkan jumlah anak dari simpul saat ini.

Simpul induk Menunjukkan jumlah total item ditambah aturan.

Catatan

Untuk mendapatkan perincian jumlah item dan aturan, lihat NODE_DESCRIPTION untuk simpul akar model.

Item atau node aturan Selalu 0.

PARENT_UNIQUE_NAME
Nama unik induk simpul.

Simpul induk Selalu NULL.

Item atau node aturan Selalu 0.

NODE_DESCRIPTION
Deskripsi yang mudah digunakan tentang konten simpul.

Simpul induk Menyertakan daftar informasi berikut yang dipisahkan koma tentang model:

Item Deskripsi
ITEMSET_COUNT Jumlah semua item dalam model.
RULE_COUNT Jumlah semua aturan dalam model.
MIN_SUPPORT Dukungan minimum yang ditemukan untuk item tunggal apa pun.

Catatan Nilai ini mungkin berbeda dari nilai yang Anda tetapkan untuk parameter _SUPPORT MINIMUM .
MAX_SUPPORT Dukungan maksimum yang ditemukan untuk item tunggal apa pun.

Catatan Nilai ini mungkin berbeda dari nilai yang Anda tetapkan untuk parameter MAXIMUM_SUPPORT .
MIN_ITEMSET_SIZE Ukuran item terkecil, direpresentasikan sebagai hitungan item.

Nilai 0 menunjukkan bahwa status Hilang diperlakukan sebagai item independen.

Catatan Nilai default parameter MINIMUM_ITEMSET_SIZE adalah 1.
MAX_ITEMSET_SIZE Menunjukkan ukuran item terbesar yang ditemukan.

Catatan Nilai ini dibatasi oleh nilai yang Anda tetapkan untuk parameter MAX_ITEMSET_SIZE saat Anda membuat model. Nilai ini tidak pernah dapat melebihi nilai tersebut; namun, itu bisa kurang. Nilai defaultnya adalah 3.
MIN_PROBABILITY Probabilitas minimum yang terdeteksi untuk setiap item atau aturan tunggal dalam model.

Contoh: 0.400390625

Catatan Untuk itemet, nilai ini selalu lebih besar dari nilai yang Anda tetapkan untuk parameter MINIMUM_PROBABILITY saat Anda membuat model.
MAX_PROBABILITY Probabilitas maksimum yang terdeteksi untuk setiap item atau aturan tunggal dalam model.

Contoh: 1

Catatan Tidak ada parameter untuk membatasi probabilitas maksimum itemet. Jika Anda ingin menghilangkan item yang terlalu sering, gunakan parameter MAXIMUM_SUPPORT sebagai gantinya.
MIN_LIFT Jumlah minimum lift yang disediakan oleh model untuk item apa pun.

Contoh: 0.14309369632511

Catatan: Mengetahui angkat minimum dapat membantu Anda menentukan apakah lift untuk satu item signifikan.
MAX_LIFT Jumlah maksimum lift yang disediakan oleh model untuk item apa pun.

Contoh: 1,95758227647523 Catatan Mengetahui angkat maksimum dapat membantu Anda menentukan apakah lift untuk satu item signifikan.

Simpul item Simpul item berisi daftar item, ditampilkan sebagai string teks yang dipisahkan koma.

Contoh:

Touring Tire = Existing, Water Bottle = Existing

Ini berarti ban touring dan botol air dibeli bersama-sama.

Node aturan Simpul aturan berisi sisi kiri dan kanan aturan, dipisahkan oleh panah.

Contoh: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

Ini berarti bahwa jika seseorang membeli ban touring dan botol air, mereka juga cenderung membeli topi bersepeda.

NODE_RULE
Fragmen XML yang menjelaskan aturan atau itemet yang disematkan dalam simpul.

Simpul induk Kosong.

Simpul item Kosong.

Node aturan Fragmen XML mencakup informasi berguna tambahan tentang aturan, seperti dukungan, keyakinan, dan jumlah item, dan ID simpul yang mewakili sisi kiri aturan.

MARGINAL_RULE
Kosong.

NODE_PROBABILITY
Skor probabilitas atau keyakinan yang terkait dengan item atau aturan.

Simpul induk Selalu 0.

Simpul item Probabilitas itemet.

Node aturan Nilai keyakinan untuk aturan.

MARGINAL_PROBABILITY
Sama seperti NODE_PROBABILITY.

NODE_DISTRIBUTION
Tabel berisi informasi yang sangat berbeda, tergantung pada apakah simpul adalah itemet atau aturan.

Simpul induk Kosong.

Simpul item Mencantumkan setiap item dalam item bersama dengan probabilitas dan nilai dukungan. Misalnya, jika item berisi dua produk, nama setiap produk tercantum, bersama dengan jumlah kasus yang menyertakan setiap produk.

Node aturan Berisi dua baris. Baris pertama menunjukkan atribut dari sisi kanan aturan, yang merupakan item yang diprediksi, bersama dengan skor keyakinan.

Baris kedua unik untuk model asosiasi; ini berisi penunjuk ke itemet di sisi kanan aturan. Penunjuk diwakili dalam kolom ATTRIBUTE_VALUE sebagai ID item yang hanya berisi item sebelah kanan.

Misalnya, jika aturannya adalah If {A,B} Then {C}, tabel berisi nama item {C}, dan ID simpul yang berisi item untuk item C.

Pointer ini berguna karena Anda dapat menentukan dari node itemet berapa banyak kasus di semua termasuk produk sisi kanan. Kasus yang tunduk pada aturan If {A,B} Then {C} adalah subset dari kasus yang tercantum dalam item untuk {C}.

NODE_SUPPORT
Jumlah kasus yang mendukung simpul ini.

Simpul induk Jumlah kasus dalam model.

Simpul item Jumlah kasus yang berisi semua item dalam item.

Node aturan Jumlah kasus yang berisi semua item yang disertakan dalam aturan.

MSOLAP_MODEL_COLUMN
Berisi informasi yang berbeda tergantung pada apakah node adalah itemet atau aturan.

Simpul induk Kosong.

Simpul item Kosong.

Node aturan ID item yang berisi item di sisi kiri aturan. Misalnya, jika aturannya adalah If {A,B} Then {C}, kolom ini berisi ID dari itemet yang hanya {A,B}berisi .

MSOLAP_NODE_SCORE
Simpul induk Kosong.

Simpul item Skor kepentingan untuk itemet.

Node aturan Skor kepentingan untuk aturan.

Catatan

Kepentingan dihitung secara berbeda untuk item dan aturan. Untuk informasi selengkapnya, lihat Referensi Teknis Algoritma Asosiasi Microsoft.

MSOLAP_NODE_SHORT_CAPTION
Kosong.

Lihat juga

Konten Model Penambangan (Analysis Services - Penggalian Data)
Algoritma Asosiasi Microsoft
Contoh Kueri Model Asosiasi