Bagikan melalui


Algoritma Asosiasi Microsoft

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Algoritma Microsoft Association adalah algoritma yang sering digunakan untuk mesin rekomendasi. Mesin rekomendasi merekomendasikan item kepada pelanggan berdasarkan item yang telah mereka beli, atau di mana mereka telah menunjukkan minat. Algoritma Microsoft Association juga berguna untuk analisis ke basket pasar.

Model asosiasi dibangun di atas himpunan data yang berisi pengidentifikasi baik untuk kasus individual maupun untuk item yang dikandung kasus. Sekelompok item dalam kasus disebut item. Model asosiasi terdiri dari serangkaian item dan aturan yang menjelaskan bagaimana item tersebut dikelompokkan bersama dalam kasus. Aturan yang diidentifikasi algoritma dapat digunakan untuk memprediksi kemungkinan pembelian pelanggan di masa mendatang, berdasarkan item yang sudah ada di kelopak belanja pelanggan. Diagram berikut ini memperlihatkan serangkaian aturan dalam item.

Seperangkat aturan untuk model asosiasi

Seperti yang diilustrasikan diagram, algoritma Microsoft Association berpotensi menemukan banyak aturan dalam himpunan data. Algoritma menggunakan dua parameter, dukungan dan probabilitas, untuk menjelaskan itemet dan aturan yang dihasilkannya. Misalnya, jika X dan Y mewakili dua item yang bisa berada di keranjang belanja, parameter dukungan adalah jumlah kasus dalam himpunan data yang berisi kombinasi item, X dan Y. Dengan menggunakan parameter dukungan dalam kombinasi dengan parameter yang ditentukan pengguna, MINIMUM_SUPPORT dan MAXIMUM_SUPPORT, algoritma mengontrol jumlah item yang dihasilkan. Parameter probabilitas, juga bernama confidence, mewakili pecahan kasus dalam himpunan data yang berisi X dan yang juga berisi Y. Dengan menggunakan parameter probabilitas dalam kombinasi dengan parameter MINIMUM_PROBABILITY , algoritma mengontrol jumlah aturan yang dihasilkan.

Contoh

Perusahaan Adventure Works Cycle mendesain ulang fungsionalitas situs Web-nya. Tujuan dari desain ulang adalah untuk meningkatkan penjualan melalui produk. Karena perusahaan merekam setiap penjualan dalam database transaksional, mereka dapat menggunakan algoritma Microsoft Association untuk mengidentifikasi serangkaian produk yang cenderung dibeli bersama-sama. Mereka kemudian dapat memprediksi item tambahan yang mungkin diminati pelanggan, berdasarkan item yang sudah ada di kedai belanja pelanggan.

Cara Kerja Algoritma

Algoritma Microsoft Association melintasi himpunan data untuk menemukan item yang muncul bersama-sama dalam kasus. Algoritma kemudian mengelompokkan ke dalam item yang terkait yang muncul, minimal, dalam jumlah kasus yang ditentukan oleh parameter MINIMUM_SUPPORT . Misalnya, itemet bisa berupa "Mountain 200=Existing, Sport 100=Existing", dan dapat memiliki dukungan 710. Algoritma kemudian menghasilkan aturan dari item. Aturan ini digunakan untuk memprediksi keberadaan item dalam database, berdasarkan keberadaan item spesifik lainnya yang diidentifikasi algoritma sebagai penting. Misalnya, aturannya bisa "jika Touring 1000=existing dan Road bottle cage=existing, then Water bottle=existing", dan bisa memiliki probabilitas 0,812. Dalam contoh ini, algoritma mengidentifikasi bahwa keberadaan di keranjang ban Touring 1000 dan kandang botol air memprediksi bahwa botol air juga kemungkinan akan berada di keranjang.

Untuk penjelasan yang lebih rinci tentang algoritma, bersama dengan daftar parameter untuk menyesuaikan perilaku algoritma dan mengontrol hasil dalam model penambangan, lihat Referensi Teknis Algoritma Asosiasi Microsoft.

Data yang Diperlukan untuk Model Asosiasi

Saat Menyiapkan data untuk digunakan dalam model aturan asosiasi, Anda harus memahami persyaratan untuk algoritma tertentu, termasuk berapa banyak data yang diperlukan, dan bagaimana data digunakan.

Persyaratan untuk model aturan asosiasi adalah sebagai berikut:

  • Kolom kunci tunggal Setiap model harus berisi satu kolom numerik atau teks yang secara unik mengidentifikasi setiap rekaman. kunci senyawa tidak diizinkan.

  • Satu kolom yang dapat diprediksi Model asosiasi hanya dapat memiliki satu kolom yang dapat diprediksi. Biasanya ini adalah kolom kunci dari tabel berlapis, seperti yang diajukan yang mencantumkan produk yang dibeli. Nilai harus diskret atau diskret.

  • Kolom input . Kolom input harus diskrit. Data input untuk model asosiasi sering terkandung dalam dua tabel. Misalnya, satu tabel mungkin berisi informasi pelanggan sementara tabel lain berisi pembelian pelanggan. Anda dapat memasukkan data ini ke dalam model dengan menggunakan tabel berlapis. Untuk informasi selengkapnya tentang tabel berlapis, lihat Tabel Berlapis (Analysis Services - Penggalian Data).

Untuk informasi selengkapnya tentang jenis konten dan jenis data yang didukung untuk model asosiasi, lihat bagian Persyaratan dari Referensi Teknis Algoritma Asosiasi Microsoft.

Menampilkan Model Asosiasi

Untuk menjelajahi model, Anda dapat menggunakan Penampil Asosiasi Microsoft. Saat Anda melihat model asosiasi, SQL Server Analysis Services menyajikan korelasi dari sudut yang berbeda sehingga Anda dapat lebih memahami hubungan dan aturan yang ditemukan dalam data. Panel Item di penampil menyediakan perincian terperinci dari kombinasi, atau item yang paling umum. Panel Aturan menyajikan daftar aturan yang telah digeneralisasi dari data, menambahkan perhitungan probabilitas, dan memberi peringkat aturan berdasarkan kepentingan relatif. penampil jaringan dependensi memungkinkan Anda menjelajahi secara visual bagaimana masing-masing item yang berbeda tersambung. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Penampil Kluster Microsoft.

Jika Anda ingin mengetahui detail selengkapnya tentang salah satu item dan aturan, Anda dapat menelusuri model di Penampil Pohon Konten Generik Microsoft. Konten yang disimpan untuk model mencakup dukungan untuk setiap item, skor untuk setiap aturan, dan statistik lainnya. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Asosiasi (Analysis Services - Penggalian Data).

Membuat Prediksi

Setelah model diproses, Anda dapat menggunakan aturan dan itemet untuk membuat prediksi. Dalam model asosiasi, prediksi memberi tahu Anda item apa yang kemungkinan akan terjadi mengingat adanya item yang ditentukan, dan prediksi dapat menyertakan informasi seperti probabilitas, dukungan, atau kepentingannya. Untuk contoh cara membuat kueri terhadap model asosiasi, lihat Contoh Kueri Model Asosiasi.

Untuk informasi umum tentang cara membuat kueri terhadap model penggalian data, lihat Kueri Penggalian Data.

Performa

Proses pembuatan itemet dan penghitungan korelasi dapat memakan waktu. Meskipun algoritma Aturan Asosiasi Microsoft menggunakan teknik pengoptimalan untuk menghemat ruang dan membuat pemrosesan lebih cepat, Anda harus tahu bahwa masalah performa dapat terjadi dalam kondisi seperti berikut ini:

  • Himpunan data besar dengan banyak item individual.

  • Ukuran itemet minimum diatur terlalu rendah.

Untuk meminimalkan waktu pemrosesan dan mengurangi kompleksitas item, Anda dapat mencoba mengelompokkan item terkait menurut kategori sebelum menganalisis data.

Keterangan

  • Tidak mendukung penggunaan Predictive Model Markup Language (PMML) untuk membuat model penambangan.

  • Mendukung penelusuran.

  • Mendukung penggunaan model penambangan OLAP.

  • Mendukung pembuatan dimensi penggalian data.

Lihat juga

Algoritma Penggalian Data (Analysis Services - Penggalian Data)
Menelusuri Model Menggunakan Penampil Aturan Asosiasi Microsoft
Menambang Konten Model untuk Model Asosiasi (Analysis Services - Penggalian Data)
Referensi Teknis Algoritma Asosiasi Microsoft
Contoh Kueri Model Asosiasi