Model Penambangan (Analysis Services - Penggalian Data)
Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Model penambangan dibuat dengan menerapkan algoritma ke data, tetapi lebih dari algoritma atau kontainer metadata: ini adalah sekumpulan data, statistik, dan pola yang dapat diterapkan ke data baru untuk menghasilkan prediksi dan membuat inferensi tentang hubungan.
Bagian ini menjelaskan apa itu model penambangan data dan untuk apa model tersebut dapat digunakan: arsitektur dasar model dan struktur, properti model penambangan, dan cara untuk membuat dan bekerja dengan model penambangan.
Menentukan Model Penggalian Data
Menampilkan dan Mengkueri Model Penambangan
Arsitektur Model Penambangan
Model penggalian data mendapatkan data dari struktur penambangan lalu menganalisis data tersebut dengan menggunakan algoritma penggalian data. Struktur penambangan dan model penambangan adalah objek terpisah. Struktur penambangan menyimpan informasi yang menentukan sumber data. Model penambangan menyimpan informasi yang berasal dari pemrosesan statistik data, seperti pola yang ditemukan sebagai hasil analisis.
Model penambangan kosong sampai data yang disediakan oleh struktur penambangan telah diproses dan dianalisis. Setelah model penambangan diproses, model tersebut berisi metadata, hasil, dan pengikatan kembali ke struktur penambangan.
Metadata menentukan nama model dan server tempat model disimpan, serta definisi model, termasuk kolom dari struktur penambangan yang digunakan dalam membangun model, definisi filter apa pun yang diterapkan saat memproses model, dan algoritma yang digunakan untuk menganalisis data. Semua pilihan ini-kolom data dan jenis data, filter, dan algoritmanya-memiliki pengaruh yang kuat pada hasil analisis.
Misalnya, Anda dapat menggunakan data yang sama untuk membuat beberapa model, mungkin menggunakan algoritma pengklusteran, algoritma pohon keputusan, dan algoritma Naïve Bayes. Setiap jenis model membuat serangkaian pola, item, aturan, atau rumus yang berbeda, yang bisa Anda gunakan untuk membuat prediksi. Umumnya setiap algoritma menganalisis data dengan cara yang berbeda, sehingga konten model yang dihasilkan juga diatur dalam struktur yang berbeda. Dalam satu jenis model, data dan pola mungkin dikelompokkan dalam kluster; dalam jenis model lain, data mungkin diatur ke dalam pohon, cabang, dan aturan yang membagi dan menentukannya.
Model ini juga dipengaruhi oleh data yang Anda latih: bahkan model yang dilatih pada struktur penambangan yang sama dapat menghasilkan hasil yang berbeda jika Anda memfilter data secara berbeda atau menggunakan benih yang berbeda selama analisis. Namun, data aktual tidak disimpan dalam statistik ringkasan khusus model disimpan, dengan data aktual yang berada di struktur penambangan. Jika Anda telah membuat filter pada data saat Melatih model, definisi filter juga disimpan dengan objek model.
Model ini memang berisi serangkaian pengikatan, yang menunjuk kembali ke data yang di-cache dalam struktur penambangan. Jika data telah di-cache dalam struktur dan belum dibersihkan setelah diproses, pengikatan ini memungkinkan Anda menelusuri dari hasil hingga kasus yang mendukung hasilnya. Namun, data aktual disimpan dalam cache struktur, bukan dalam model.
Menentukan Model Penggalian Data
Anda membuat model penggalian data dengan mengikuti langkah-langkah umum berikut:
Buat struktur penambangan yang mendasar dan sertakan kolom data yang mungkin diperlukan.
Pilih algoritma yang paling cocok untuk tugas analitis.
Pilih kolom dari struktur yang akan digunakan dalam model, dan tentukan bagaimana kolom tersebut harus digunakan-kolom mana yang berisi hasil yang ingin Anda prediksi, kolom mana yang hanya untuk input, dan sebagainya.
Secara opsional, atur parameter untuk menyempurnakan pemrosesan dengan algoritma.
Isi model dengan data dengan memproses struktur dan model.
SQL Server Analysis Services menyediakan alat berikut untuk membantu Anda mengelola model penambangan:
Panduan Penggalian Data membantu Anda membuat struktur dan model penambangan terkait. Ini adalah metode term mudah untuk digunakan. Wizard secara otomatis membuat struktur penambangan yang diperlukan dan membantu Anda dengan konfigurasi pengaturan penting.
Pernyataan DMX CREATE MODEL dapat digunakan untuk menentukan model. Struktur yang diperlukan secara otomatis dibuat sebagai bagian dari proses; oleh karena itu, Anda tidak dapat menggunakan kembali struktur yang ada dengan metode ini. Gunakan metode ini jika Anda sudah tahu dengan tepat model mana yang ingin Anda buat, atau jika Anda ingin membuat model skrip.
Pernyataan DMX ALTER STRUCTURE ADD MODEL dapat digunakan untuk menambahkan model penambangan baru ke struktur yang ada. Gunakan metode ini jika Anda ingin bereksperimen dengan model berbeda yang didasarkan pada himpunan data yang sama.
Anda juga dapat membuat model penambangan secara terprogram, dengan menggunakan AMO atau XML/A, atau dengan menggunakan klien lain seperti Klien Penggalian Data untuk Excel. Untuk informasi selengkapnya, lihat topik berikut:
Properti Model Penambangan
Setiap model penambangan memiliki properti yang menentukan model dan metadatanya. Ini termasuk nama, deskripsi, tanggal model terakhir diproses, izin pada model, dan filter apa pun pada data yang digunakan untuk pelatihan.
Setiap model penambangan juga memiliki properti yang berasal dari struktur penambangan, dan yang menjelaskan kolom data yang digunakan oleh model. Jika ada kolom yang digunakan oleh model adalah tabel berlapis, kolom juga dapat menerapkan filter terpisah.
Selain itu, setiap model penambangan berisi dua properti khusus: Algorithm dan Usage.
Properti algoritma Menentukan algoritma yang digunakan untuk membuat model. Algoritma yang tersedia bergantung pada penyedia yang Anda gunakan. Untuk daftar algoritma yang disertakan dengan SQL Server SQL Server Analysis Services, lihat Algoritma Penggalian Data (Analysis Services - Penggalian Data). Properti Algoritma berlaku untuk model penambangan dan hanya dapat diatur satu kali untuk setiap model. Anda dapat mengubah algoritma nanti tetapi beberapa kolom dalam model penambangan mungkin menjadi tidak valid jika tidak didukung oleh algoritma yang Anda pilih. Anda harus selalu memproses ulang model setelah perubahan pada properti ini.
Properti penggunaan Menentukan bagaimana setiap kolom digunakan oleh model. Anda dapat menentukan penggunaan kolom sebagai Input, Prediksi, Prediksi Saja, atau Kunci. Properti Penggunaan berlaku untuk kolom model penambangan individual dan harus diatur satu per satu untuk setiap kolom yang disertakan dalam model. Jika struktur berisi kolom yang tidak Anda gunakan dalam model, penggunaan diatur ke Abaikan. Contoh data yang mungkin Anda sertakan dalam struktur penambangan tetapi tidak digunakan dalam analisis mungkin nama pelanggan atau alamat email. Dengan cara ini Anda dapat mengkuerinya nanti tanpa harus menyertakannya selama fase analisis.
Anda dapat mengubah nilai properti model penambangan setelah membuat model penambangan. Namun, setiap perubahan, bahkan pada nama model penambangan, mengharuskan Anda memproses ulang model. Setelah memproses ulang model, Anda mungkin melihat hasil yang berbeda.
Kolom Model Penambangan
Model penambangan berisi kolom data yang diperoleh dari kolom yang ditentukan dalam struktur penambangan. Anda dapat memilih kolom mana dari struktur penambangan yang akan digunakan dalam model, dan Anda dapat membuat salinan kolom struktur penambangan lalu mengganti namanya atau mengubah penggunaannya. Sebagai bagian dari proses pembuatan model, Anda juga harus menentukan penggunaan kolom oleh model. Itu termasuk informasi seperti apakah kolom adalah kunci, apakah itu digunakan untuk prediksi, atau apakah itu dapat diabaikan oleh algoritma.
Saat Anda membangun model, daripada secara otomatis menambahkan setiap kolom data yang tersedia, disarankan agar Anda meninjau data dalam struktur dengan hati-hati dan menyertakan dalam model hanya kolom yang masuk akal untuk analisis. Misalnya, Anda harus menghindari menyertakan beberapa kolom yang mengulangi data yang sama, dan Anda harus menghindari penggunaan kolom yang sebagian besar memiliki nilai unik. Jika Menurut Anda kolom tidak boleh digunakan, Anda tidak perlu menghapusnya dari struktur penambangan atau model penambangan; sebagai gantinya, Anda hanya dapat mengatur bendera pada kolom yang menentukan bahwa bendera tersebut harus diabaikan saat membangun model. Ini berarti bahwa kolom akan tetap berada dalam struktur penambangan, tetapi tidak akan digunakan dalam model penambangan. Jika Anda telah mengaktifkan penelusuran dari model ke struktur penambangan, Anda dapat mengambil informasi dari kolom nanti.
Bergantung pada algoritma mana yang Anda pilih, beberapa kolom dalam struktur penambangan mungkin tidak kompatibel dengan jenis model tertentu, atau mungkin memberi Anda hasil yang buruk. Misalnya, jika data Anda berisi data numerik berkelanjutan, seperti kolom Pendapatan, dan model Anda memerlukan nilai diskrit, Anda mungkin perlu mengonversi data menjadi rentang diskrit atau menghapusnya dari model. Dalam beberapa kasus, algoritma akan secara otomatis mengonversi atau mengikat data untuk Anda, tetapi hasilnya mungkin tidak selalu seperti yang Anda inginkan atau harapkan. Pertimbangkan untuk membuat salinan kolom tambahan dan mencoba model yang berbeda. Anda juga dapat mengatur bendera pada kolom individual untuk menunjukkan di mana pemrosesan khusus diperlukan. Misalnya, jika data Anda berisi null, Anda dapat menggunakan bendera pemodelan untuk mengontrol penanganan. Jika Anda ingin kolom tertentu dianggap sebagai regresor dalam model, Anda dapat melakukannya dengan bendera pemodelan.
Setelah membuat model, Anda dapat membuat perubahan seperti menambahkan atau menghapus kolom, atau mengubah nama model. Namun, setiap perubahan, bahkan hanya pada metadata model, mengharuskan Anda memproses ulang model.
Memproses Model Penambangan
Model penggalian data adalah objek kosong sampai diproses. Saat Anda memproses model, data yang di-cache oleh struktur diteruskan melalui filter, jika model telah ditentukan dalam model, dan dianalisis oleh algoritma. Algoritma menghitung serangkaian statistik ringkasan yang menjelaskan data, mengidentifikasi aturan dan pola dalam data, lalu menggunakan aturan dan pola ini untuk mengisi model.
Setelah diproses, model penambangan berisi banyak informasi tentang data dan pola yang ditemukan melalui analisis, termasuk statistik, aturan, dan rumus regresi. Anda bisa menggunakan penampil kustom untuk menelusuri informasi ini, atau Anda bisa membuat kueri penggalian data untuk mengambil informasi ini dan menggunakannya untuk analisis dan presentasi.
Menampilkan dan Mengkueri Model Penambangan
Setelah memproses model, Anda dapat menjelajahinya dengan menggunakan pemirsa kustom yang disediakan di SQL Server Data Tools dan SQL Server Management Studio. Untuk
Anda juga dapat membuat kueri terhadap model penambangan baik untuk membuat prediksi, atau untuk mengambil metadata model atau pola yang dibuat oleh model. Anda membuat kueri dengan menggunakan Ekstensi Penggalian Data (DMX).
Konten terkait
Topik | Tautan |
---|---|
Pelajari cara membangun struktur penambangan yang dapat mendukung beberapa model penambangan. Pelajari tentang penggunaan kolom dalam model. | Kolom Struktur Penambangan Kolom Model Penambangan Tipe Isi (Penggalian Data) |
Pelajari tentang algoritma yang berbeda, dan bagaimana pilihan algoritma memengaruhi konten model. | Konten Model Penambangan (Analysis Services - Penggalian Data) Algoritma Penggalian Data (Analysis Services - Penggalian Data) |
Pelajari sekarang Anda dapat mengatur properti pada model yang memengaruhi komposisi dan perilakunya. | Properti Model Penambangan Bendera Pemodelan (Penggalian Data) |
Pelajari tentang antarmuka yang dapat diprogram untuk penggalian data. | Mengembangkan dengan Analysis Management Objects (AMO) Referensi Ekstensi Penggalian Data (DMX) |
Pelajari cara menggunakan penampil penggalian data kustom di SQL Server Analysis Services. | Penampil Model Penggalian Data |
Lihat contoh berbagai jenis kueri yang dapat Anda gunakan terhadap model penambangan data. | Kueri Penggalian Data |
Tugas Terkait
Gunakan tautan berikut untuk mendapatkan informasi lebih spesifik tentang bekerja dengan model penggalian data
Tugas | Tautan |
---|---|
Menambahkan dan menghapus model penambangan | Menambahkan Model Penambangan ke Struktur Penambangan yang Ada Menghapus Model Penambangan dari Struktur Penambangan |
Bekerja dengan kolom model penambangan | Mengecualikan Kolom dari Model Penambangan Membuat Alias untuk Kolom Model Mengubah Diskretisasi Kolom dalam Model Penambangan Tentukan Kolom yang Akan Digunakan sebagai Regresor dalam Model |
Mengubah properti model | Mengubah Properti Model Penambangan Menerapkan Filter ke Model Penambangan Menghapus Filter dari Model Penambangan Mengaktifkan Drillthrough untuk Model Penambangan Lihat atau Ubah Parameter Algoritma |
Salinan. memindahkan, atau mengelola model | Membuat Salinan Model Penambangan Menyalin Tampilan Model Penambangan EKSPOR (DMX) IMPOR (DMX) |
Mengisi model dengan data, atau memperbarui data dalam model | Memproses Model Penambangan |
Bekerja dengan model OLAP | Membuat Dimensi Penggalian Data |