Bagikan melalui


Panduan Penggalian Data (Analysis Services - Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Panduan Penggalian Data di Microsoft SQL Server SQL Server Analysis Services dimulai setiap kali Anda menambahkan struktur penambangan baru ke proyek penggalian data. Panduan ini membantu Anda memilih sumber data dan menyiapkan tampilan sumber data yang menentukan data yang akan digunakan untuk analisis, lalu membantu Anda membuat model awal.

Dalam fase akhir wizard, Anda dapat secara opsional membagi data Anda menjadi set pelatihan dan pengujian, dan mengaktifkan fitur seperti penelusuran.

Apa yang Harus Diketahui Sebelum Memulai

Berikut adalah hal-hal yang perlu Anda ketahui sebelum memulai wizard.

  • Apakah Anda akan membangun struktur dan model penggalian data dari database relasional atau dari kubus yang ada dalam database OLAP?

  • Kolom mana yang berisi kunci yang secara unik mengidentifikasi rekaman kasus?

  • Kolom atau atribut mana yang ingin Anda gunakan untuk prediksi? Kolom atau atribut mana yang baik digunakan sebagai input untuk analisis?

  • Algoritma mana yang harus Anda gunakan? Algoritma yang disediakan dalam SQL Server SQL Server Analysis Services semuanya memiliki karakteristik yang berbeda dan menghasilkan hasil yang berbeda. Untungnya Anda tidak terbatas pada satu model untuk setiap set data, jadi jangan ragu untuk bereksperimen dengan menambahkan model yang berbeda.

  • Apakah Anda harus dapat menguji model Anda pada himpunan data terpadu? Jika demikian, pertimbangkan untuk menggunakan opsi untuk mengesampingkan beberapa data untuk pengujian. Anda dapat memilih persentase, dan membatasinya dengan jumlah baris tertentu jika diinginkan.

Memulai Wizard Penggalian Data

Untuk menggunakan Panduan Penggalian Data, Anda harus telah membuka solusi di SQL Server Data Tools yang berisi setidaknya satu proyek penggalian data atau OLAP.

  • Jika solusi Anda siap untuk penggalian data, Anda cukup mengklik kanan simpul Struktur Penambangan di Penjelajah Solusi dan memilih Struktur Penambangan Baru untuk memulai wizard.

  • Jika solusi Anda tidak berisi proyek yang ada, Anda dapat menambahkan proyek penggalian data baru. Dari menu File , pilih Baru, lalu pilih Proyek. Pastikan untuk memilih templat, Analysis Services Multidimensi dan Proyek Penggalian Data.

  • Anda juga dapat menggunakan Wizard Impor Analysis Services untuk mendapatkan metadata dari solusi penggalian data yang ada. Namun, Anda tidak dapat memilih objek individual untuk diimpor; seluruh database diimpor, termasuk kubus apa pun, tampilan sumber data, dll. Perhatikan juga bahwa solusi baru yang dibuat melalui impor secara otomatis dikonfigurasi untuk menggunakan database default lokal. Anda mungkin perlu mengubah ini ke instans lain sebelum dapat memproses atau menelusuri objek, dan jika Anda mengimpor dari versi SQL Server Analysis Services sebelumnya, Anda mungkin perlu memperbarui referensi ke penyedia.

Selanjutnya, Anda akan membuat struktur penambangan dan satu model penambangan data terkait. Anda juga dapat membuat struktur penambangan saja dan menambahkan model nanti, tetapi umumnya paling mudah untuk membuat model pengujian terlebih dahulu.

Model Penambangan Relasional vs. OLAP

Opsi penting berikutnya yang Anda miliki adalah apakah akan menggunakan sumber data relasional, atau untuk mendasarkan model Anda pada data multidimensi (OLAP).

Wizard Penggalian Data bercabang menjadi dua jalur pada saat ini, tergantung pada apakah sumber data Anda relasional atau dalam kubus. Segala sesuatu yang lain kecuali proses pemilihan data adalah pilihan algoritma yang sama, kemampuan untuk menambahkan himpunan data holdout, dll.-tetapi memilih data kubus sedikit lebih kompleks daripada menggunakan data relasional. (Anda juga mendapatkan beberapa opsi tambahan di akhir jika Anda membuat model berdasarkan kubus.)

Lihat topik berikut untuk panduan setiap opsi secara lebih rinci:

Membuat Struktur Penambangan Relasional
Memanding Anda melalui keputusan yang Anda buat saat membangun model penambangan data relasional.

Membuat Struktur Penambangan OLAP
Menjelaskan opsi dan pilihan tambahan yang harus dibuat saat memilih data dari kubus OLAP.

Catatan

Anda tidak perlu memiliki kubus atau database OLAP untuk melakukan penggalian data. Kecuali data Anda sudah disimpan dalam kubus, atau Anda ingin menambang dimensi OLAP atau hasil agregasi atau perhitungan OLAP, kami sarankan Anda menggunakan tabel relasional atau sumber data untuk penggalian data.

Memilih Algoritma

Selanjutnya, Anda harus memutuskan algoritma mana yang akan digunakan dalam memproses data Anda. Keputusan ini bisa sulit dibuat. Setiap algoritma yang disediakan dalam SQL Server Analysis Services memiliki fitur yang berbeda dan menghasilkan hasil yang berbeda, sehingga Anda dapat bereksperimen dan mencoba beberapa model berbeda sebelum menentukan mana yang paling tepat untuk data dan masalah bisnis Anda. Lihat topik berikut untuk penjelasan tentang tugas yang paling cocok untuk setiap algoritma:

Algoritma Penggalian Data (Analysis Services - Penggalian Data)

Sekali lagi, Anda dapat membuat beberapa model menggunakan algoritma yang berbeda, atau mengubah parameter untuk algoritma untuk membuat model yang berbeda. Anda tidak dikunci ke dalam pilihan algoritma Anda, dan adalah praktik yang baik untuk membuat beberapa model yang berbeda pada data yang sama.

Menentukan Data yang Digunakan untuk Pemodelan

Selain memilih data dari sumber, Anda harus menentukan tabel mana dalam tampilan sumber data yang berisi data kasus. Tabel kasus akan digunakan untuk melatih model penggalian data, dan karenanya harus berisi entitas yang ingin Anda analisis: misalnya, pelanggan dan informasi demografis mereka. Setiap kasus harus unik, dan harus dapat diidentifikasi dengan kunci kasus.

Selain menentukan tabel kasus, Anda bisa menyertakan tabel berlapis dalam data Anda. Tabel berlapis biasanya berisi informasi tambahan tentang entitas dalam tabel kasus, seperti transaksi yang dilakukan oleh pelanggan, atau atribut yang memiliki hubungan banyak-ke-satu dengan entitas. Misalnya, tabel berlapis yang digabungkan ke tabel kasus Pelanggan mungkin menyertakan daftar produk yang dibeli oleh setiap pelanggan. Dalam model yang menganalisis lalu lintas ke situs Web, tabel berlapis mungkin menyertakan urutan halaman yang dikunjungi pengguna. Untuk informasi selengkapnya, lihat Tabel Berlapis (Analysis Services - Penggalian Data)

Fitur Tambahan

Untuk membantu Anda dalam memilih data yang tepat, dan mengonfigurasi sumber data dengan benar, Panduan Penggalian Data menyediakan fitur tambahan ini:

  • Deteksi otomatis jenis data: Wizard akan memeriksa keunikan dan distribusi nilai kolom lalu merekomendasikan jenis data terbaik, dan menyarankan jenis penggunaan untuk data. Anda dapat mengambil alih saran ini dengan memilih nilai dari daftar.

  • Saran untuk variabel: Anda dapat mengklik kotak dialog dan memulai penganalisis yang menghitung korelasi di seluruh kolom yang disertakan dalam model, dan menentukan apakah ada kolom yang kemungkinan merupakan prediktor atribut hasil, mengingat konfigurasi model sejauh ini. Anda dapat mengambil alih saran ini dengan mengetikkan nilai yang berbeda.

  • Pemilihan fitur: Sebagian besar algoritma akan secara otomatis mendeteksi kolom yang merupakan prediktor yang baik dan menggunakannya secara lebih disukai. Dalam kolom yang berisi terlalu banyak nilai, pemilihan fitur akan diterapkan, untuk mengurangi kardinalitas data dan meningkatkan kemungkinan untuk menemukan pola yang bermakna. Anda dapat memengaruhi perilaku pemilihan fitur dengan menggunakan parameter model.

  • Pemotongan kubus otomatis: Jika model penambangan Anda didasarkan pada sumber data OLAP, kemampuan untuk mengiris model dengan menggunakan atribut kubus secara otomatis disediakan. Ini berguna untuk mengidamkan model berdasarkan subset data kubus.

Menyelesaikan Panduan

Langkah terakhir dalam wizard adalah memberi nama struktur penambangan dan model penambangan terkait. Bergantung pada jenis model yang Anda buat, Anda mungkin juga memiliki opsi penting berikut:

  • Jika Anda memilih Izinkan penelusuran, kemampuan untuk menelusuri diaktifkan dalam model. Dengan penelusuran, pengguna yang memiliki izin yang sesuai dapat menjelajahi data sumber yang digunakan untuk membangun model.

  • Jika Anda membangun model OLAP, Anda dapat memilih opsi, Membuat kubus penggalian data baru, atau Membuat dimensi penggalian data. Kedua opsi ini memudahkan untuk menelusuri model yang telah selesai dan menelusuri ke data yang mendasar.

Setelah menyelesaikan Panduan Penggalian Data, Anda menggunakan Data Mining Designer untuk memodifikasi struktur dan model penambangan, untuk melihat akurasi model, melihat karakteristik struktur dan model, atau membuat prediksi dengan menggunakan model.

Kembali ke Atas

Untuk mempelajari selengkapnya tentang keputusan yang perlu Anda buat saat membuat model penggalian data, lihat tautan berikut:

Algoritma Penggalian Data (Analysis Services - Penggalian Data)

Tipe Isi (Penggalian Data)

Jenis Data (Penggalian Data)

Pilihan Fitur (Penggalian Data)

Nilai yang Hilang (Analysis Services - Penggalian Data)

Penelusuran pada Model Penambangan

Lihat juga

Alat Penggalian Data
Solusi Penggalian Data