Bagikan melalui


Arsitektur Logis (Analysis Services - Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Penggalian data adalah proses yang melibatkan interaksi beberapa komponen.

  • Anda mengakses sumber data dalam database SQL Server atau sumber data lain yang akan digunakan untuk pelatihan, pengujian, atau prediksi.

  • Anda menentukan struktur dan model penggalian data dengan menggunakan SQL Server Data Tools atau Visual Studio.

  • Anda mengelola objek penggalian data dan membuat prediksi dan kueri dengan menggunakan SQL Server Management Studio.

  • Setelah solusi selesai, Anda menyebarkannya ke instans SQL Server Analysis Services.

Proses pembuatan objek solusi ini telah dijelaskan di tempat lain. Untuk informasi selengkapnya, lihat Solusi Penggalian Data.

Bagian berikut menjelaskan arsitektur logis objek dalam solusi penambangan data.

Data Sumber Penggalian Data

Struktur Pertambangan

Model Penambangan

Objek Penggalian Data Kustom

Data Sumber Penggalian Data

Data yang Anda gunakan dalam penggalian data tidak disimpan dalam solusi penambangan data; hanya pengikatan yang disimpan. Data mungkin berada dalam database yang dibuat dalam versi SQL Server sebelumnya, sistem CRM, atau bahkan file datar. Saat Anda melatih struktur atau model dengan memproses, ringkasan statistik data dibuat dan disimpan dalam cache yang dapat dipertahankan untuk digunakan dalam operasi selanjutnya, atau dihapus setelah diproses. Untuk informasi selengkapnya, lihat Struktur Penambangan (Analysis Services - Penggalian Data).

Anda menggabungkan data yang berbeda dalam objek tampilan sumber data (DSV) SQL Server Analysis Services, yang menyediakan lapisan abstraksi di atas sumber data Anda. Anda dapat menentukan gabungan antar tabel, atau menambahkan tabel yang memiliki hubungan banyak ke satu untuk membuat kolom tabel berlapis. Definisi objek ini, sumber data, dan tampilan sumber data, disimpan dalam solusi dengan ekstensi nama file, *.ds dan *.dsv. Untuk informasi selengkapnya tentang membuat dan menggunakan sumber data SQL Server Analysis Services dan tampilan sumber data, lihat Sumber Data yang Didukung (SSAS - Multidmensional).

Anda juga dapat menentukan dan mengubah sumber data dan tampilan sumber data dengan menggunakan AMO atau XMLA. Untuk informasi selengkapnya tentang bekerja dengan objek ini secara terprogram, lihat Gambaran Umum Arsitektur Logis (Analysis Services - Data Multidimensi).

Struktur Pertambangan

Struktur penggalian data adalah kontainer data logis yang menentukan domain data tempat model penambangan dibangun. Struktur penambangan tunggal dapat mendukung beberapa model penambangan.

Ketika Anda perlu menggunakan data dalam solusi penggalian data, Analysis Services membaca data dari sumber dan menghasilkan cache agregat dan informasi lainnya. Secara default cache ini dipertahankan sehingga data pelatihan dapat digunakan kembali untuk mendukung model tambahan. Jika Anda perlu menghapus cache, ubah properti CacheMode pada objek struktur penambangan ke nilai , ClearAfterProcessing. Untuk informasi selengkapnya, lihat Kelas Penggalian Data AMO.

Analysis Services juga menyediakan kemampuan untuk memisahkan data Anda menjadi himpunan data pelatihan dan pengujian, sehingga Anda dapat menguji model penambangan Anda pada kumpulan data yang dipilih secara acak. Data sebenarnya tidak disimpan secara terpisah; sebaliknya, data kasus dalam cache struktur ditandai dengan properti yang menunjukkan apakah kasus tertentu digunakan untuk pelatihan atau untuk pengujian. Jika cache dihapus, informasi tersebut tidak dapat diambil.

Untuk informasi selengkapnya, lihat Struktur Penambangan (Analysis Services - Penggalian Data).

Struktur penggalian data dapat berisi tabel berlapis. Tabel berlapis memberikan detail tambahan tentang kasus yang dimodelkan dalam tabel data utama. Untuk informasi selengkapnya, lihat Tabel Berlapis (Analysis Services - Penggalian Data)

Model Penambangan

Sebelum diproses, model penggalian data hanyalah kombinasi properti metadata. Properti ini menentukan struktur penambangan, menentukan algoritma penggalian data, dan kumpulan pengaturan parameter dan filter yang menentukan yang memengaruhi cara data diproses. Untuk informasi selengkapnya, lihat Model Penambangan (Analysis Services - Penggalian Data).

Saat Anda memproses model, data pelatihan yang disimpan dalam cache struktur penambangan digunakan untuk menghasilkan pola, baik berdasarkan properti statistik data maupun pada heuristik yang ditentukan oleh algoritma dan parameternya. Ini dikenal sebagai pelatihan model.

Hasil pelatihan adalah sekumpulan data ringkasan, yang terkandung dalam konten model, yang menjelaskan pola yang ditemukan dan menyediakan aturan untuk menghasilkan prediksi. Untuk informasi selengkapnya, lihat Menambang Konten Model (Analysis Services - Penggalian Data).

Dalam kasus terbatas, struktur logis model juga dapat diekspor ke dalam file yang mewakili rumus model dan pengikatan data sesuai dengan format standar, Predictive Modeling Markup Language (PMML). Struktur logis ini dapat diimpor ke sistem lain yang menggunakan PMML dan model sehingga dijelaskan kemudian dapat digunakan untuk prediksi. Untuk informasi selengkapnya, lihat Memahami Pernyataan Pilih DMX.

Objek Penggalian Data Kustom

Objek lain yang Anda gunakan dalam konteks proyek penambangan data, seperti bagan akurasi atau kueri prediksi, tidak dipertahankan dalam solusi, tetapi dapat diskrip menggunakan ASSL atau dibuat menggunakan AMO.

Selain itu, Anda dapat memperluas layanan dan fitur yang tersedia pada instans SQL Server Analysis Services dengan menambahkan objek kustom ini:

Rakitan kustom
Rakitan .NET dapat didefinisikan dengan menggunakan bahasa pengaduan CLR-atau COM apa pun, lalu terdaftar dengan instans SQL Server. File assembly dimuat dari lokasi yang ditentukan oleh aplikasi, dan salinan disimpan di server bersama dengan data. Salinan file assembly digunakan untuk memuat assembly setiap kali layanan dimulai.

Untuk informasi selengkapnya, lihat Manajemen Rakitan Model Multidaya.

Prosedur tersimpan kustom
SQL Server Analysis Services penggalian data mendukung penggunaan prosedur tersimpan untuk bekerja dengan objek penggalian data. Anda dapat membuat prosedur tersimpan Anda sendiri untuk memperluas fungsionalitas dan lebih mudah bekerja dengan data yang dikembalikan oleh kueri prediksi dan kueri konten.

Menentukan Prosedur Tersimpan

Prosedur tersimpan berikut ini didukung untuk digunakan dalam melakukan validasi silang.

Prosedur Tersimpan Penggalian Data (Analysis Services - Penggalian Data)

Selain itu, SQL Server Analysis Services berisi banyak prosedur tersimpan sistem yang digunakan secara internal untuk penambangan data. Meskipun prosedur tersimpan sistem adalah untuk penggunaan internal, Anda mungkin menemukannya pintasan yang berguna. Microsoft berhak mengubah prosedur tersimpan ini sesuai kebutuhan; oleh karena itu, untuk penggunaan produksi, kami sarankan Anda membuat kueri dengan menggunakan DMX, AMO, atau XMLA.

Algoritma plug-in kustom
SQL Server Analysis Services menyediakan mekanisme untuk membuat algoritma Anda sendiri, lalu menambahkan algoritma sebagai layanan penambangan data baru ke instans server.

Analysis Services menggunakan antarmuka COM untuk berkomunikasi dengan algoritma plugin. Untuk mempelajari selengkapnya tentang cara menerapkan algoritma baru, lihat Algoritma Plugin.

Anda harus mendaftarkan setiap algoritma baru sebelum dapat menggunakannya. Untuk mendaftarkan algoritma, Anda menambahkan metadata yang diperlukan untuk algoritma dalam file .ini instans SQL Server Analysis Services. Anda harus menambahkan informasi ke setiap instans tempat Anda berencana menggunakan algoritma baru. Setelah menambahkan algoritma, Anda dapat memulai ulang instans, dan menggunakan set baris skema MINING_SERVICES untuk melihat algoritma baru, termasuk opsi dan penyedia yang didukung algoritma.

Lihat juga

Memproses model multidmensional (Analysis Services)
Referensi Ekstensi Penggalian Data (DMX)