Bagikan melalui


Contoh Kueri Model Regresi Linier

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Saat Anda membuat kueri terhadap model penggalian data, Anda bisa membuat kueri konten, yang menyediakan detail tentang pola yang ditemukan dalam analisis, atau Anda bisa membuat kueri prediksi, yang menggunakan pola dalam model untuk membuat prediksi untuk data baru. Misalnya, kueri konten mungkin memberikan detail tambahan tentang rumus regresi, sementara kueri prediksi mungkin memberi tahu Anda jika titik data baru sesuai dengan model. Anda juga dapat mengambil metadata tentang model dengan menggunakan kueri.

Bagian ini menjelaskan cara membuat kueri untuk model yang didasarkan pada algoritma Regresi Linier Microsoft.

Catatan

Karena regresi linier didasarkan pada kasus khusus algoritma Microsoft Decision Trees, ada banyak kesamaan, dan beberapa model pohon keputusan yang menggunakan atribut yang dapat diprediksi berkelanjutan dapat berisi rumus regresi. Untuk informasi selengkapnya, lihat Referensi Teknis Algoritma Pohon Keputusan Microsoft.

Kueri konten

Menggunakan Himpunan Baris Skema Penggalian Data untuk menentukan parameter yang digunakan untuk model

Menggunakan DMX untuk mengembalikan rumus regresi untuk model

Mengembalikan hanya koefisien untuk model

Kueri prediksi

Memprediksi pendapatan menggunakan kueri database tunggal

Menggunakan fungsi prediksi dengan model regresi

Menemukan Informasi tentang Model Regresi Linier

Struktur model regresi linier sangat sederhana: model penambangan mewakili data sebagai simpul tunggal, yang menentukan rumus regresi. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Regresi Logistik (Analysis Services - Penggalian Data).

Kembali ke Atas

Kueri Sampel 1: Menggunakan Himpunan Baris Skema Penggalian Data untuk Menentukan Parameter yang Digunakan untuk Model

Dengan mengkueri kumpulan baris skema penggalian data, Anda dapat menemukan metadata tentang model. Ini mungkin termasuk ketika model dibuat, ketika model terakhir diproses, nama struktur penambangan yang didasarkan pada model, dan nama kolom yang ditetapkan sebagai atribut yang dapat diprediksi. Anda juga dapat mengembalikan parameter yang digunakan saat model pertama kali dibuat.

SELECT MINING_PARAMETERS   
FROM $system.DMSCHEMA_MINING_MODELS  
WHERE MODEL_NAME = 'TM_PredictIncome'  

Hasil sampel:

MINING_PARAMETERS
COMPLEXITY_PENALTY=0,9,

MAXIMUM_INPUT_ATTRIBUTES=255,

MAXIMUM_OUTPUT_ATTRIBUTES=255,

MINIMUM_SUPPORT=10,

SCORE_METHOD=4,

SPLIT_METHOD=3,

FORCE_REGRESSOR=

Catatan

Pengaturan parameter, "FORCE_REGRESSOR = ", menunjukkan bahwa nilai saat ini untuk parameter FORCE_REGRESSOR null.

Kembali ke Atas

Kueri Sampel 2: Mengambil Rumus Regresi untuk Model

Kueri berikut mengembalikan konten model penambangan untuk model regresi linier yang dibangun dengan menggunakan sumber data Surat Bertarget yang sama yang digunakan dalam Tutorial Penggalian Data Dasar. Model ini memprediksi pendapatan pelanggan berdasarkan usia.

Kueri mengembalikan konten simpul yang berisi rumus regresi. Setiap variabel dan koefisien disimpan dalam baris terpisah dari tabel NODE_DISTRIBUTION berlapis. Jika Anda ingin melihat rumus regresi lengkap, gunakan Penampil Pohon Microsoft, klik simpul (Semua), dan buka Legenda Penambangan.

SELECT FLATTENED NODE_DISTRIBUTION as t  
FROM LR_PredictIncome.CONTENT  

Catatan

Jika Anda mereferensikan kolom individual dari tabel berlapis dengan menggunakan kueri seperti SELECT <column name> from NODE_DISTRIBUTION, beberapa kolom, seperti DUKUNGAN atau PROBABILITAS, harus diapit dalam tanda kurung untuk membedakannya dari kata kunci yang dicadangkan dengan nama yang sama.

Hasil yang diharapkan:

t.ATTRIBUTE_NAME t.ATTRIBUTE_VALUE t.SUPPORT t.PROBABILITAS t.VARIANS t.VALUETYPE
Pendapatan Tahunan Tidak ada 0 0.000457142857142857 0 1
Pendapatan Tahunan 57220.8876687257 17484 0.999542857142857 1041275619.52776 3
Usia 471.687717702463 0 0 126.969442359327 7
Usia 234.680904692439 0 0 0 8
Usia 45.4269617936399 0 0 126.969442359327 9
35793.5477381267 0 0 1012968919.28372 11

Sebagai perbandingan, dalam Legenda Penambangan, rumus regresi muncul sebagai berikut:

Yearly Income = 57,220.919 + 471.688 * (Age - 45.427)

Anda dapat melihat bahwa dalam Legenda Penambangan, beberapa angka dibulatkan; namun, tabel NODE_DISTRIBUTION dan Legenda Penambangan pada dasarnya berisi nilai yang sama.

Nilai dalam kolom VALUETYPE memberi tahu Anda jenis informasi apa yang terkandung dalam setiap baris, yang berguna jika Anda memproses hasilnya secara terprogram. Tabel berikut ini memperlihatkan jenis nilai yang merupakan output untuk rumus regresi linier.

VALUETYPE
1 (Hilang)
3 (Berkelanjutan)
7 (Koefisien)
8 (Perolehan Skor)
9 (Statistik)
7 (Koefisien)
8 (Perolehan Skor)
9 (Statistik)
11 (Intersepsi)

Untuk informasi selengkapnya tentang arti setiap jenis nilai untuk model regresi, lihat Menambang Konten Model untuk Model Regresi Linier (Analysis Services - Penggalian Data).

Kembali ke Atas

Kueri Sampel 3: Hanya Mengembalikan Koefisien untuk Model

Dengan menggunakan enumerasi VALUETYPE, Anda hanya dapat mengembalikan koefisien untuk persamaan regresi, seperti yang diperlihatkan dalam kueri berikut:

SELECT FLATTENED MODEL_NAME,  
    (SELECT ATTRIBUTE_VALUE, VALUETYPE  
     FROM NODE_DISTRIBUTION  
     WHERE VALUETYPE = 11)   
AS t  
FROM LR_PredictIncome.CONTENT  

Kueri ini mengembalikan dua baris, satu dari konten model penambangan, dan baris dari tabel berlapis yang berisi koefisien. Kolom ATTRIBUTE_NAME tidak disertakan di sini karena selalu kosong untuk koefisien.

MODEL_NAME t.ATTRIBUTE_VALUE t.VALUETYPE
LR_PredictIncome
LR_PredictIncome 35793.5477381267 11

Kembali ke Atas

Membuat Prediksi dari Model Regresi Linier

Anda dapat membuat kueri prediksi pada model regresi linier dengan menggunakan tab Prediksi Model Penambangan di Designer Penggalian Data. Penyusun kueri prediksi tersedia di SQL Server Management Studio dan SQL Server Data Tools.

Catatan

Anda juga bisa membuat kueri pada model regresi dengan menggunakan Add-in Penggalian Data SQL Server 2005 (9.x) untuk Excel atau Add-in Penggalian Data SQL Server 2008 untuk Excel. Meskipun Add-in Penggalian Data untuk Excel tidak membuat model regresi, Anda dapat menelusuri dan mengkueri model penambangan apa pun yang disimpan pada instans SQL Server Analysis Services.

Kembali ke Atas

Kueri Sampel 4: Memprediksi Pendapatan menggunakan Kueri Singleton

Cara termampu untuk membuat satu kueri pada model regresi adalah dengan menggunakan kotak dialog Input Kueri Singleton . Misalnya, Anda dapat membuat kueri DMX berikut dengan memilih model regresi yang sesuai, memilih Kueri Singleton, lalu mengetik 20 sebagai nilai untuk Usia.

SELECT [LR_PredictIncome].[Yearly Income]  
From   [LR_PredictIncome]  
NATURAL PREDICTION JOIN  
(SELECT 20 AS [Age]) AS t  

Hasil sampel:

Pendapatan Tahunan
45227.302092176

Kembali ke Atas

Kueri Sampel 5: Menggunakan Fungsi Prediksi dengan Model Regresi

Anda dapat menggunakan banyak fungsi prediksi standar dengan model regresi linier. Contoh berikut menggambarkan cara menambahkan beberapa statistik deskriptif ke hasil kueri prediksi. Dari hasil ini, Anda dapat melihat bahwa ada penyimpangan yang cukup besar dari rata-rata untuk model ini.

SELECT  
  ([LR_PredictIncome].[Yearly Income]) as [PredIncome],  
  (PredictStdev([LR_PredictIncome].[Yearly Income])) as [StDev1]  
From  
  [LR_PredictIncome]  
NATURAL PREDICTION JOIN  
(SELECT 20 AS [Age]) AS t  

Hasil sampel:

Pendapatan Tahunan StDev1
45227.302092176 31827.1726561396

Kembali ke Atas

Daftar Fungsi Prediksi

Semua algoritma Microsoft mendukung serangkaian fungsi umum. Namun, algoritma Regresi Linier Microsoft mendukung fungsi tambahan yang tercantum dalam tabel berikut.

Fungsi Prediksi Penggunaan
IsDescendant (DMX) Menentukan apakah satu simpul adalah anak dari simpul lain dalam model.
IsInNode (DMX) Menunjukkan apakah simpul yang ditentukan berisi kasus saat ini.
PredictHistogram (DMX) Mengembalikan nilai yang diprediksi, atau sekumpulan nilai, untuk kolom tertentu.
PredictNodeId (DMX) Mengembalikan Node_ID untuk setiap kasus.
PredictStdev (DMX) Mengembalikan simpannan standar untuk nilai yang diprediksi.
PredictSupport (DMX) Mengembalikan nilai dukungan untuk status tertentu.
PredictVariance (DMX) Mengembalikan varian kolom tertentu.

Untuk daftar fungsi yang umum untuk semua algoritma Microsoft, lihat Algoritma Penggalian Data (Analysis Services - Penggalian Data). Untuk informasi selengkapnya tentang cara menggunakan fungsi ini, lihat Referensi Fungsi Ekstensi Penggalian Data (DMX).

Lihat juga

Algoritma Regresi Linier Microsoft
Kueri Penggalian Data
Referensi Teknis Algoritma Regresi Linier Microsoft
Menambang Konten Model untuk Model Regresi Linier (Analysis Services - Penggalian Data)