Algoritma Regresi Linier Microsoft
Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Algoritma Microsoft Linear Regression adalah variasi algoritma Microsoft Decision Trees yang membantu Anda menghitung hubungan linier antara variabel dependen dan independen, lalu menggunakan hubungan tersebut untuk prediksi.
Hubungan ini mengambil bentuk persamaan untuk garis yang paling mewakili serangkaian data. Misalnya, baris dalam diagram berikut adalah representasi linier terbaik dari data.
Setiap titik data dalam diagram memiliki kesalahan yang terkait dengan jaraknya dari garis regresi. Koefisien a dan b dalam persamaan regresi menyesuaikan sudut dan lokasi garis regresi. Anda dapat memperoleh persamaan regresi dengan menyesuaikan a dan b hingga jumlah kesalahan yang terkait dengan semua titik mencapai minimumnya.
Ada jenis regresi lain yang menggunakan beberapa variabel, dan juga metode regresi nonlinear. Namun, regresi linier adalah metode yang berguna dan terkenal untuk memodelkan respons terhadap perubahan dalam beberapa faktor yang mendasar.
Contoh
Anda dapat menggunakan regresi linier untuk menentukan hubungan antara dua kolom berkelanjutan. Misalnya, Anda dapat menggunakan regresi linier untuk menghitung garis tren dari manufaktur atau data penjualan. Anda juga dapat menggunakan regresi linier sebagai pendahulu pengembangan model penambangan data yang lebih kompleks, untuk menilai hubungan di antara kolom data.
Meskipun ada banyak cara untuk menghitung regresi linier yang tidak memerlukan alat penggalian data, keuntungan menggunakan algoritma Microsoft Linear Regression untuk tugas ini adalah bahwa semua kemungkinan hubungan di antara variabel secara otomatis dihitung dan diuji. Anda tidak perlu memilih metode komputasi, seperti memecahkan untuk kuadrat paling sedikit. Namun, regresi linier mungkin menyederhanakan hubungan dalam skenario di mana beberapa faktor memengaruhi hasil.
Cara Kerja Algoritma
Algoritma Microsoft Linear Regression adalah variasi dari algoritma Microsoft Decision Trees. Saat Anda memilih algoritma Regresi Linier Microsoft, kasus khusus algoritma Microsoft Decision Trees dipanggil, dengan parameter yang membatasi perilaku algoritma dan memerlukan jenis data input tertentu. Selain itu, dalam model regresi linier, seluruh himpunan data digunakan untuk menghitung hubungan dalam pass awal, sedangkan model pohon keputusan standar membagi data berulang kali menjadi subset atau pohon yang lebih kecil.
Data yang Diperlukan untuk Model Regresi Linier
Ketika Anda menyiapkan data untuk digunakan dalam model regresi linier, Anda harus memahami persyaratan untuk algoritma tertentu. Ini termasuk berapa banyak data yang diperlukan, dan bagaimana data digunakan. Persyaratan untuk jenis model ini adalah sebagai berikut:
Kolom kunci tunggal Setiap model harus berisi satu kolom numerik atau teks yang secara unik mengidentifikasi setiap rekaman. Kunci campuran tidak diizinkan.
Kolom yang dapat diprediksi Memerlukan setidaknya satu kolom yang dapat diprediksi. Anda dapat menyertakan beberapa atribut yang dapat diprediksi dalam model, tetapi atribut yang dapat diprediksi harus merupakan jenis data numerik berkelanjutan. Anda tidak dapat menggunakan jenis data tanggalwaktu sebagai atribut yang dapat diprediksi meskipun penyimpanan asli untuk data bersifat numerik.
Kolom input Kolom input harus berisi data numerik berkelanjutan dan diberi jenis data yang sesuai.
Untuk informasi selengkapnya, lihat bagian Persyaratan dari Referensi Teknis Algoritma Regresi Linier Microsoft.
Menampilkan Model Regresi Linier
Untuk menjelajahi model, Anda menggunakan Microsoft Tree Viewer. Struktur pohon untuk model regresi linier sangat sederhana, dengan semua informasi tentang persamaan regresi yang terkandung dalam satu simpul. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Microsoft Tree Viewer.
Jika Anda ingin mengetahui detail selengkapnya tentang persamaan, Anda juga dapat melihat koefisien dan detail lainnya dengan menggunakan Penampil Pohon Konten Generik Microsoft.
Untuk model regresi linier, konten model menyertakan metadata, rumus regresi, dan statistik tentang distribusi nilai input. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Regresi Linier (Analysis Services - Penggalian Data).
Membuat Prediksi
Setelah model diproses, hasilnya disimpan sebagai serangkaian statistik bersama dengan rumus regresi linier, yang dapat Anda gunakan untuk menghitung tren di masa mendatang. Untuk contoh kueri yang akan digunakan dengan model regresi linier, lihat Contoh Kueri Model Regresi Linier.
Untuk informasi umum tentang cara membuat kueri terhadap model penambangan, lihat Kueri Penggalian Data.
Selain membuat model regresi linier dengan memilih algoritma Regresi Linier Microsoft, jika atribut yang dapat diprediksi adalah jenis data numerik berkelanjutan, Anda dapat membuat model pohon keputusan yang berisi regresi. Dalam hal ini, algoritma akan membagi data ketika menemukan titik pemisahan yang sesuai, tetapi untuk beberapa wilayah data, akan membuat rumus regresi sebagai gantinya. Untuk informasi selengkapnya tentang pohon regresi dalam model pohon keputusan, lihat Menambang Konten Model untuk Model Pohon Keputusan (Analysis Services - Penggalian Data).
Keterangan
Tidak mendukung penggunaan Predictive Model Markup Language (PMML) untuk membuat model penambangan.
Tidak mendukung pembuatan dimensi penggalian data.
Mendukung penelusuran.
Mendukung penggunaan model penambangan OLAP.
Lihat juga
Algoritma Penggalian Data (Analysis Services - Penggalian Data)
Referensi Teknis Algoritma Regresi Linier Microsoft
Contoh Kueri Model Regresi Linier
Konten Model Penambangan untuk Model Regresi Linier (Analysis Services - Penggalian Data)