Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Berlaku untuk:
SQL Server 2019 dan versi Analysis Services sebelumnya
Azure Analysis Services
Fabric/Power BI Premium
Penting
Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Algoritma Microsoft Linear Regression adalah variasi algoritma Microsoft Decision Trees yang membantu Anda menghitung hubungan linier antara variabel dependen dan independen, lalu menggunakan hubungan tersebut untuk prediksi.
Hubungan mengambil bentuk persamaan untuk garis yang paling mewakili serangkaian data. Misalnya, baris dalam diagram berikut adalah representasi linier terbaik dari data.
Setiap titik data dalam diagram memiliki kesalahan yang terkait dengan jaraknya dari garis regresi. Koefisien a dan b dalam persamaan regresi menyesuaikan sudut dan lokasi garis regresi. Anda dapat memperoleh persamaan regresi dengan menyesuaikan a dan b hingga jumlah kesalahan yang terkait dengan semua titik mencapai minimumnya.
Ada jenis regresi lain yang menggunakan beberapa variabel, dan juga metode regresi nonlinear. Namun, regresi linier adalah metode yang berguna dan terkenal untuk memodelkan respons terhadap perubahan dalam beberapa faktor yang mendasar.
Example
Anda dapat menggunakan regresi linier untuk menentukan hubungan antara dua kolom berkelanjutan. Misalnya, Anda dapat menggunakan regresi linier untuk menghitung garis tren dari manufaktur atau data penjualan. Anda juga dapat menggunakan regresi linier sebagai prekursor untuk pengembangan model penambangan data yang lebih kompleks, untuk menilai hubungan di antara kolom data.
Meskipun ada banyak cara untuk menghitung regresi linier yang tidak memerlukan alat penambangan data, keuntungan menggunakan algoritma Microsoft Linear Regression untuk tugas ini adalah bahwa semua kemungkinan hubungan di antara variabel secara otomatis dihitung dan diuji. Anda tidak perlu memilih metode komputasi, seperti memecahkan kuadrat paling sedikit. Namun, regresi linier mungkin menyederhanakan hubungan dalam skenario di mana beberapa faktor memengaruhi hasil.
Cara Kerja Algoritma
Algoritma Microsoft Linear Regression adalah variasi algoritma Microsoft Decision Trees. Saat Anda memilih algoritma Microsoft Linear Regression, kasus khusus algoritma Microsoft Decision Trees dipanggil, dengan parameter yang membatasi perilaku algoritma dan memerlukan jenis data input tertentu. Selain itu, dalam model regresi linier, seluruh himpunan data digunakan untuk hubungan komputasi dalam pass awal, sedangkan model pohon keputusan standar membagi data berulang kali menjadi subset atau pohon yang lebih kecil.
Data yang Diperlukan untuk Model Regresi Linier
Ketika Anda menyiapkan data untuk digunakan dalam model regresi linier, Anda harus memahami persyaratan untuk algoritma tertentu. Ini termasuk berapa banyak data yang diperlukan, dan bagaimana data digunakan. Persyaratan untuk jenis model ini adalah sebagai berikut:
Kolom kunci tunggal Setiap model harus berisi satu kolom numerik atau teks yang secara unik mengidentifikasi setiap rekaman. Kunci gabungan tidak diizinkan.
Kolom yang dapat diprediksi Memerlukan setidaknya satu kolom yang dapat diprediksi. Anda dapat menyertakan beberapa atribut yang dapat diprediksi dalam model, tetapi atribut yang dapat diprediksi harus jenis data numerik berkelanjutan. Anda tidak dapat menggunakan jenis data tanggalwaktu sebagai atribut yang dapat diprediksi meskipun penyimpanan asli untuk data bersifat numerik.
Kolom input Kolom input harus berisi data numerik berkelanjutan dan diberi jenis data yang sesuai.
Untuk informasi selengkapnya, lihat bagian Persyaratan dari Referensi Teknis Algoritma Regresi Linier Microsoft.
Menampilkan Model Regresi Linier
Untuk menjelajahi model, Anda menggunakan Penampil Pohon Microsoft. Struktur pohon untuk model regresi linier sangat sederhana, dengan semua informasi tentang persamaan regresi yang terkandung dalam satu simpul. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Penampil Pohon Microsoft.
Jika Anda ingin mengetahui detail selengkapnya tentang persamaan, Anda juga dapat melihat koefisien dan detail lainnya dengan menggunakan Penampil Pohon Konten Generik Microsoft.
Untuk model regresi linier, konten model mencakup metadata, rumus regresi, dan statistik tentang distribusi nilai input. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Regresi Linier (Analysis Services - Data Mining).
Membuat Prediksi
Setelah model diproses, hasilnya disimpan sebagai sekumpulan statistik bersama dengan rumus regresi linier, yang dapat Anda gunakan untuk menghitung tren di masa mendatang. Untuk contoh kueri yang akan digunakan dengan model regresi linier, lihat Contoh Kueri Model Regresi Linier.
Untuk informasi umum tentang cara membuat kueri terhadap model penambangan, lihat Kueri Penggalian Data.
Selain membuat model regresi linier dengan memilih algoritma Microsoft Linear Regression, jika atribut yang dapat diprediksi adalah jenis data numerik berkelanjutan, Anda dapat membuat model pohon keputusan yang berisi regresi. Dalam hal ini, algoritma akan membagi data ketika menemukan titik pemisahan yang sesuai, tetapi untuk beberapa wilayah data, akan membuat rumus regresi sebagai gantinya. Untuk informasi selengkapnya tentang pohon regresi dalam model pohon keputusan, lihat Menambang Konten Model untuk Model Pohon Keputusan (Analysis Services - Data Mining).
Komentar
Tidak mendukung penggunaan Predictive Model Markup Language (PMML) untuk membuat model penambangan.
Tidak mendukung pembuatan dimensi penambangan data.
Mendukung penelusuran.
Mendukung penggunaan model penambangan OLAP.
Lihat Juga
Algoritma Penambangan Data (Analysis Services - Penambangan Data)
Referensi Teknis Algoritma Regresi Linier Microsoft
Contoh Kueri Model Regresi Linier
Menambang Konten Model untuk Model Regresi Linier (Analysis Services - Penggalian Data)