Algoritma Regresi Logistik Microsoft
Berlaku untuk: SQL Server 2019 dan Analysis Services
Azure Analysis Services
Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Regresi logistik adalah teknik statistik terkenal yang digunakan untuk memodelkan hasil biner.
Ada berbagai implementasi regresi logistik dalam penelitian statistik, menggunakan teknik pembelajaran yang berbeda. Algoritma Microsoft Logistic Regression telah diterapkan dengan menggunakan variasi algoritma Microsoft Neural Network. Algoritma ini berbagi banyak kualitas jaringan neural tetapi lebih mudah dilatih.
Salah satu keuntungan dari regresi logistik adalah bahwa algoritma sangat fleksibel, mengambil segala jenis input, dan mendukung beberapa tugas analitik yang berbeda:
Gunakan demografi untuk membuat prediksi tentang hasil, seperti risiko untuk penyakit tertentu.
Jelajahi dan beratkan faktor-faktor yang berkontribusi pada hasil. Misalnya, temukan faktor-faktor yang memengaruhi pelanggan untuk melakukan kunjungan berulang ke toko.
Mengklasifikasikan dokumen, email, atau objek lain yang memiliki banyak atribut.
Contoh
Pertimbangkan sekelompok orang yang berbagi informasi demografis serupa dan yang membeli produk dari perusahaan Adventure Works. Dengan memodelkan data yang terkait dengan hasil tertentu, seperti pembelian produk target, Anda dapat melihat bagaimana informasi demografis berkontribusi pada kemungkinan seseorang membeli produk target.
Cara Kerja Algoritma
Regresi logistik adalah metode statistik terkenal untuk menentukan kontribusi beberapa faktor untuk sepasang hasil. Implementasi Microsoft menggunakan jaringan neural yang dimodifikasi untuk memodelkan hubungan antara input dan output. Efek dari setiap input pada output diukur, dan berbagai input ditimbang dalam model jadi. Regresi logistik nama berasal dari fakta bahwa kurva data dikompresi dengan menggunakan transformasi logistik, untuk meminimalkan efek nilai ekstrem. Untuk informasi selengkapnya tentang implementasi, dan cara menyesuaikan algoritma, lihat Referensi Teknis Algoritma Regresi Logistik Microsoft.
Data yang Diperlukan untuk Model Regresi Logistik
Ketika Anda menyiapkan data untuk digunakan dalam melatih model regresi logistik, Anda harus memahami persyaratan untuk algoritma tertentu, termasuk berapa banyak data yang diperlukan, dan bagaimana data digunakan.
Persyaratan untuk model regresi logistik adalah sebagai berikut:
Kolom kunci tunggal Setiap model harus berisi satu kolom numerik atau teks yang secara unik mengidentifikasi setiap rekaman. Kunci campuran tidak diperbolehkan.
Kolom input Setiap model harus berisi setidaknya satu kolom input yang berisi nilai yang digunakan sebagai faktor dalam analisis. Anda dapat memiliki kolom input sebanyak yang Anda inginkan, tetapi tergantung pada jumlah nilai di setiap kolom, penambahan kolom tambahan dapat meningkatkan waktu yang diperlukan untuk melatih model.
Setidaknya satu kolom yang dapat diprediksi Model harus berisi setidaknya satu kolom yang dapat diprediksi dari jenis data apa pun, termasuk data numerik berkelanjutan. Nilai kolom yang dapat diprediksi juga dapat diperlakukan sebagai input ke model, atau Anda dapat menentukan bahwa kolom tersebut hanya digunakan untuk prediksi. Tabel berlapis tidak diizinkan untuk kolom yang dapat diprediksi, tetapi dapat digunakan sebagai input.
Untuk informasi lebih rinci tentang jenis konten dan jenis data yang didukung untuk model regresi logistik, lihat bagian Persyaratan dari Referensi Teknis Algoritma Regresi Logistik Microsoft.
Menampilkan Model Regresi Logistik
Untuk menjelajahi model, Anda dapat menggunakan Penampil Jaringan Neural Microsoft, atau Penampil Pohon Konten Generik Microsoft.
Saat Anda melihat model dengan menggunakan Penampil Jaringan Neural Microsoft, Analysis Services menunjukkan kepada Anda faktor-faktor yang berkontribusi pada hasil tertentu, yang diberi peringkat berdasarkan kepentingannya. Anda dapat memilih atribut dan nilai untuk dibandingkan. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Penampil Jaringan Neural Microsoft.
Jika anda ingin tahu lebih banyak, Anda dapat menelusuri detail model dengan menggunakan Microsoft Generic Content Tree Viewer. Konten model untuk model regresi logistik mencakup simpul marginal yang menunjukkan kepada Anda semua input yang digunakan untuk model, dan subjaringan untuk atribut yang dapat diprediksi. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Regresi Logistik (Analysis Services - Penggalian Data).
Membuat Prediksi
Setelah model dilatih, Anda dapat membuat kueri terhadap konten model untuk mendapatkan koefisien regresi dan detail lainnya, atau Anda dapat menggunakan model untuk membuat prediksi.
Untuk informasi umum tentang cara membuat kueri terhadap model penggalian data, lihat Kueri Penggalian Data.
Untuk contoh kueri pada model regresi logistik, lihat Contoh Kueri Model Pengklusteran.
Keterangan
Tidak mendukung penelusuran. Ini karena struktur simpul dalam model penambangan tidak selalu sesuai langsung dengan data yang mendasar.
Tidak mendukung pembuatan dimensi penambangan data.
Mendukung penggunaan model penambangan OLAP.
Tidak mendukung penggunaan Predictive Model Markup Language (PMML) untuk membuat model penambangan.
Lihat juga
Menambang Konten Model untuk Model Regresi Logistik (Analysis Services - Penggalian Data)
Referensi Teknis Algoritma Regresi Logistik Microsoft
Contoh Kueri Model Regresi Logistik
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk