Bagikan melalui


Algoritma Regresi Logistik Microsoft

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Regresi logistik adalah teknik statistik terkenal yang digunakan untuk memodelkan hasil biner.

Ada berbagai implementasi regresi logistik dalam penelitian statistik, menggunakan teknik pembelajaran yang berbeda. Algoritma Microsoft Logistic Regression telah diterapkan dengan menggunakan variasi algoritma Microsoft Neural Network. Algoritma ini berbagi banyak kualitas jaringan neural tetapi lebih mudah dilatih.

Salah satu keuntungan dari regresi logistik adalah bahwa algoritma sangat fleksibel, mengambil segala jenis input, dan mendukung beberapa tugas analitik yang berbeda:

  • Gunakan demografi untuk membuat prediksi tentang hasil, seperti risiko untuk penyakit tertentu.

  • Jelajahi dan beratkan faktor-faktor yang berkontribusi pada hasil. Misalnya, temukan faktor-faktor yang memengaruhi pelanggan untuk melakukan kunjungan berulang ke toko.

  • Mengklasifikasikan dokumen, email, atau objek lain yang memiliki banyak atribut.

Contoh

Pertimbangkan sekelompok orang yang berbagi informasi demografis serupa dan yang membeli produk dari perusahaan Adventure Works. Dengan memodelkan data yang terkait dengan hasil tertentu, seperti pembelian produk target, Anda dapat melihat bagaimana informasi demografis berkontribusi pada kemungkinan seseorang membeli produk target.

Cara Kerja Algoritma

Regresi logistik adalah metode statistik terkenal untuk menentukan kontribusi beberapa faktor untuk sepasang hasil. Implementasi Microsoft menggunakan jaringan neural yang dimodifikasi untuk memodelkan hubungan antara input dan output. Efek dari setiap input pada output diukur, dan berbagai input ditimbang dalam model jadi. Regresi logistik nama berasal dari fakta bahwa kurva data dikompresi dengan menggunakan transformasi logistik, untuk meminimalkan efek nilai ekstrem. Untuk informasi selengkapnya tentang implementasi, dan cara menyesuaikan algoritma, lihat Referensi Teknis Algoritma Regresi Logistik Microsoft.

Data yang Diperlukan untuk Model Regresi Logistik

Ketika Anda menyiapkan data untuk digunakan dalam melatih model regresi logistik, Anda harus memahami persyaratan untuk algoritma tertentu, termasuk berapa banyak data yang diperlukan, dan bagaimana data digunakan.

Persyaratan untuk model regresi logistik adalah sebagai berikut:

Kolom kunci tunggal Setiap model harus berisi satu kolom numerik atau teks yang secara unik mengidentifikasi setiap rekaman. Kunci campuran tidak diperbolehkan.

Kolom input Setiap model harus berisi setidaknya satu kolom input yang berisi nilai yang digunakan sebagai faktor dalam analisis. Anda dapat memiliki kolom input sebanyak yang Anda inginkan, tetapi tergantung pada jumlah nilai di setiap kolom, penambahan kolom tambahan dapat meningkatkan waktu yang diperlukan untuk melatih model.

Setidaknya satu kolom yang dapat diprediksi Model harus berisi setidaknya satu kolom yang dapat diprediksi dari jenis data apa pun, termasuk data numerik berkelanjutan. Nilai kolom yang dapat diprediksi juga dapat diperlakukan sebagai input ke model, atau Anda dapat menentukan bahwa kolom tersebut hanya digunakan untuk prediksi. Tabel berlapis tidak diizinkan untuk kolom yang dapat diprediksi, tetapi dapat digunakan sebagai input.

Untuk informasi lebih rinci tentang jenis konten dan jenis data yang didukung untuk model regresi logistik, lihat bagian Persyaratan dari Referensi Teknis Algoritma Regresi Logistik Microsoft.

Menampilkan Model Regresi Logistik

Untuk menjelajahi model, Anda dapat menggunakan Penampil Jaringan Neural Microsoft, atau Penampil Pohon Konten Generik Microsoft.

Saat Anda melihat model dengan menggunakan Penampil Jaringan Neural Microsoft, Analysis Services menunjukkan kepada Anda faktor-faktor yang berkontribusi pada hasil tertentu, yang diberi peringkat berdasarkan kepentingannya. Anda dapat memilih atribut dan nilai untuk dibandingkan. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Penampil Jaringan Neural Microsoft.

Jika anda ingin tahu lebih banyak, Anda dapat menelusuri detail model dengan menggunakan Microsoft Generic Content Tree Viewer. Konten model untuk model regresi logistik mencakup simpul marginal yang menunjukkan kepada Anda semua input yang digunakan untuk model, dan subjaringan untuk atribut yang dapat diprediksi. Untuk informasi selengkapnya, lihat Menambang Konten Model untuk Model Regresi Logistik (Analysis Services - Penggalian Data).

Membuat Prediksi

Setelah model dilatih, Anda dapat membuat kueri terhadap konten model untuk mendapatkan koefisien regresi dan detail lainnya, atau Anda dapat menggunakan model untuk membuat prediksi.

Keterangan

  • Tidak mendukung penelusuran. Ini karena struktur simpul dalam model penambangan tidak selalu sesuai langsung dengan data yang mendasar.

  • Tidak mendukung pembuatan dimensi penambangan data.

  • Mendukung penggunaan model penambangan OLAP.

  • Tidak mendukung penggunaan Predictive Model Markup Language (PMML) untuk membuat model penambangan.

Lihat juga

Menambang Konten Model untuk Model Regresi Logistik (Analysis Services - Penggalian Data)
Referensi Teknis Algoritma Regresi Logistik Microsoft
Contoh Kueri Model Regresi Logistik