Bendera Pemodelan (Penggalian Data)
Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Anda dapat menggunakan bendera pemodelan di SQL Server SQL Server Analysis Services untuk memberikan informasi tambahan ke algoritma penggalian data tentang data yang ditentukan dalam tabel kasus. Algoritma dapat menggunakan informasi ini untuk membangun model penambangan data yang lebih akurat.
Beberapa bendera pemodelan didefinisikan pada tingkat struktur penambangan, sedangkan yang lain didefinisikan pada tingkat kolom model penambangan. Misalnya, bendera pemodelan NOT NULL digunakan dengan kolom struktur penambangan. Anda dapat menentukan bendera pemodelan tambahan pada kolom model penambangan, tergantung pada algoritma yang Anda gunakan untuk membuat model.
Catatan
Plug-in pihak ketiga mungkin memiliki bendera pemodelan lain, selain yang telah ditentukan sebelumnya oleh SQL Server Analysis Services.
Daftar Bendera Pemodelan
Daftar berikut ini menjelaskan bendera pemodelan yang didukung di SQL Server Analysis Services. Untuk informasi tentang bendera pemodelan yang didukung oleh algoritma tertentu, lihat topik referensi teknis untuk algoritma yang digunakan untuk membuat model.
NOT_NULL
Menunjukkan bahwa nilai untuk kolom atribut tidak boleh berisi nilai null. Kesalahan akan mengakibatkan jika SQL Server Analysis Services menemukan nilai null untuk kolom atribut ini selama proses pelatihan model.
MODEL_EXISTENCE_ONLY
Menunjukkan bahwa kolom akan diperlakukan sebagai memiliki dua status: Hilang dan Sudah Ada. Jika nilainya NULL, nilai diperlakukan sebagai Hilang. Bendera MODEL_EXISTENCE_ONLY diterapkan ke atribut yang dapat diprediksi dan didukung oleh sebagian besar algoritma.
Akibatnya, mengatur bendera MODEL_EXISTENCE_ONLY ke True mengubah representasi nilai sehingga hanya ada dua status: Hilang dan Sudah Ada. Semua status yang tidak hilang digabungkan ke dalam satu nilai yang Ada .
Penggunaan umum untuk bendera pemodelan ini akan berada dalam atribut di mana status NULL memiliki arti implisit, dan nilai eksplisit status NOT NULL mungkin tidak sepenting fakta bahwa kolom memiliki nilai apa pun. Misalnya, kolom [DateContractSigned] mungkin NULL jika kontrak tidak pernah ditandatangani dan TIDAK NULL jika kontrak ditandatangani. Oleh karena itu, jika tujuan model adalah untuk memprediksi apakah kontrak akan ditandatangani, Anda dapat menggunakan bendera MODEL_EXISTENCE_ONLY untuk mengabaikan nilai tanggal yang tepat dalam kasus NOT NULL dan membedakan hanya antara kasus di mana kontrak Hilang atau Sudah Ada.
Catatan
Hilang adalah status khusus yang digunakan oleh algoritma, dan berbeda dari nilai teks "Hilang" dalam kolom. Untuk informasi selengkapnya, lihat Nilai yang Hilang (Analysis Services - Penggalian Data).
REGRESSOR
Menunjukkan bahwa kolom adalah kandidat untuk digunakan sebagai regresor selama pemrosesan. Bendera ini ditentukan pada kolom model penambangan, dan hanya dapat diterapkan ke kolom yang memiliki jenis data numerik berkelanjutan. Untuk informasi selengkapnya tentang penggunaan bendera ini, lihat bagian dalam topik ini, Penggunaan Bendera Pemodelan REGRESSOR.
Menampilkan dan Mengubah Bendera Pemodelan
Anda dapat melihat bendera pemodelan yang terkait dengan kolom struktur penambangan atau kolom model di Penggalian Data Designer dengan melihat properti struktur atau model.
Untuk menentukan bendera pemodelan mana yang telah diterapkan ke struktur penambangan saat ini, Anda dapat membuat kueri terhadap himpunan baris skema penambangan data yang mengembalikan bendera pemodelan hanya untuk kolom struktur, dengan menggunakan kueri seperti berikut:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'
Anda dapat menambahkan atau mengubah bendera pemodelan yang digunakan dalam model dengan menggunakan Designer Penggalian Data dan mengedit properti kolom terkait. Perubahan tersebut mengharuskan struktur atau model diolah ulang.
Anda dapat menentukan bendera pemodelan dalam struktur penambangan atau model penambangan baru dengan menggunakan DMX, atau dengan menggunakan skrip AMO atau XMLA. Namun, Anda tidak dapat mengubah bendera pemodelan yang digunakan dalam model dan struktur penambangan yang ada dengan menggunakan DMX. Anda harus membuat model penambangan baru dengan menggunakan sintaks, ALTER MINING STRUCTURE....ADD MINING MODEL
.
Penggunaan Bendera Pemodelan REGRESSOR
Saat Anda mengatur bendera pemodelan REGRESSOR pada kolom, Anda menunjukkan algoritma bahwa kolom berisi regresi potensial. Regresi aktual yang digunakan dalam model ditentukan oleh algoritma. Regresor potensial dapat dibuang jika tidak memodelkan atribut yang dapat diprediksi.
Saat Anda membuat model dengan menggunakan wizard Penggalian Data, semua kolom input berkelanjutan ditandai sebagai regresor yang mungkin. Oleh karena itu, bahkan jika Anda tidak secara eksplisit mengatur bendera REGRESSOR pada kolom, kolom dapat digunakan sebagai regresor dalam model.
Anda dapat menentukan regresi yang benar-benar digunakan dalam model yang diproses dengan melakukan kueri terhadap set baris skema untuk model penambangan, seperti yang ditunjukkan dalam contoh berikut:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_COLUMNS
WHERE MODEL_NAME = '<model name>'
Catatan Jika Anda memodifikasi model penambangan dan mengubah jenis konten kolom dari berkelanjutan ke diskrit, Anda harus mengubah bendera secara manual pada kolom penambangan lalu memproses ulang model.
Regresi dalam Model Regresi Linier
Model regresi linier didasarkan pada algoritma Pohon Keputusan Microsoft. Bahkan jika Anda tidak menggunakan algoritma Regresi Linier Microsoft, model pohon keputusan apa pun dapat berisi pohon atau simpul yang mewakili regresi pada atribut berkelanjutan.
Oleh karena itu, dalam model ini Anda tidak perlu menentukan bahwa kolom berkelanjutan mewakili regresor. Algoritma Microsoft Decision Trees akan mempartisi himpunan data ke wilayah dengan pola yang bermakna bahkan jika Anda tidak mengatur bendera REGRESSOR pada kolom. Perbedaannya adalah bahwa ketika Anda mengatur bendera pemodelan, algoritma akan mencoba menemukan persamaan regresi dari bentuk berikut agar sesuai dengan pola dalam simpul pohon.
a*C1 + b*C2 + ...
Kemudian, jumlah residu dihitung, dan jika penyimpangan terlalu besar, pemisahan dipaksa di pohon.
Misalnya, jika Anda memprediksi perilaku pembelian pelanggan menggunakan Pendapatan sebagai atribut, dan mengatur bendera pemodelan REGRESSOR pada kolom, algoritma akan terlebih dahulu mencoba menyesuaikan nilai Pendapatan dengan menggunakan rumus regresi standar. Jika penyimpangan terlalu besar, rumus regresi ditinggalkan dan pohon akan dibagi pada beberapa atribut lain. Algoritma pohon keputusan kemudian akan mencoba menyesuaikan regresor untuk pendapatan di setiap cabang setelah pemisahan.
Anda dapat menggunakan parameter FORCE_REGRESSOR untuk menjamin bahwa algoritma akan menggunakan regresor tertentu. Parameter ini dapat digunakan dengan algoritma Pohon Keputusan dan algoritma Regresi Linier.
Tugas Terkait
Gunakan tautan berikut untuk mempelajari selengkapnya tentang menggunakan bendera pemodelan.
Tugas | Topik |
---|---|
Mengedit bendera pemodelan dengan menggunakan Designer Penggalian Data | Menampilkan atau Mengubah Bendera Pemodelan (Penggalian Data) |
Tentukan petunjuk algoritma untuk merekomendasikan kemungkinan regresi | Tentukan Kolom yang Akan Digunakan sebagai Regresor dalam Model |
Lihat bendera pemodelan yang didukung oleh algoritma tertentu (di bagian Bendera Pemodelan untuk setiap topik referensi algoritma) | Algoritma Penggalian Data (Analysis Services - Penggalian Data) |
Pelajari selengkapnya tentang kolom struktur penambangan dan properti yang bisa Anda atur di dalamnya | Kolom Struktur Pertambangan |
Pelajari tentang menambang kolom model dan bendera pemodelan yang dapat diterapkan di tingkat model | Kolom Model Penggalian |
Lihat sintaks untuk bekerja dengan bendera pemodelan dalam pernyataan DMX | Bendera Pemodelan (DMX) |
Memahami nilai yang hilang dan cara bekerja dengannya | Nilai hilang (Analysis Services - Penggalian Data) |
Pelajari tentang mengelola model dan struktur serta mengatur properti penggunaan | Memindahkan Objek Penggalian Data |