Bagikan melalui


BUAT MODEL PENAMBANGAN (DMX)

Berlaku untuk: SQL Server Analysis Services

Membuat model penambangan baru dan struktur penambangan dalam database. Anda dapat membuat model baik dengan menentukan model baru dalam pernyataan, atau dengan menggunakan Predictive Model Markup Language (PMML). Opsi kedua ini hanya untuk pengguna tingkat lanjut.

Struktur penambangan dinamai dengan menambahkan "_structure" ke nama model, yang memastikan bahwa nama struktur unik dari nama model.

Untuk membuat model penambangan untuk struktur penambangan yang ada, gunakan pernyataan ALTER MINING STRUCTURE (DMX ).

Sintaks

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

Argumen

model
Nama unik untuk model.

daftar definisi kolom
Daftar definisi kolom yang dipisahkan koma.

algoritma
Nama algoritma penggalian data, seperti yang didefinisikan oleh penyedia saat ini.

Catatan

Daftar algoritma yang didukung oleh penyedia saat ini dapat diambil dengan menggunakan DMSCHEMA_MINING_SERVICES Rowset. Untuk melihat algoritma yang didukung dalam instans Analysis Services saat ini, lihat Properti Penggalian Data.

daftar parameter
Opsional. Daftar parameter yang ditentukan penyedia yang dipisahkan koma untuk algoritma.

string XML
(Hanya untuk penggunaan tingkat lanjut.) Model yang dikodekan XML (PMML). String harus diapit dalam tanda kutip tunggal (').

Klausa SESSION memungkinkan Anda membuat model penambangan yang secara otomatis dihapus dari server saat koneksi ditutup atau waktu sesi habis. Model penambangan SESI berguna karena tidak mengharuskan pengguna menjadi administrator database, dan mereka hanya menggunakan ruang disk selama koneksi terbuka.

Klausul WITH DRILLTHROUGH memungkinkan penelusuran pada model penambangan baru. Penelusuran hanya dapat diaktifkan saat Anda membuat model. Untuk beberapa jenis model, penelusuran diperlukan untuk menelusuri model di penampil kustom. Penelusuran tidak diperlukan untuk prediksi atau untuk menelusuri model dengan menggunakan Penampil Pohon Konten Generik Microsoft.

Pernyataan CREATE MINING MODEL membuat model penambangan baru yang didasarkan pada daftar definisi kolom, algoritma, dan daftar parameter algoritma.

Daftar Definisi Kolom

Anda menentukan struktur model yang menggunakan daftar definisi kolom dengan menyertakan informasi berikut untuk setiap kolom:

  • Nama (wajib)

  • Jenis data (wajib)

  • Distribusi

  • Daftar bendera pemodelan

  • Tipe isi (wajib)

  • Permintaan prediksi, yang menunjukkan algoritma untuk memprediksi kolom ini, yang ditunjukkan oleh klausa PREDICT atau PREDICT_ONLY

  • Hubungan ke kolom atribut (wajib hanya jika berlaku), yang ditunjukkan oleh klausa RELATED TO

Gunakan sintaks berikut untuk daftar definisi kolom, untuk menentukan satu kolom:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

Gunakan sintaks berikut untuk daftar definisi kolom, untuk menentukan kolom tabel berlapis:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

Kecuali untuk bendera pemodelan, Anda dapat menggunakan tidak lebih dari satu klausa dari grup tertentu untuk menentukan kolom. Anda dapat menentukan beberapa bendera pemodelan untuk kolom.

Untuk daftar tipe data, tipe konten, distribusi kolom, dan bendera pemodelan yang bisa Anda gunakan untuk menentukan kolom, lihat topik berikut ini:

Anda dapat menambahkan klausa ke pernyataan untuk menjelaskan hubungan antara dua kolom. Analysis Services mendukung penggunaan klausa hubungan> Kolom berikut<.

TERKAIT DENGAN
Formulir ini menunjukkan hierarki nilai. Target kolom TERKAIT DENGAN bisa menjadi kolom kunci dalam tabel berlapis, kolom bernilai diskrit dalam baris huruf besar/kecil, atau kolom lain dengan klausa TERKAIT DENGAN, yang menunjukkan hierarki yang lebih dalam.

Gunakan klausa prediksi untuk menjelaskan cara kolom prediksi digunakan. Tabel berikut ini menjelaskan dua kemungkinan klausa.

<klausa prediksi> Deskripsi
PREDICT Kolom ini dapat diprediksi oleh model, dan dapat disediakan dalam kasus input untuk memprediksi nilai kolom lain yang dapat diprediksi.
PREDICT_ONLY Kolom ini dapat diprediksi oleh model, tetapi nilainya tidak dapat digunakan dalam kasus input untuk memprediksi nilai kolom lain yang dapat diprediksi.

Daftar Definisi Parameter

Anda dapat menggunakan daftar parameter untuk menyesuaikan performa dan fungsionalitas model penambangan. Sintaks daftar parameter adalah sebagai berikut:

[<parameter> = <value>, <parameter> = <value>,...]  

Untuk daftar parameter yang terkait dengan setiap algoritma, lihat Algoritma Penggalian Data (Analysis Services - Data Mining).

Keterangan

Jika Anda ingin membuat model yang memiliki himpunan data pengujian bawaan, Anda harus menggunakan pernyataan CREATE MINING STRUCTURE diikuti oleh ALTER MINING STRUCTURE. Namun, tidak semua jenis model mendukung himpunan data holdout. Untuk informasi selengkapnya, lihat MEMBUAT STRUKTUR PENAMBANGAN (DMX).

Untuk panduan tentang cara membuat model penambangan dengan menggunakan pernyataan CREATEMODEL, lihat Tutorial DMX Prediksi Rangkaian Waktu.

Contoh Naive Bayes

Contoh berikut menggunakan algoritma Microsoft Naive Bayes untuk membuat model penambangan baru. Kolom Pembeli Sepeda didefinisikan sebagai atribut yang dapat diprediksi.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

Contoh Model Asosiasi

Contoh berikut menggunakan algoritma Microsoft Association untuk membuat model penambangan baru. Pernyataan ini memanfaatkan kemampuan untuk menumpuk tabel di dalam definisi model dengan menggunakan kolom tabel. Model dimodifikasi dengan menggunakan parameter MINIMUM_PROBABILITY dan MINIMUM_SUPPORT .

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

Contoh Pengklusteran Urutan

Contoh berikut menggunakan algoritma Pengklusteran Urutan Microsoft untuk membuat model penambangan baru. Dua kunci digunakan untuk menentukan model. Kolom OrderNumber digunakan sebagai kunci kasus, dan menentukan urutan individual. Kolom LineNumber digunakan sebagai kunci tabel berlapis, dan menentukan urutan di mana item ditambahkan ke urutan.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

Contoh Rangkaian Waktu

Contoh berikut menggunakan algoritma Microsoft Times Series untuk membuat model penambangan baru dengan menggunakan algoritma ARTxp. ReportingDate adalah kolom kunci untuk rangkaian waktu dan ModelRegion adalah kolom kunci untuk seri data. Dalam contoh ini, diasumsikan bahwa periodisitas data adalah setiap 12 bulan. Oleh karena itu, parameter PERIODICITY_HINT diatur ke 12.

Catatan

Anda harus menentukan parameter PERIODICITY_HINT dengan menggunakan karakter kurung kurawal. Selain itu, karena nilainya adalah string, nilai tersebut harus diapit dalam tanda kutip tunggal: "{<numeric value>}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

Lihat Juga

Pernyataan Definisi Data Ekstensi Penggalian Data (DMX)
Pernyataan Manipulasi Data Ekstensi Penggalian Data (DMX)
Referensi Pernyataan Ekstensi Penggalian Data (DMX)