Konten Model Penambangan untuk Model Jaringan Neural (Analysis Services - Penggalian Data)

Artikel
10/31/2023

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Topik ini menjelaskan konten model penambangan yang khusus untuk model yang menggunakan algoritma Microsoft Neural Network. Untuk penjelasan tentang cara menginterpretasikan statistik dan struktur yang dibagikan oleh semua jenis model, dan definisi umum istilah yang terkait dengan konten model penambangan, lihat Menambang Konten Model (Analysis Services - Data Mining).

Memahami Struktur Model Jaringan Neural

Setiap model jaringan neural memiliki satu simpul induk yang mewakili model dan metadatanya, dan simpul statistik marginal (NODE_TYPE = 24) yang menyediakan statistik deskriptif tentang atribut input. Simpul statistik marginal berguna karena meringkas informasi tentang input, sehingga Anda tidak perlu mengkueri data dari simpul individual.

Di bawah kedua simpul ini, setidaknya ada dua simpul lagi, dan mungkin banyak lagi, tergantung pada berapa banyak atribut yang dapat diprediksi yang dimiliki model.

Simpul pertama (NODE_TYPE = 18) selalu mewakili simpul atas lapisan input. Di bawah simpul teratas ini, Anda dapat menemukan simpul input (NODE_TYPE = 21) yang berisi atribut input aktual dan nilainya.
Simpul berturut-turut masing-masing berisi subnetwork yang berbeda (NODE_TYPE = 17). Setiap subnet selalu berisi lapisan tersembunyi (NODE_TYPE = 19), dan lapisan output (NODE_TYPE = 20) untuk subnet tersebut.

struktur konten model untuk jaringan neural

Informasi dalam lapisan input sangat mudah: simpul atas untuk setiap lapisan input (NODE_TYPE = 18) berfungsi sebagai penyelenggara untuk kumpulan simpul input (NODE_TYPE = 21). Konten simpul input dijelaskan dalam tabel berikut.

Setiap subnetwork (NODE_TYPE = 17) mewakili analisis pengaruh lapisan input pada atribut tertentu yang dapat diprediksi. Jika ada beberapa output yang dapat diprediksi, ada beberapa subnet. Lapisan tersembunyi untuk setiap subnet berisi beberapa simpul tersembunyi (NODE_TYPE = 22) yang berisi detail tentang bobot untuk setiap transisi yang berakhiran simpul tersembunyi tertentu.

Lapisan output (NODE_TYPE = 20) berisi simpul output (NODE_TYPE = 23) yang masing-masing berisi nilai berbeda dari atribut yang dapat diprediksi. Jika atribut yang dapat diprediksi adalah jenis data numerik berkelanjutan, hanya ada satu simpul output untuk atribut .

Catatan

Algoritma regresi logistik menggunakan kasus khusus jaringan neural yang hanya memiliki satu hasil yang dapat diprediksi dan berpotensi banyak input. Regresi logistik tidak menggunakan lapisan tersembunyi.

Cara termampu untuk menjelajahi struktur input dan subjaringan adalah dengan menggunakan penampil Pohon Konten Generik Microsoft. Anda dapat mengklik simpul apa pun untuk memperluasnya dan melihat simpul anak, atau melihat bobot dan statistik lain yang terkandung dalam simpul.

Untuk bekerja dengan data dan melihat bagaimana model menghubungkan input dengan output, gunakan Penampil Jaringan Neural Microsoft. Dengan menggunakan penampil kustom ini, Anda dapat memfilter atribut input dan nilainya, dan secara grafis melihat bagaimana pengaruhnya terhadap output. Tipsalat dalam penampil menunjukkan probabilitas dan lift yang terkait dengan setiap pasangan nilai input dan output. Untuk informasi selengkapnya, lihat Menelusuri Model Menggunakan Penampil Jaringan Neural Microsoft.

Konten Model untuk Model Jaringan Neural

Bagian ini menyediakan detail dan contoh hanya untuk kolom tersebut dalam konten model penambangan yang memiliki relevansi khusus untuk jaringan neural. Untuk informasi tentang kolom tujuan umum dalam kumpulan baris skema, seperti MODEL_CATALOG dan MODEL_NAME, yang tidak dijelaskan di sini, atau untuk penjelasan tentang terminologi model penambangan, lihat Menambang Konten Model (Analysis Services - Data Mining).

MODEL_CATALOG
Nama database tempat model disimpan.

MODEL_NAME
Nama model.

ATTRIBUTE_NAME
Nama atribut yang sesuai dengan simpul ini.

Simpul	Konten
Akar model	Kosong
Statistik marginal	Kosong
Lapisan input	Kosong
Simpul input	Nama atribut input
Lapisan tersembunyi	Kosong
Simpul tersembunyi	Kosong
Lapisan output	Kosong
Simpul output	Nama atribut output

NODE_NAME
Nama node. Kolom ini berisi nilai yang sama dengan NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
Nama unik simpul.

Untuk informasi selengkapnya tentang bagaimana nama dan ID menyediakan informasi struktural tentang model, lihat bagian , Menggunakan Nama Node dan ID.

NODE_TYPE
Model jaringan neural menghasilkan jenis node berikut:

ID Jenis Simpul	Deskripsi
1	Model.
17	Simpul pengatur untuk subnet.
18	Simpul penyelenggara untuk lapisan input.
19	Simpul pengatur untuk lapisan tersembunyi.
20	Simpul pengatur untuk lapisan output.
21	Node atribut input.
22	Node lapisan tersembunyi
23	Simpul atribut output.
24	Simpul statistik marginal.

NODE_CAPTION
Label atau caption yang terkait dengan simpul. Dalam model jaringan neural, selalu kosong.

CHILDREN_CARDINALITY
Perkiraan jumlah anak yang dimiliki simpul.

Simpul	Konten
Akar model	Menunjukkan jumlah simpul anak, yang mencakup setidaknya 1 jaringan, 1 simpul marginal yang diperlukan, dan 1 lapisan input yang diperlukan. Misalnya, jika nilainya adalah 5, ada 3 subnet.
Statistik marginal	Selalu 0.
Lapisan input	Menunjukkan jumlah pasangan atribut-nilai input yang digunakan oleh model.
Simpul input	Selalu 0.
Lapisan tersembunyi	Menunjukkan jumlah simpul tersembunyi yang dibuat oleh model.
Simpul tersembunyi	Selalu 0.
Lapisan output	Menunjukkan jumlah nilai output.
Simpul output	Selalu 0.

PARENT_UNIQUE_NAME
Nama unik induk simpul. NULL dikembalikan untuk simpul apa pun di tingkat akar.

Untuk informasi selengkapnya tentang bagaimana nama dan ID menyediakan informasi struktural tentang model, lihat bagian , Menggunakan Nama Node dan ID.

NODE_DESCRIPTION
Deskripsi simpul yang mudah digunakan.

Simpul	Konten
Akar model	Kosong
Statistik marginal	Kosong
Lapisan input	Kosong
Simpul input	Nama atribut input
Lapisan tersembunyi	Kosong
Simpul tersembunyi	Bilangan bulat yang menunjukkan urutan simpul tersembunyi dalam daftar simpul tersembunyi.
Lapisan output	Kosong
Simpul output	Jika atribut output berkelanjutan, berisi nama atribut output. Jika atribut output diskret atau diskret, berisi nama atribut dan nilai .

NODE_RULE
Deskripsi XML dari aturan yang disematkan dalam simpul.

Simpul	Konten
Akar model	Kosong
Statistik marginal	Kosong
Lapisan input	Kosong
Simpul input	Fragmen XML yang berisi informasi yang sama dengan kolom NODE_DESCRIPTION.
Lapisan tersembunyi	Kosong
Simpul tersembunyi	Bilangan bulat yang menunjukkan urutan simpul tersembunyi dalam daftar simpul tersembunyi.
Lapisan output	Kosong
Simpul output	Fragmen XML yang berisi informasi yang sama dengan kolom NODE_DESCRIPTION.

MARGINAL_RULE
Untuk model jaringan neural, selalu kosong.

NODE_PROBABILITY
Probabilitas yang terkait dengan simpul ini. Untuk model jaringan neural, selalu 0.

MARGINAL_PROBABILITY
Probabilitas mencapai simpul dari simpul induk. Untuk model jaringan neural, selalu 0.

NODE_DISTRIBUTION
Tabel berlapis yang berisi informasi statistik untuk simpul. Untuk informasi mendetail tentang konten tabel ini untuk setiap jenis node, lihat bagian , Memahami tabel NODE_DISTRIBUTION.

NODE_SUPPORT
Untuk model jaringan neural, selalu 0.

Catatan

Probabilitas dukungan selalu 0 karena output dari jenis model ini tidak probabilistik. Hanya bobot yang bermakna untuk algoritma; oleh karena itu, algoritma tidak menghitung probabilitas, dukungan, atau varians.

Untuk mendapatkan informasi tentang dukungan dalam kasus pelatihan untuk nilai tertentu, lihat simpul statistik marginal.

MSOLAP_MODEL_COLUMN

Simpul	Konten
Akar model	Kosong
Statistik marginal	Kosong
Lapisan input	Kosong
Simpul input	Nama atribut input.
Lapisan tersembunyi	Kosong
Simpul tersembunyi	Kosong
Lapisan output	Kosong
Simpul output	Nama atribut input.

MSOLAP_NODE_SCORE
Untuk model jaringan neural, selalu 0.

MSOLAP_NODE_SHORT_CAPTION
Untuk model jaringan neural, selalu kosong.

Keterangan

Tujuan pelatihan model jaringan neural adalah untuk menentukan bobot yang terkait dengan setiap transisi dari input ke titik tengah, dan dari titik tengah ke titik akhir. Oleh karena itu, lapisan input model utamanya ada untuk menyimpan nilai aktual yang digunakan untuk membangun model. Lapisan tersembunyi menyimpan bobot yang dihitung, dan menyediakan pointer kembali ke atribut input. Lapisan output menyimpan nilai yang dapat diprediksi, dan juga menyediakan pointer kembali ke titik tengah di lapisan tersembunyi.

Menggunakan Nama Node dan ID

Penamaan simpul dalam model jaringan neural memberikan informasi tambahan tentang jenis simpul, untuk mempermudah menghubungkan lapisan tersembunyi ke lapisan input, dan lapisan output ke lapisan tersembunyi. Tabel berikut menunjukkan konvensi untuk ID yang ditetapkan ke simpul di setiap lapisan.

Jenis Node	Konvensi untuk ID simpul
Akar model (1)	00000000000000000.
Simpul statistik marginal (24)	10000000000000000
Lapisan input (18)	30000000000000000
Simpul input (21)	Dimulai dari 60000000000000000
Subjaringan (17)	20000000000000000
Lapisan tersembunyi (19)	40000000000000000
Node tersembunyi (22)	Mulai dari 70000000000000000
Lapisan output (20)	50000000000000000
Simpul output (23)	Mulai dari 80000000000000000

Anda dapat menentukan atribut input mana yang terkait dengan simpul lapisan tersembunyi tertentu dengan melihat tabel NODE_DISTRIBUTION di simpul tersembunyi (NODE_TYPE = 22). Setiap baris tabel NODE_DISTRIBUTION berisi ID simpul atribut input.

Demikian pula, Anda dapat menentukan lapisan tersembunyi mana yang terkait dengan atribut output dengan melihat tabel NODE_DISTRIBUTION di simpul output (NODE_TYPE = 23). Setiap baris tabel NODE_DISTRIBUTION berisi ID simpul lapisan tersembunyi, bersama dengan koefisien terkait.

Menginterpretasikan Informasi dalam Tabel NODE_DISTRIBUTION

Tabel NODE_DISTRIBUTION dapat kosong di beberapa simpul. Namun, untuk simpul input, node lapisan tersembunyi, dan simpul output, tabel NODE_DISTRIBUTION menyimpan informasi penting dan menarik tentang model. Untuk membantu Anda menginterpretasikan informasi ini, tabel NODE_DISTRIBUTION berisi kolom VALUETYPE untuk setiap baris yang memberi tahu Anda apakah nilai dalam kolom ATTRIBUTE_VALUE Diskret (4), Diskret (5), atau Berkelanjutan (3).

Simpul Input

Lapisan input berisi simpul untuk setiap nilai atribut yang digunakan dalam model.

Atribut diskrit: Simpul input hanya menyimpan nama atribut dan nilainya di kolom ATTRIBUTE_NAME dan ATTRIBUTE_VALUE. Misalnya, jika [Work Shift] adalah kolom , simpul terpisah dibuat untuk setiap nilai kolom yang digunakan dalam model, seperti AM dan PM. Tabel NODE_DISTRIBUTION untuk setiap simpul hanya mencantumkan nilai atribut saat ini.

Atribut numerik yang didisretisasi: Simpul input menyimpan nama atribut, dan nilai , yang dapat berupa rentang atau nilai tertentu. Semua nilai diwakili oleh ekspresi, seperti '77.4 - 87.4' atau ' < 64.0' untuk nilai [Waktu Per Masalah]. Tabel NODE_DISTRIBUTION untuk setiap simpul hanya mencantumkan nilai atribut saat ini.

Atribut berkelanjutan: Simpul input menyimpan nilai rata-rata atribut. Tabel NODE_DISTRIBUTION untuk setiap simpul hanya mencantumkan nilai atribut saat ini.

Node Lapisan Tersembunyi

Lapisan tersembunyi berisi jumlah variabel simpul. Di setiap simpul, tabel NODE_DISTRIBUTION berisi pemetaan dari lapisan tersembunyi ke simpul di lapisan input. Kolom ATTRIBUTE_NAME berisi ID simpul yang sesuai dengan simpul di lapisan input. Kolom ATTRIBUTE_VALUE berisi bobot yang terkait dengan kombinasi simpul input dan simpul lapisan tersembunyi. Baris terakhir dalam tabel berisi koefisien yang mewakili berat simpul tersembunyi tersebut di lapisan tersembunyi.

Simpul Output

Lapisan output berisi satu simpul output untuk setiap nilai output yang digunakan dalam model. Di setiap simpul, tabel NODE_DISTRIBUTION berisi pemetaan dari lapisan output ke simpul di lapisan tersembunyi. Kolom ATTRIBUTE_NAME berisi ID simpul yang sesuai dengan simpul di lapisan tersembunyi. Kolom ATTRIBUTE_VALUE berisi bobot yang terkait dengan kombinasi simpul output dan simpul lapisan tersembunyi.

Tabel NODE_DISTRIBUTION memiliki informasi tambahan berikut, tergantung pada apakah jenis atribut:

Atribut diskrit: Dua baris akhir tabel NODE_DISTRIBUTION berisi koefisien untuk simpul secara keseluruhan, dan nilai atribut saat ini.

Atribut numerik yang didisretisasi: Identik dengan atribut diskrit, kecuali bahwa nilai atribut adalah rentang nilai.

Atribut berkelanjutan: Dua baris akhir tabel NODE_DISTRIBUTION berisi rata-rata atribut, koefisien untuk simpul secara keseluruhan, dan varian koefisien.

Lihat juga

Algoritma Jaringan Neural Microsoft
Referensi Teknis Algoritma Jaringan Neural Microsoft
Contoh Kueri Model Jaringan Neural

Bagikan melalui