Bagikan melalui


Tipe Isi (Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi pada SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Di Microsoft SQL Server SQL Server Analysis Services, Anda dapat menentukan jenis data fisik untuk kolom dalam struktur penambangan, dan jenis konten logis untuk kolom saat digunakan dalam model,

Jenis data menentukan bagaimana algoritma memproses data di kolom tersebut saat Anda membuat model penambangan. Menentukan jenis data kolom memberikan informasi algoritma tentang jenis data dalam kolom, dan cara memproses data. Setiap jenis data di SQL Server Analysis Services mendukung satu atau beberapa jenis konten untuk penambangan data.

Tipe konten menjelaskan perilaku konten yang dikandung kolom. Misalnya, jika konten dalam kolom diulang dalam interval tertentu, seperti hari dalam seminggu, Anda dapat menentukan tipe konten kolom tersebut sebagai siklus.

Beberapa algoritma memerlukan jenis data tertentu dan jenis konten tertentu agar dapat berfungsi dengan benar. Misalnya, algoritma Microsoft Naive Bayes tidak dapat menggunakan kolom berkelanjutan sebagai input, dan tidak dapat memprediksi nilai berkelanjutan. Beberapa jenis konten, seperti Urutan Kunci, hanya digunakan oleh algoritma tertentu. Untuk daftar algoritma dan jenis konten yang didukung masing-masing, lihat Algoritma Penggalian Data (Analysis Services - Penggalian Data).

Daftar berikut ini menjelaskan jenis konten yang digunakan dalam penggalian data, dan mengidentifikasi jenis data yang mendukung setiap jenis.

Diskrit

Diskrit berarti bahwa kolom berisi jumlah nilai terbatas tanpa kontinum di antara nilai. Misalnya, kolom jenis kelamin adalah kolom atribut diskrit yang khas, karena data mewakili jumlah kategori tertentu.

Nilai dalam kolom atribut diskrit tidak dapat menyiratkan pengurutan, meskipun nilainya numerik. Selain itu, bahkan jika nilai yang digunakan untuk kolom diskrit adalah numerik, nilai pecahan tidak dapat dihitung. Kode area telepon adalah contoh yang baik dari data diskrit yang numerik.

Jenis konten diskrit didukung oleh semua jenis data penggalian data.

Berkelanjutan

Berkelanjutan berarti bahwa kolom berisi nilai yang mewakili data numerik pada skala yang memungkinkan nilai sementara. Tidak seperti kolom diskrit, yang mewakili data terbatas dan dapat dihitung, kolom berkelanjutan mewakili pengukuran yang dapat diskalakan, dan dimungkinkan bagi data untuk berisi jumlah nilai pecahan yang tak terbatas. Kolom suhu adalah contoh kolom atribut berkelanjutan.

Saat kolom berisi data numerik berkelanjutan, dan Anda tahu bagaimana data harus didistribusikan, Anda dapat berpotensi meningkatkan akurasi analisis dengan menentukan distribusi nilai yang diharapkan. Anda menentukan distribusi kolom pada tingkat struktur penambangan. Oleh karena itu, pengaturan berlaku untuk semua model yang didasarkan pada struktur, Untuk informasi selengkapnya, lihat Distribusi Kolom (Penggalian Data).

Jenis konten Berkelanjutan didukung oleh jenis data berikut: Tanggal, Ganda, dan Panjang.

Tidak disesali

Diskretisasi adalah proses menempatkan nilai dari sekumpulan data berkelanjutan ke dalam wadah sehingga ada sejumlah nilai yang mungkin. Anda hanya dapat membedakan data numerik.

Dengan demikian, jenis konten yang dibisahkan menunjukkan bahwa kolom berisi nilai yang mewakili grup, atau wadah, dari nilai yang berasal dari kolom berkelanjutan. Wadah diperlakukan sebagai nilai yang diurutkan dan diskrit.

Anda dapat membedakan data Anda secara manual, untuk memastikan bahwa Anda mendapatkan wadah yang Anda inginkan, atau Anda dapat menggunakan metode diskretisasi yang disediakan dalam SQL Server Analysis Services. Beberapa algoritma melakukan diskretisasi secara otomatis. Untuk informasi selengkapnya, lihat Mengubah Diskretisasi Kolom dalam Model Penambangan.

Tipe konten diskret didukung oleh jenis data berikut: Tanggal, Ganda, Panjang, dan Teks.

Kunci

Jenis konten utama berarti bahwa kolom secara unik mengidentifikasi baris. Dalam tabel kasus, biasanya kolom kunci adalah pengidentifikasi numerik atau teks. Anda mengatur tipe konten ke kunci untuk menunjukkan bahwa kolom tidak boleh digunakan untuk analisis, hanya untuk melacak rekaman.

Tabel berlapis juga memiliki kunci, tetapi penggunaan kunci tabel berlapis sedikit berbeda. Anda mengatur jenis konten ke kunci dalam tabel berlapis jika kolom adalah atribut yang ingin Anda analisis. Nilai dalam kunci tabel berlapis harus unik untuk setiap kasus tetapi mungkin ada duplikat di seluruh kumpulan kasus.

Misalnya, jika Anda menganalisis produk yang dibeli pelanggan, Anda akan mengatur jenis konten ke kunci untuk kolom CustomerID dalam tabel kasus, dan mengatur jenis konten ke kunci lagi untuk kolom PurchasedProducts di tabel berlapis.

Catatan

Tabel berlapis hanya tersedia jika Anda menggunakan data dari sumber data eksternal yang telah ditentukan sebagai tampilan sumber data Layanan analisis.

Tipe konten ini didukung oleh tipe data berikut: Tanggal, Ganda, Panjang, dan Teks.

Urutan Kunci

Jenis konten urutan kunci hanya dapat digunakan dalam urutan model pengklusteran. Saat Anda mengatur jenis konten ke urutan kunci, ini menunjukkan bahwa kolom berisi nilai yang mewakili urutan peristiwa. Nilai diurutkan, tetapi tidak harus terpisah jarak yang sama.

Tipe konten ini didukung oleh tipe data berikut: Ganda, Panjang, Teks, dan Tanggal.

Waktu Kunci

Jenis konten waktu kunci hanya dapat digunakan dalam model rangkaian waktu. Saat Anda mengatur jenis konten ke waktu kunci, itu menunjukkan bahwa nilai diurutkan dan mewakili skala waktu.

Tipe konten ini didukung oleh tipe data berikut: Ganda, Panjang, dan Tanggal.

Tabel

Tipe konten tabel menunjukkan bahwa kolom berisi tabel data lain, dengan satu atau beberapa kolom dan satu atau beberapa baris. Untuk baris tertentu dalam tabel kasus, kolom ini bisa berisi beberapa nilai, semuanya terkait dengan rekaman kasus induk. Misalnya, jika tabel kasus utama berisi daftar pelanggan, Anda bisa memiliki beberapa kolom yang berisi tabel berlapis, seperti kolom ProductsPurchased , di mana tabel berlapis mencantumkan produk yang dibeli oleh pelanggan ini di masa lalu, dan kolom Hobi yang mencantumkan minat pelanggan.

Jenis data kolom ini selalu Tabel.

Siklus

Tipe konten siklus berarti bahwa kolom berisi nilai yang mewakili kumpulan berurutan siklus. Misalnya, hari bernomor dalam seminggu adalah kumpulan berurutan siklus, karena hari pertama mengikuti hari ketujuh.

Kolom siklus dianggap diurutkan dan diskrit dalam hal jenis konten.

Tipe konten ini didukung oleh semua jenis data penggalian data di SQL Server Analysis Services. Namun, sebagian besar algoritma memperlakukan nilai siklus sebagai nilai diskrit dan tidak melakukan pemrosesan khusus.

Dipesan

Jenis konten Yang diurutkan juga menunjukkan bahwa kolom berisi nilai yang menentukan urutan atau urutan. Namun, dalam konten ini ketik nilai yang digunakan untuk pengurutan tidak menyiratkan jarak atau hubungan besaran antara nilai dalam set. Misalnya, jika kolom atribut yang diurutkan berisi informasi tentang tingkat keterampilan dalam urutan peringkat dari satu hingga lima, tidak ada informasi tersirat dalam jarak antara tingkat keterampilan; tingkat keterampilan lima belum tentu lima kali lebih baik daripada tingkat keterampilan satu.

Kolom atribut yang diurutkan dianggap diskrit dalam hal jenis konten.

Tipe konten ini didukung oleh semua jenis data penggalian data di SQL Server Analysis Services. Namun, sebagian besar algoritma memperlakukan nilai yang diurutkan sebagai nilai diskrit dan tidak melakukan pemrosesan khusus.

Diklasifikasikan

Selain jenis konten sebelumnya yang umum digunakan dengan semua model, untuk beberapa jenis data, Anda dapat menggunakan kolom rahasia untuk menentukan jenis konten. Untuk informasi selengkapnya tentang kolom rahasia, lihat Kolom Rahasia (Penggalian Data).

Lihat juga

Jenis Konten (DMX)
Jenis Data (Penggalian Data)
Jenis Data (DMX)
Mengubah Properti Struktur Pertambangan
Kolom Struktur Pertambangan