Içerik türleri (veri madenciliği)
In Microsoft SQL Server Analysis Services, you can define the both the physical data type for a column in a mining structure, and a logical content type for the column when used in a model,
The data type determines how algorithms process the data in those columns when you create mining models.sütun veri türünü tanımlayan veri sütunlarında algoritması bilgileri ve verileri nasıl sağlar.Her bir veri türü Analysis Services bir veya daha fazla içerik türleri için veri madenciliği destekler.
The content type describes the behavior of the content that the sütun contains.Belirli bir aralığı (gün, hafta gibi bir sütun içeriği yinelenirse, içerik türü bu sütunun döngüsel olarak belirtebilirsiniz.
Bazı algoritmalar, belirli veri türlerini ve belirli içerik türleri düzgün çalışabilmesi gereklidir.Örneğin, Microsoft Naive Bayes algoritması sürekli sütunları giriş olarak kullanamaz ve sürekli bir değer tahmin edemiyor.Bazı içerik türleri, tuş sırasını, örneğin yalnızca belirli bir algoritması tarafından kullanılır.Algoritmalar ve içerik türlerinin listesi için her desteklediği için bkz: Veri madenciliği algoritmaları (Analysis Services - veri madenciliği).
Aşağıdaki liste, veri madenciliği kullanılan içerik türlerini açıklar ve her türünü destekleyen veri türleri'ni tanımlar.
Kesikli
Kesikli sütun değerleri arasında hiçbir continuum değerlerle sınırlı sayıda içerdiği anlamına gelir.Verileri belirli bir kategori sayısını gösteren, cinsiyet sütun tipik ayrı öznitelik sütun, olmamasıdır.
Sayısal değerlerde, ayrı bir öznitelik sütunundaki değerler, sipariş durumunun oluştuğunu edemiyor.Ayrıca, ayrı bir sütun için kullanılan sayısal değerlerdir olsa bile, kesirli değerler hesaplanamaz.Telefon alan kodlarını sayısalsa, ayrı veri iyi bir örnektir.
The Discrete content type is supported by all veri madenciliği data types.
Sürekli
Sürekli sütun ara değerlere izin veren bir ölçekte sayısal veri gösteren değerler içerdiğini gösterir.Farklı olarak, sınırlı, countable verileri temsil eden, ayrı bir sütun, sürekli bir sütun ölçeklenebilir ölçümleri temsil eder ve bir sonsuz sayıda kesirli bir değer içeren veri olanaklıdır.sütun sıcaklıklar sürekli özniteliği sütunun bir örnektir.
Sütun sürekli sayısal veri içeren ve verileri nasıl dağıtılacağını biliyorsanız, olası değerler beklenen dağıtımını belirterek çözümlemeyi doğruluğunu artırabilirsiniz.Sütun dağıtım madenciliği yapısının düzeyinde belirt.Bu nedenle, daha fazla bilgi yapısını esas alan tüm modeller için ayar uygulanır, bkz: Sütun dağıtım (veri madenciliği).
The Continuous content type is supported by the following data types: Date, Double, ve Long.
Discretized
Discretization değerlerini sürekli bir yerleştirme işlemidir küme, sınırlı sayıda olası değerler vardır; bu nedenle demetleri içine veri.Yalnızca sayısal veri ayırmak.
Bu nedenle, discretized içerik türü, sütun, Grup veya demetleri, sürekli bir sütundan türetilen değerleri temsil eden değerler içerdiğini gösterir.Demetleri, sipariş edilen ve ayrı değerler olarak kabul edilir.
Verilerinizi el ile ayırmak, demetleri aldığınız sağlamak istediğiniz veya SQL Server Analysis Services'daki sağlanan discretization yöntemlerini kullanabilirsiniz.Bazı algoritmalar, discretization otomatik olarak gerçekleştirir.Daha fazla bilgi için bkz:Nasıl Yapılır: Bir sütun içinde Discretization değiştirmek bir araştırma modeli.
The Discretized content type is supported by the following data types: Date, Double, Long, ve Text.
Anahtar
The anahtar content type means that the sütun uniquely identifies a row.Bir durumda tablo, genellikle anahtar sütun bir sayı veya metin tanımlayıcıdır.küme Için içerik türü key sütun çözümlenmek kayıtları izleme için yalnızca kullanılmamalıdır olduğunu belirtmek için .
Iç içe geçmiş tablolar da bir anahtara sahip, ancak iç içe geçmiş tablo anahtarının kullanımı biraz farklıdır.küme Için içerik türü key sütun, analiz etmek istediğiniz özniteliği ise iç içe geçmiş tablo içinde. Iç içe geçmiş tablo anahtar değerleri her durum için benzersiz olması gerekir, ancak üzerinde tüm çoğaltmaları olabilir küme durumda.
Örneğin, ürünler, müşterilerin satınalma analiz ediliyor, yaptığınız küme anahtar türüne içerik MüşteriNo büyük bir tablo, sütun ve küme yeniden anahtar türüne içerikPurchasedProducts iç içe geçmiş tablo sütununda.
Not
Iç içe geçmiş tablolar, yalnızca Analysis Services veri kaynağı görünümü tanımlanan bir dış veri kaynağından veri kullanıyorsanız kullanılabilir.
Bu içerik türü aşağıdaki veri türleri tarafından desteklenmez. Date, Double, Long, ve Text.
anahtar Sırası
The anahtar sequence content type can only be used in sequence kümeleme models.Zaman, küme türüne içerik key sequence, sütun olayların sırasını gösteren bir değeri içerdiğini gösterir. Değerleri, sipariş edilmiş, ancak bir eşit uzaklıkta olması gerekmez.
Bu içerik türü aşağıdaki veri türleri tarafından desteklenmez. Double, Long, Text, ve Date.
Anahtar saat
The anahtar saat content type can only be used in saat series models.saat, küme türüne içerik key time, değerleri, sipariş edilen ve bir saat ölçeği temsil eden bir şekilde gösterir.
Bu içerik türü aşağıdaki veri türleri tarafından desteklenmez. Double, Long, ve Date.
Table
The tablo content type indicates that the sütun contains another data tablo, with one or more columns and one or more rows.Belirli bir satır büyük/küçük durum tablosundaki için bu sütun ana durum kaydını için tüm ilgili olarak, birden çok değer içerebilir.Örneğin, durum ana tabloyu müşterilerin listesini içeriyorsa, iç içe geçmiş tablolar gibi içeren birçok sütun olabilir bir ProductsPurchased sütun, burada iç içe geçmiş tablo geçmişteki ve bir bu müşteri tarafından satın ürünleri listeler.Hobileriniz sütun müşterinin ilgi listeler.
Bu sütunun veri türü her zaman'dır Table.
Döngüsel
The cyclical content type means that the sütun contains values that represent a cyclical sıralı küme.Örneğin, numaralı haftasının olan bir döngüsel sipariş küme, gün numarası yedi günde bir aşağıdaki çünkü.
Döngüsel bir sütun, sipariş edilen ve içerik türü bakımından farklı olarak değerlendirilir.
Bu içerik türü, tüm madenciliği veri sayfasındaki veri tipleri tarafından destekleniyor Analysis Services. Ancak, çoğu algoritmaları döngüsel değerleri ayrık değerler olarak kabul ve özel bir işlem gerçekleştirmez.
Sipariş
The Ordered content type also indicates that the sütun contains values that define a sequence or order.Durumunun ancak, bu içerik türünü sıralama için kullanılan değerleri değerleri arasındaki mesafeyi veya boyutları hiçbir ilişkisi oluştuğunu değil küme.Örneğin, bir sipariş edilen özniteliği sütun birinden beş rütbe sırayla beceri düzeyleri hakkında bilgi içeriyorsa, beceri düzeyleri arasındaki uzaklığı zımni hiçbir bilgi bulunmaktadır; bir yetenek düzey beş mutlaka beş kez bir yetenek düzey iyidir değil.
Öznitelik sütunlarını içerik türü'nün ayrı olarak kabul edilir sipariş.
Bu içerik türü, tüm madenciliği veri sayfasındaki veri tipleri tarafından destekleniyor Analysis Services. Ancak, ancak çoğu algoritmaları sıralı değerler ayrık değerler olarak kabul ve özel bir işlem gerçekleştirmez.
Sınıflandırılmamış
Ortak birlikte tüm modeller önceki içerik türlerini yanı sıra, bazı veri türleri için sınıflandırılmış sütunları içerik türlerini tanımlamak için kullanabilirsiniz.Sınıflandırılmış sütunları hakkında daha fazla bilgi için bkz: Sınıflandırılmış sütunları (veri madenciliği).