Model kümeleme bir sıra sorgulama (Analysis Services - veri madenciliği)
Bir veri araştırma modeli yönelik bir sorgu oluşturduğunuzda, model içinde depolanan bilgiler hakkında ayrıntılar sağlar, herhangi bir içerik sorgu oluşturabilir veya desenleri modelde sağlayan yeni verileri esas Öngörüler sağlamak için kullanır. tahmin bir sorgu oluşturabilirsiniz.Modeli kümeleme için bir sıra, içerik sorguları genellikle bulunan kümeleri ya da bu küme içinde geçişler ile ilgili ek ayrıntılar sağlar.Ayrıca, bir sorgulama kullanarak meta veriler modeli hakkında da alabilirsiniz.
Tahmin modeli genelde kümeleme sırası sorgulara ya da serilerinin ve geçişleri modelinde veya sıra birleşimi dahil olan ve olmayan sıra öznitelikleri olan ve olmayan sıra öznitelikleri hakkında temel alan öneriler yapın.
Bu bölümde, Microsoft kümeleme, sıra algoritmasına dayanan modelleri ilişkin sorgular oluşturmak üzere açıklar.Sorgu oluşturma hakkında genel bilgi için bkz: Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği).
Içerik sorgular
Veri madenciliği kullanarak şema satır kümesi modeli Parametreler iade için:
Sýra bir listesi için bir durum alınıyor
Model sistem kullanarak sorgulama yordamlar depolanan...
Küme profilleri ve örnek durumlar
Küme özellikleri ve küme Ayrımcılığı
Tahmin sorgular
Sonraki durum veya durumlar tahmin4
Model kümeleme sırası hakkında bilgi bulma
Içerik madenciliği modelinin anlamlı bir sorgu oluşturmak için , içerik modeli yapısını anlamak ve hangi düğüm türü, ne tür bilgiler depolar.Daha fazla bilgi için bkz:araştırma modeli Sırası modeller kümeleme için içerik (Analysis Services - veri madenciliği).
Başa dön
Örnek sorgu 1: Modeli Parametreler iade için veri madenciliği Schema satır kümesi'ni kullanma
Veri madenciliği şema satır kümesi kümesi sorgulayarak, çok çeşitli temel meta veriler, tarih ve saat, model oluşturulmuş ve son olarak işlenen dahil olmak üzere bir modeli hakkında bilgi, modelini temel alan araştırma yapısı ve öngörülebilir bir öznitelik olarak kullanılan bir sütun adını bulabilirsiniz.
Aşağıdaki sorgu oluşturmak ve bu modelin eğitmek için kullanılan parametreler verir... [Sequence Clustering]. Ders 5'te bu model oluşturma Temel veri madenciliği Öğreticisi.
SELECT MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Sequence Clustering'
Örnek sonuçlar:
mining_parameters |
---|
cluster_count = 15, minimum_support = 10, maximum_states = 100, maximum_sequence_states = 64 |
Bu model, CLUSTER_COUNT için varsayılan değer 10'ı kullanılarak oluşturulan unutmayın.CLUSTER_COUNT için sıfır olmayan bir küme sayısı belirttiğinizde, karma algoritması bu numarayı yaklaşık adedini bulmak için ipucu olarak davranır.Ancak, çözümleme işlemi, daha fazla veya daha az küme algoritma bulabilirsiniz.Bu durumda, algoritma 15 kümeleri en iyi eğitim veri uyma olduğunu buldu.Bu nedenle, tamamlanan modeli için parametre değerleri listesi algoritması tarafından geçirilen model oluştururken değeri değiştirmez belirlenen küme sayısı bildiriyor.
Bu davranış kümeleri en iyi sayısını algoritması izin vererek karşı nasıl farklı?Bir deney, bu aynı veri kullanan başka bir küme modeli oluşturma ancak CLUSTER_COUNT 0 olarak ayarlayın.Bunu yaptığınızda, algoritma 32 kümeleri algılar.Bu nedenle, varsayılan değer olan 10 CLUSTER_COUNT için kullanarak, sayısını sınırlamak sonuçlar.
Küme sayısını azaltarak, göz atmak ve gruplandırmaları verilerde anlamak, çoğu kişi kolaylaştırır çünkü 10 değerinin varsayılan olarak kullanılır.Ancak, her model ve veri kümesi farklıdır.Kümeler, hangi parametre değeri, en doğru modeli verir görmek için farklı sayıda denemek isteyebilirsiniz.
Başa dön
Örnek sorgu 2: Sýra bir listesi için bir durum alınıyor
Ilk durum olarak eğitim verilerde bulunan sıralar ile ilgili tüm ikinci durumları listesi eşleşen araştırma modeli içerik depoları.Ilk durum için sıra etiketi olarak kullanılır ve ilgili ikinci durumları geçişi denir.
Örneğin, aşağıdaki sorgu serilerini kümeler gruplandırılmıştır önce modelde, ilk durum tam listesini verir.Serileri listesi döndürerek listeye alabilirsiniz (NODE_TYPE 13 =) üst olarak modeli kök düğüm olan (PARENT_UNIQUE_NAME = 0).FLATTENED anahtar sonuçlar daha kolay okunur yapar.
Not
PARENT_UNIQUE_NAME, destek ve olasılık sütun adını bunları aynı ada sahip ayrılmış anahtar sözcükleri ayırmak için ayraç içine alınması gerekir.
SELECT FLATTENED NODE_UNIQUE_NAME,
(SELECT ATTRIBUTE_VALUE AS [Product 1],
[Support] AS [Sequence Support],
[Probability] AS [Sequence Probability]
FROM NODE_DISTRIBUTION) AS t
FROM [Sequence Clustering].CONTENT
WHERE NODE_TYPE = 13
AND [PARENT_UNIQUE_NAME] = 0
Kısmi sonuçlar:
node_unique_name |
Ürün 1 |
Sıra desteği |
Sıra olasılık |
---|---|---|---|
1081327 |
Eksik |
0 |
####### |
1081327 |
All-Purpose Bike Stand. |
17 |
0.00111 |
1081327 |
Bisiklet Yıkama |
64 |
0.00418 |
1081327 |
(4-36 atlanmış satır) |
|
|
1081327 |
Bayan Dağ Şortu |
506 |
0.03307 |
Modelinde sıralarının listesini her zaman alfabetik olarak artan düzende sıralanır.Sipariş numara sırasının bakarak ilgili geçişleri bulmak için serileri sırası önemlidir.The Missing value is always transition 0.
Örneğin, önceki sonuçlarda "Kadınlar'ın Dağ kısayoluyla" ürün modelinde sıra numarası 37 ' dir."Kadınlar'ın Dağ kısayoluyla sonra." şimdiye kadar satın alınan ürünlerin tümünü görüntülemek için bu bilgileri kullanabilirsiniz...
Bunu yapmak için , ilk olarak, değer modeli için tüm sıraları içeren düğüm KIMLIĞI elde etmek için önceki sorguda NODE_UNIQUE_NAME için döndürülen başvuru.Bu değer sorguya yalnızca bu düğüm, model al sıralamalarını listesini içerecek şekilde olmuyor dahil geçişleri almak için üst düğüm KIMLIĞI olarak geçirir.Ancak geçişleri için belirli bir kümeyi listesini görmek isterseniz, küme düğümü KIMLIĞI geçirmek ve yalnızca o kümesi ile ilişkili sequences konusuna bakın.
SELECT NODE_UNIQUE_NAME
FROM [Sequence Clustering].CONTENT
WHERE NODE_DESCRIPTION = 'Transition row for sequence state 37'
AND [PARENT_UNIQUE_NAME] = '1081327'
Örnek sonuçlar:
node_unique_name |
---|
1081365 |
Bu KIMLIK ile temsil edilen düğüm "Kadınlar'ın Dağ Shorts" ürün desteği ve olasılığı değerlerini birlikte izleyen sıralarının listesini içerir.
SELECT FLATTENED
(SELECT ATTRIBUTE_VALUE AS Product2,
[Support] AS [P2 Support],
[Probability] AS [P2 Probability]
FROM NODE_DISTRIBUTION) AS t
FROM [Sequence Clustering].CONTENT
WHERE NODE_UNIQUE_NAME = '1081365'
Örnek sonuçlar:
t.Product2 |
t.P2 desteği |
Olasılık t.P2 |
---|---|---|
Eksik |
230.7419 |
0.456012 |
Klasik vest |
8.16129 |
0.016129 |
Harf geçiş yapma |
60.83871 |
0.120235 |
Yarım Finger Gloves |
30.41935 |
0.060117 |
Uzun Sleeve Logo bölgesi |
86.80645 |
0.171554 |
SOCKS aracın |
28.93548 |
0.057185 |
Kısa Sleeve Klasik bölgesi |
60.09677 |
0.118768 |
Destek için Kadınlar'ın Dağ kısayoluyla ilişkili çeşitli sıralarının 506 modelinde olduğunu unutmayın.Geçişleri için Destek değerleri, en çok 506 de ekleyin.Ancak, numaraları yalnızca her geçiş içeren bir servis talebi sayısını göstermek için destek sağlayacaksa biraz tek görünmektedir tamsayılar değildir.Küme oluşturma yöntem kısmi üyeliği hesaplar için ancak, küme içindeki herhangi bir geçiş olasılığını tarafından belirli bir kümeye ait olasılığını ağırlıklı gerekir.
Örneğin, dört kümeleri varsa, belirli bir sıra küme 1, 2 kümeye ait bir % 30 şansını, 3 kümesine ait olan bir % 20 şansını ve 4 kümesine ait olan bir % 10 şansını ait bir % 40 şansını olabilir.Algoritma, geçişi genellikle büyük bir olasılıkla ait olduğu kümenin belirler sonra küme içindeki değerler Küme önceki olasılık tarafından weights.
Başa dön
Örnek sorgu 3: Model sistem saklı yordamları
Model içinde depolanan bilgiler karmaşıktır ve gerek duyduğunuz bilgiyi elde etmek için birden fazla sorgu oluşturmak gereksinim duyabileceğiniz bu sorgunun örneklerini görebilirsiniz.Ancak, modeli kümeleme sýrada yer alan bilgileri grafik olarak görüntülemek için Microsoft Küme hizmeti, sıra Görüntüleyici güçlü araçları kümesi sağlar ve görüntüleyiciyi de sorgulayabilir ve detaya model kullanabilirsiniz.
Çoğu durumda, Analysis Services'ı kullanarak Microsoft kümeleme, sıra Görüntüleyici ' sunulan bilgiler oluşturulur sistem saklı yordamları modeli sorgulanamıyor.Aynı bilgileri, ancak Analysis Services'ı almak için model içerik veri madenciliği Uzantıları (DMX) sorguları yazabilirsiniz sistem saklı yordamları incelenmesi, veya modelleri sınamak için kullanışlı bir kısayol sağlar.
Not
Analysis Services sunucusu ile etkileşim için saklı yordamlar iç sunucu ve istemciler tarafından Microsoft işlemek için kullanılan sistem sağlar.Bu nedenle Microsoft, bağımsız değişkenleri ve davranışı istediğiniz saat değiştirebilir hakkını saklı tutar.Kolaylık olması için burada açıklanan olsa da, biz kullanımları üretim ortamında desteklemez.Kararlılık ve uyumluluk üretim ortamında emin olmak için her zaman kendi sorgularını DMX kullanarak yazmanız gerekir.
Bu bölümde, sistem saklı yordamları sorgular modeli kümeleme bir sıra oluşturmak için nasıl kullanılacağı bazı örnekler verilmektedir:
Başa dön
Küme profilleri ve örnek durumlar
Küme profilleri sekmesini modeli, her küme ve kümedeki dahil durumlarını gösteren bir çubuk grafik boyutunu kümelerin listesini gösterir.Kullanabileceğiniz iki sistem saklı yordamları vardır sorgularda benzer bilgileri almak için:
GetClusterProfile NODE_DISTRIBUTION içinde bulunan tüm bilgiler, küme özelliklerini döndürür tablo küme için.
GetNodeGraph düğümlerin ve bir sıra kümeleme görünümünün ilk sekmesinde gördüklerinizi için karşılık gelen kümeleri, matematiksel bir grafik sunumunu oluşturmak için kullanılan kenarları döndürür.Küme düğümleri olan ve kenarları ağırlıklarının ya da gücünü temsil.
Aşağıdaki örnek, sisteme nasıl gösterir saklı yordam, GetClusterProfiles, tüm kümelerin modelindeki ilgili profillerini dönün. Bu saklı yordam, bir dizi tam dönüş DMX deyimi yürütür küme profillerinin modelinde.Ancak, bunu kullanmak için saklı yordam modeli adresini bilmeniz gerekir.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterProfiles('Sequence Clustering', 2147483647, 0)
Aşağıdaki örnek, belirli bir kümeyi, küme 12 ' için profil sistem kullanarak almak verilmektedir saklı yordam GetNodeGraphve küme KIMLIĞI, genellikle sayı küme adı aynıdır.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetNodeGraph('Sequence Clustering','12',0)
Küme KIMLIĞI, aşağıdaki sorguda, gösterilen atlarsanız GetNodeGraph tüm küme profilleri sipariş edilen, düzleştirilmiş listesini verir:
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetNodeGraph('Sequence Clustering','',0)
The Cluster Profile tab also displays a histogram of model sample cases.Bu örnek durumlar idealized servis taleplerini modeli için temsil eder.Bu modelde, eğitim verinin aynı şekilde saklanmaz; bir model için örnek servis taleplerini almak için özel bir sözdizimi kullanın.
SELECT * FROM [Sequence Clustering].SAMPLE_CASES WHERE IsInNode('12')
Daha fazla bilgi için bkz:SELECT FROM < > .SAMPLE_CASES (DMX) modeli.
Başa dön
Küme özellikleri ve küme Ayrımcılığı
The Cluster Characteristics tab summarizes the main attributes of each cluster, ranked by probability.Kaç servis talebi bir kümeye ait ve dağıtım servis talepleri gibi kümede nedir bulabilirsiniz: Her özellik, belirli bir desteğe sahiptir. Belirli bir küme özelliklerini görmek için , küme KIMLIĞI bilmelisiniz.
Aşağıdaki örnekler, sistemin kullandığı saklı yordam, GetClusterCharacteristics, 0.0005 belirtilen eşik değeri bir olasılık puan olan tüm özelliklerini küme 12 dönün.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('Sequence Clustering','12',0.0005)
Tüm küme özelliklerine dönmek için küme KIMLIĞI boş bırakabilirsiniz.
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterCharacteristics('Sequence Clustering','',0.0005)
Aşağıdaki örnek sistem saklı yordamı çağırır. GetClusterDiscrimination Küme 1 ve küme 12 özelliklerini karşılaştırmak için .
CALL System.Microsoft.AnalysisServices.System.DataMining.Clustering.GetClusterDiscrimination('Sequence Clustering','1','12',0.0005,true)
Iki küme karşılaştırmanızı veya bir küme, tamamlayıcı ile karşılaştırmak için DMX kendi sorgunuzu yazın istiyorsanız, önce tek bir özellikler kümesi almak ve sonra ilgilendiğiniz ve iki adet karşılaştırmak özel küme özelliklerini almak gerekir.Bu senaryo daha karmaşıktır ve genellikle işlem bazı istemci gerektirir.
Durumlar ve geçişleri
The State Transitions tab of the Microsoft Sequence kümeleme performs complicated queries on the back end to retrieve and compare the statistics for different clusters.Bu sonuçlar üretmek için daha karmaşık bir sorgu işleme bazı istemci gerektirir.
Ancak, açıklanan DMX sorgularını kullanabilirsiniz. Örnek 2 değerler ve durumları sıralarının veya tek tek bir geçiş için almak için.
Başa dön
Model kümeleme bir sıra üzerinde tahmin sorgular.
Tahmin modeli kümeleme bir sıra sorguları diğer küme modelleriyle kullanılan öngörü işlevlerin çoğunu kullanabilirsiniz.Buna ek olarak, özel bir tahmin işlevini kullanabilirsiniz. PredictSequence (DMX), sonraki durumları hakkında öneriler veya tahmin yapma.
Başa dön
Örnek sorgu 4: Ileri durum veya durumlar tahmin
Kullanabileceğiniz PredictSequence (DMX) işlev, sonraki en yakın durum, bir değeri tahmin etmek. Ayrıca, birden çok sonraki durumları tahmin edebilir: Örneğin, bir müşterinin satınalma öneriler listesini göstermek için olası olan en üst üç ürünlerin listesini dönebilirsiniz.
Aşağıdaki örnek sorgu ile birlikte, olasılık üst beş Öngörüler döndüren bir tek tahmin sorgudur.Model, iç içe geçmiş bir tablo içerdiğinden, iç içe geçmiş tablo, kullanmalısınız. [v Assoc Seq Line Items], Öngörüler yaparken sütun başvurusu olarak. Giriş olarak değerleri sağlamak, ayrıca, büyük bir tablo hem de iç içe geçmiş tablo sütunları, iç içe geçmiş olarak SELECT ifadelerine gösterilen birleştirmelisiniz.
SELECT FLATTENED PredictSequence([v Assoc Seq Line Items], 7)
FROM [Sequence Clustering]
NATURAL PREDICTION JOIN
(SELECT (SELECT 1 as [Line Number],
'All-Purpose Bike Stand' as [Model]) AS [v Assoc Seq Line Items])
AS t
Örnek sonuçlar:
Ifade. $ sırası |
ifade.Line numarası |
ifade.Model |
---|---|---|
1 |
|
Harf geçiş yapma |
2 |
|
Harf geçiş yapma |
3 |
|
Spor 100 |
4 |
|
Uzun Sleeve amblem bölgesi |
5 |
|
Yarım Finger Gloves |
6 |
|
All-Purpose Bike Stand. |
7 |
|
All-Purpose Bike Stand. |
Üç sütun vardır, sonuçlar rağmen sorgu her zaman, servis talebi için bir sütun verdiği için yalnızca bir sütun, bekleyebilirsiniz tablo.sonuçlar burada düzleştirilir; aksi durumda, sorgu, iki iç içe geçmiş tablo sütunları içeren tek bir sütun döndürecektir.
Varsayılan olarak tarafından döndürülen sütun sütun $ sırası olan PredictSequence Tahmin sonuçlarını sıralamak için işlev'ı tıklatın. sütun [Line Number], gereken sıra eşleşecek şekilde modelde tuşları, ancak anahtarlar değil olarak çıktı.
Interestingly, All-Purpose Bike bekleme sonra öngörülen bir üst serilerini harf geçiş yapma ve geçiş yapma harf ' dir.Bu, bir hata değildir.Nasıl verileri müşteriye sunulur ve nasıl modeli eğitim zaman gruplandırılır bağlı olarak, bu tür sıralar çok olanaklıdır.Örneğin, bir müşteri cycling büyük harf (kırmızı) satınalma ve sonra başka bir geçiş yapma (mavi) cap veya miktar belirtmek için bir yol varsa, ikisi bir satırda satınalma.
Satır 6 ve 7 değerler yer tutuculardır.Olası geçişlerinin zincirinin son ulaşmak yerine, tahmin sonlandırılıyor sonuçlar, girdi olarak geçirilen değerin sonuçlar eklenir.20 Öngörüler, satır 6-20 değerleri sayısı artar, örneğin, tüm aynı All-Purpose Bike bekleme olacaktır.
Başa dön
Işlev listesi
Tüm Microsoft algoritmalar, sık kullanılan bir işlevler kümesi destekler. Ancak, Microsoft Sıra kümeleme algoritması, aşağıdaki tabloda listelenen ek işlevleri destekler.
Tüm ortak olan işlevlerin listesi için Microsoft algoritmalar için bkz: Types (DMX) sorgu için işlevler'i eşleme. Belirli işlevlerin sözdizimi için bkz: Veri madenciliği Uzantıları (DMX) işlev başvurusu.
Değişiklik Geçmişi
Güncelleştirilmiş içerik |
---|
Sorgu örnekleri gözden geçirmek daha kolay Gezinti bağlantıları eklendi. |
Sabit hatalı veriler, örneğin 2 döndürdü. |
See Also