Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği)
Bir veri araştırma modeli eğitim almış sonra sağlanan özel bir görüntüleyici kullanarak model keşfedebilirsiniz SQL Server Management Studio veya Business Intelligence Development Studio. Ancak, Öngörüler ya da modelinden Gelişmiş ya da daha fazla bilgi edinmek istiyorsanız, veri madenciliği modeline yönelik bir sorgu oluşturmanız gerekir.Daha iyi anlamak ve model bilgileri aşağıdaki yollarla çalışabilirsiniz Yardım sorgular:
Tek yapma ve toplu iş iş Öngörüler.
Modeli tarafından bulunan desenleri hakkında daha fazla öğrenme.
Ayrıntılar ya da belirli bir desen veya alt küme küme modelin eğitim servis taleplerini görüntüleme.
Aracılığıyla araştırma modeli durumlarda ayrıntılarını Delme.
Formüller, kurallar, tüm ilgili istatistikleri veya alt küme küme küme modelin ve Veri ayıklanıyor.
SQL Server Analysis Services sorgular ve veri madenciliği Uzantıları (özel Öngörüler ve karmaşık bir sorgu oluşturmak için yararlı olan DMX) olarak adlandırılan bir sorgu dili oluşturmak için bir grafik tasarım arabirim sağlar.DMX tahmin sorguları oluşturmak için , istediğiniz ikisinde bulunan sorgu oluşturucuları olan başlatabilirsiniz SQL Server Management Studio ve Business Intelligence Development Studio. Bir sorgu şablonları DMX de sağlanır SQL Server Management Studio.
Sorgu Oluşturucusu'ni kullanma hakkında daha fazla bilgi için bkz: DMX tahmin sorgular oluşturmak için tahmin Sorgu Oluşturucusu'nu kullanma.
DMX sorgu şablonları kullanma hakkında daha fazla bilgi için bkz: SQL Server Management Studio'da DMX sorgular oluşturma veya Nasıl Yapılır: SQL Server Management Studio'da Şablonları'nı kullanın.
Bu bölüm, oluşturduğunuz sorgular ve her tür sorgu sağlayan bilgi türlerini açıklar.Bu bölüm ayrıca, belirli türde bir veri madenciliği modelleri için sorgusuna örnekler içerir.
Tahmin sorgular
Aynı cinsten tek adet tahmin sorgular
Toplu iş için tahmin sorgular
saat serisi Öngörüler
Içerik sorgular
Veri tanımı sorguları
Tahmin sorgular
Ana amacı, birçok veri madenciliği proje Öngörüler yapmak madenciliği modelleri kullanmaktır.Örneğin, şirketinizin gelecek yıl, aralık sırasında satış kaç ürün tahmin etmek istediğiniz veya olası bir müşteriye bir ürünün bir reklam kampanya yanıtı olup satınalma.
Bir tahmin oluşturduğunuzda, genellikle bazı yeni bir veri parçasını sağlamak ve yeni verilere dayanan bir tahmin oluşturmak için model isteyin.Öngörüler bir toplu iş iş işlemi için bir dış modeli eşleyerek yapabileceğiniz kaynak veri bir Tahmin birleştirmek.Alternatif olarak, değerler bir anda sağlayabilir bir saat, oluşturarak bir Aynı cinsten tek adet sorgudur.
Hem tek hem de toplu iş iş öngörü sorgular, yeni verileri tanımlamak için TAHMIN birleştirmek sözdizimini kullanın: nasıl tahmin birleştirmek giriş yan belirtilen farktır. Tek bir sorguda, sorgunun parçası olarak sağlanan satır içi veridir.Bir toplu iş sorgudaki veriler, bir dış veri gelir kaynak OPENQUERY sözdizimi kullanılarak belirtilir.Daha fazla bilgi için bkz:openquery (dmx).
Buna ek olarak, saat serisi modelleri yalnızca modelini temel alan Öngörüler yapmanıza izin vermiyor — herhangi yeni veriyi sağlar, ancak yalnızca varolan serisi esas Öngörüler istek gerekmez.
Aşağıdaki bölüm, her biri, bu sorgu türleri oluşturma hakkında bilgi sağlar:
Sorgu türü |
Query Seçenekleri |
---|---|
Aynı cinsten tek adet tahmin sorgu |
Tek bir yeni durum veya sorgu yazdığınız birden fazla yeni durumlarda, ilgili tahmin yapın. |
Toplu iş Öngörüler |
Yeni bir dış veri durumlarda eşleme kaynak model ve marka Öngörüler için. |
saat serisi Öngörüler |
Sonraki adımlar, varolan bir modelini temel belirtilen sayıda tahmin. Yeni veri eklemek, varolan bir modeli genişletmek ve bileşik serisi esas Öngörüler olun. Varolan modeli REPLACE_MODEL_CASES seçeneğini kullanarak, yeni veri serisine uygulanır. |
Sonraki aya, satış miktarı gibi belirli bir değer veya ürün müşteriye önermek için öngörülen ek olarak, bir tahmin sorgu için tahmin ilgili çeşitli türde bilgiler dönmek için özelleştirebilirsiniz.Örneğin, kullanıcıya, ya öneriyi sunmak karar verebilirsiniz, tahmin doğru olma olasılığını bilmesi yardımcı olabilir.
Bir tahmin sorgu tarafından döndürülen bilgileri özelleştirmek için , eklediğiniz Tahmin işlevleri sorgu.Her model veya sorgu türü, belirli işlevleri destekler.Örneğin, Küme modelleri modeli tarafından oluşturulan gruplandırmalar hakkındaki ek ayrıntıları sağlayan özel bir tahmin işlevlerini destekler.saat serisi modelleri saat içindeki farkları hesaplamak tahmin işlevlerini destekler.Hemen hemen tüm modeli türleriyle çalışmak genel bir tahmin işlevleri de vardır.Farklı sorgu türleri desteklenen tahmin işlevlerin listesi için bkz: Types (DMX) sorgu için işlevler'i eşleme. Tahmin işlevleri tam listesi için bkz: Veri madenciliği Uzantıları (DMX) işlev başvurusu.
Başa Dön
Aynı cinsten tek adet sorgular
Basit Öngörüler gerçek içinde oluşturmak istediğiniz tek sorguda yararlıdır saat.Örneğin, bir Web sitesini kullanarak, bir müşterinin bilgilerini almak ve verileri Öngörüler, o müşteri için öneriler özel sunulan döndürmek için kullanın.Veya, bir e-posta içeriğini analiz ve e-posta için bir kategori atayın ve buna göre ileti yönlendirmek için varolan bir sınıflandırma modelini kullanın.
Aynı cinsten tek adet sorgularını girdi içeren ayrı bir tablo gerektirmez.Bunun yerine model tek bir veri satırı geçirmek ve tek bir tahmin gerçek zamanlı olarak döndürülür.Ayrıca, aynı cinsten tek adet sorgu BIRLEŞIM işlecini, ekleme, tek bir durum içeren bir deyim yazın ve sonra da başka bir durum belirtmek için başka bir deyim yazarak birden çok Öngörüler yapmak için genişletebilirsiniz.
Varolan bir modeli aynı cinsten tek adet sorgular'ı aşağıdaki şekillerde oluşturabilirsiniz:
Veri madenciliği Tasarımcısı'nı kullanma.
Bir tek sorgu şablonu kullanma.
Program aracılığıyla veya başka bir DMX deyim oluşturma Analysis Services istemci.
Tek bir sorgu oluşturduğunuzda, modeli formunda TAHMIN birleştirmek, yeni verileri sağlamanız gerekir.Karşın, gerçek bir eşleme değil, yani tablo, yeni verileri varolan sütunları madenciliği modelinde eşleştiğinden emin olmalısınız.Yeni veri sütunlarını ve yeni verileri tam olarak eşleşiyorsa Analysis Services sütunları, eşler. Bu adı verilen bir DOĞAL tahmin BİRLEŞTİRME.Ancak, sütunları eşleşmiyor veya yeni veri modeli veri miktarını ve aynı cinsten içermiyorsa, yeni veri modeli eşlemeye sütunları belirtin veya gerekir eksik değerleri belirtin.
veri madenciliği Tasarımcısı'nda tek bir sorgu oluşturma hakkında daha fazla bilgi için bkz: Nasıl Yapılır: Bir Singleton Query veri madenciliği Tasarımcıda oluşturun... ve DMX tahmin sorgular oluşturmak için tahmin Sorgu Oluşturucusu'nu kullanma.
Tek bir sorgu oluşturmak için DMX kullanma hakkında daha fazla bilgi için bkz: Tahmin sorgular (DMX).
Bir örnek için DMX Query şablonlarında nasıl kullanılır? SQL Server Management Studio, bkz: Nasıl Yapılır: Bir şablondan bir Singleton tahmin sorgusu oluşturma.
Başa Dön
Toplu iş için tahmin sorgular
Tahmin birleştirmek gerçekleştirdiğinizde, yeni bir veri modeli eşleme kaynak, ve Analysis Services sonra Öngörüler her satır için yeni veri desenleri modelinde göre yapar. Büyük miktarda bilgi bir tabloda veya diğer dış veri varsa, tahmin birleştirmek yararlıdır kaynak ve eğitimli modelini kullanarak Öngörüler yapmak.
Varolan bir modeli tahmin sorguları toplu iş, aşağıdaki şekillerde oluşturabilirsiniz:
Veri madenciliği Tasarımcısı'nı kullanma.
Bir şablonu kullanma.
Program aracılığıyla veya başka bir DMX deyim oluşturma Analysis Services istemci.
veri madenciliği Tasarımcısı'nı kullanarak bir Toplu iş tahmin sorgu oluşturursanız, dış veri kaynağına ilk veri kaynağı görünümü tanımlanmış olmalıdır.
DMX tahmin birleştirmek oluşturmak için kullanıyorsanız, dış veri belirtin kaynak OPENQUERY OPENROWSET ve SHAPE komutları kullanarak.Varsayılan veri erişim DMX şablonlarında OPENQUERY yöntemdir.Bu yöntemler hakkında daha fazla bilgi için bkz: <Kaynak veri sorgusu>.
Dış verileri nasıl tanımladığınız bağımsız olarak, belirttiğiniz veri kaynağını veri modelindeki benzer veri içeren sütunlar içermeli.Ancak, yeni bilgileri eksik olabilir.Örneğin, müşteri listenizi bir yaş sütun ancak gelir hakkında bilgi olabilir.Geliri veri modeli eğitim çağrılırken olsa bile, yine de yeni veri modeli için eşleme ve oluşturabilirsiniz bir tahmin; ancak, bazı durumlarda, tam bilgi olmamasından Öngörüler kalitesini etkileyebilir.
En iyi sonuçlar elde etmek için , olabildiğince fazla yeni veri modeli arasındaki olabildiğince eşleşen sütunları birleştirmek.Eleme olsa bile, ancak sorgu başarılı olur.Birleştirilmiş bir sütun, sorgu Beyannameyi eşdeğeri olan Marjinal öngörü döndürür SELECT <predictable-column> FROM <model> bir TAHMIN birleştirmek yan tümce.
Bir tahmin sorgunun sonuçlar ile çalışma
Bir tahmin sorgu ilişkisel bir veritabanında bulunan bir sorgu gibi değil.Bir sorguya eklediğiniz her bir tahmin işlev, kendi satır kümesi kümesi döndürür.Tek bir durum üzerinde bir tahmin yaptığınızda, bu nedenle birkaç ek ayrıntı içeren iç içe geçmiş tablolar sütunları birlikte öngörülen değer olabilir.
Bir sorguda birden fazla işlevi birleştirmek için her iade sonuçlar gibi hiyerarşik satır kümesi kümesi birleştirilir.Ancak, sağlayıcınız hiyerarşik Satır kümeleri işleyemez, tahmin sorguda FLATTEN anahtar sözcüğünü kullanarak sonuçlar Düzleştir.
Satır kümeleri düzleştirilmiş örnekleri de dahil olmak üzere daha fazla bilgi için bkz: SEÇ (dmx).
saat serisi madenciliği modelleri de Öngörüler
saat serisi modelleri, yeni verileri kullanmak ve Öngörüler oluşturma ile ilgili daha fazla esneklik sağlar.Modeline Öngörüler son eğilimleri göre güncelleştirmek için yeni veri sağlayabilir veya model olarak Öngörüler oluşturmaktır ya da kullanımı'nı kullanabilirsiniz.Yeni veri eklerseniz, yeni veriler, modeli servis taleplerini genişletmek veya modeli servis taleplerini değiştirmek için kullanılması gereken biçimi belirtebilirsiniz.
Modeli servis taleplerini genişlettiğinizde, saat serilerini modeline yeni olgu veri eklemek ve başka Öngörüler yeni, birleştirilmiş serisini temel alır.Modeli servis taleplerini değiştirdiğinizde eğitimli modeli tutmak ancak temel aldığı durumlarda yeni bir durum verilerini kümesi ile değiştirin.
Hangi yaklaşımı kullanmanız bakılmaksızın Öngörüler başlangıç noktası her zaman özgün seriyi sonudur.
Örneğin, önceki yılın satış verileri üzerinde eğitilmiş bir varolan saat serisi modeli olduğunu varsayalım.Birkaç ay yeni satış verilerinin toplayana sonra cari yıl için satış tahminlerini Güncelleştir karar verdiniz.Yeni verileri ekleyerek modeli güncelleştirir ve yeni Öngörüler yapmak modelini genişletir tahmin birleştirmek oluşturabilirsiniz.
Alternatif olarak, varolan verilere dayanan model oluşturmak ve daha sonra durum verilerini yeni verilerle değiştirir tahmin birleştirmek oluşturun.Örneğin, bir depo çok miktarda veri eksik ve diğer depo verileri yerleşik bir modeli Öngörüler yapmak için kullanmak istediğiniz, yararlıdır.saat serisi modeller üzerinde tahmin birleştirmeler oluşturma hakkında daha fazla bilgi için sorgulama saat Series modeller Bkz: veya PredictTimeSeries (DMX).
Başa Dön
Içerik sorgular
Içerik sorguda iç istatistiklerini ve yapısını araştırma modeli hakkında bilgi ayıklama bir yoludur.Bazen içerik sorguda görüntüleyicide hazır olan ayrıntılar sağlar.Içerik bir sorgunun sonuçlarını programsal olarak diğer kullanımlar için bilgi ayıklamak için de kullanılabilir.Örneğin, formüller veya değerler, kendi hesaplamalarını yapmak için ayıklamak veya model durumlarda actionable bilgilerini almak.
Bu bölüm, bir içerik bir sorgu kullanarak alabilirsiniz bilgi türleri hakkında genel bilgiler sağlar.Içerik sorgular, aşağıdaki tabloda gösterilen DMX sözdizimini kullanın:
Sorgu türü |
Query Seçenekleri |
---|---|
SEÇİN <modeli>.cases |
Eğitim bir modelini sınamak için kullanılan servis taleplerini bulun.Üzerinden veri araştırma yapısı sütunları da dahil olmak üzere, ayrıntısına. |
SEÇİN <yapısı>.cases |
Bir belirli madenciliği modelinde bulunan sütunlar içeren yapı, bulunan tüm verileri görüntüleyin. |
SEÇİN <modeli>.content |
Belirli bir düğüm modeldeki hakkında ayrıntılı bilgi almak kuralları ve formülleri, destek ve farkı istatistiklerini ve benzeri. |
SEÇİN <modeli>.dimensioncontent |
Sorgu, bir veri madenciliği boyutu destekler. Bu sorgu türü principally iç kullanımı içindir.Eklenti kendi algoritması geliştirirseniz, modelleriniz sınamak için bu sözdizimini kullanabilirsiniz. Tüm algoritmalar, bu işlevselliği desteklemiyor.Destek, bir bayrağı MINING_SERVICES şema satır kümesi tarafından belirtilir. |
Içerik modeli algoritmaları arasında büyük/küçük harf standarttır.Genellikle, ancak içeriği her modelinin model oluşturmak için kullanılan algoritma bağlıdır.Bu nedenle, bir içerik bir sorgu oluşturduğunuzda, ne tür bilgiler modelinde en kullanışlı olandır anlamalısınız.
Örneğin, bir sorgu oluşturursanız, sözdizimi kullanan SELECT FROM <model>.CONTENT, sorgu, model, bir sıra olmasına bağlı olarak çok farklı bilgiler verir kümeleme modeli, bir karar ağacı modeli veya bir saat serisi modeli. Bir ilişki modeli kuralları özel bir uygulamada kullanmak üzere bir saat seriler veya sıra modeli küme modeli tarafından algılanan saat desenleri hakkında daha fazla bilgi bulmak isteyebilirsiniz, ancak belirli iletişim kurallarının açıklamaları almak isteyebilirsiniz.
Aşağıdaki bölümlerde ve etki derecesini elde içerik sorgudan; ancak, bilgi araştırma modeli içeriği ile ilgili bilgileri ve her model türüne özgü içerik derinliğini göstermek için bkz: sağlanan örnekler araştırma modeli Içerik (Analysis Services - veri madenciliği).
Örnek 1: Bir ilişkilendirme modeli içerik sorgusu
Bir SELECT FROM kullanabilirsiniz <modeli>Içerik modeli sorguladığınız türüne bağlı olarak çeşitli dönmek için .CONTENT ekstresi. Itemsets 7 NODE_TYPE değeri var; oysa bir ilişki modeli kuralları temsil eden 8 NODE_TYPE değeri düğümünüz.Bu nedenle, aşağıdaki sorguyu en iyi 10 itemsets, (varsayılan sıralama) desteği tarafından olduklarına, döndürecektir.
SELECT TOP 10 NODE_DESCRIPTION, NODE_PROBABILITY, SUPPORT
FROM <model>.CONTENT WHERE NODE_TYPE = 7
Aşağıdaki örnek, üç sütun verir: düğüm, tam bir kural ve itemset sağ tarafında bulunan ürün KIMLIĞINI — diğer bir deyişle bir itemset bir parçası olarak diğer ürünleri ile ilişkilendirilecek öngörülen ürün.
FLATTENED anahtar düz yuvalanmış satır kümesi kümesi dönüştürüleceğini gösterir tablo.Kuralı sağ tarafında, ürün gösteren bir öznitelik NODE_DISTRIBUTION tablosunda bulunur; bu nedenle, size yalnızca bir öznitelik adı uzunluğu %2 değerinden büyük zorunlu ekleyerek içeren satır almak.Üçüncü model adını kaldırmak için kullanılan basit bir dize işlev sütun.Genellikle model adı her zaman iç içe geçmiş bir sütun değerleri için öneki.WHERE yan tümce NODE_TYPE değeri yalnızca kuralları almak için 8 ' olması gerektiğini belirtir.
SELECT FLATTENED NODE_UNIQUE_NAME , NODE_DESCRIPTION,
(SELECT RIGHT(ATTRIBUTE_NAME, (LEN(ATTRIBUTE_NAME)-LEN('Association model name')))
FROM NODE_DISTRIBUTION
WHERE LEN(ATTRIBUTE_NAME)>2
)
AS RightSideProduct
FROM [<Association model name>].CONTENT
WHERE NODE_TYPE = 8
ORDER BY NODE_SUPPORT DESC
Daha fazla örnek için bkz: Bir ilişkilendirme modeli sorgulama (Analysis Services - veri madenciliği).
Örnek 2: Karar ağaçları modeli içerik sorgusu
Bu duruma neden öngörülen açıklayan kural döndürerek tahmin sorguda izlemek istediğinizde, içerik modeli sorgulama önemli olduğu bir senaryodur.Örneğin, tahmin işlev ekleyebilirsiniz. PredictNodeId (DMX) kural için aşağıdaki sözdizimini kullanarak içeren düğüm KIMLIĞI elde etmek için bir sorgu için:
SELECT Predict([Bike Buyer]), PredictNodeID([Bike Buyer])
FROM [<decision tree model name>]
PREDICTION JOIN
<input rowset>
Bir karar ağacı modeli, resim yazısı sonucu yolunu açıklamasını içerir.Bu nedenle, sonucunu içeren düğüm KIMLIĞI sonra kural veya yol aşağıdaki gibi içerik bir sorgu oluşturarak tahmin açıklayan alabilirsiniz:
SELECT NODE_CAPTION
FROM [<decision tree model name>]
WHERE NODE_UNIQUE_NAME= '<node id>'
Daha fazla örnek için bkz: Karar ağaçları model sorgulama (Analysis Services - veri madenciliği).
Başa Dön
Veri tanımı sorguları
Analysis Services veri tanımı deyimleri çeşitli oluşturma ve araştırma yapısı ve modeli sağlar.Daha fazla bilgi için bkz:Veri madenciliği yapıları ve modeller yönetme.