Aracılığıyla paylaş


araştırma modeli doğruluğu ölçme (Analysis Services - veri madenciliği)

SQL Server Analysis Services bir şekilde madenciliği modelleri doğru olup olmadığını belirlemek için çeşitli yollar sağlar.

  • Grafik, bir veri araştırma modeli doğruluğunu görsel olarak göstermek için kullanabilirsiniz: A Grafik kaldırın. her modelin Öngörüler doğruluğunu karşılaştırır.C kar grafiği teorik artırma her modeli kullanarak ilişkili kar görüntüler.C dağılım çizim karşı tahmin edilen değerlerin gerçek değerleri karşılaştırır ve regresyon modelleri veya diğer sürekli girişleri'ni kullanarak sürekli öznitelikleri tahmin modelleri için kullanılır.

  • Kullanabileceğiniz bir sınıflandırma matrisi doğru ve yanlış Öngörüler tabulate.

  • Kullanabileceğiniz Çapraz doğrulama istatistiksel olarak güvenilirliğini doğrulamak için araştırma modeli.

Daha fazla bilgi için bkz: Model doğruluğu grafik araçlar (Analysis Services - veri madenciliği). Tüm bu konuda açıklanan grafik türleri de programsal olarak XML kullanılarak oluşturulabilir/A veya ÇYN.Programlama hakkında daha fazla bilgi için Analysis Services çözüm için bkz: Geliştiricinin Kılavuzu (Analysis Services - veri madenciliği).

Not

Model olduğunu belirledikten sonra bağlantısının doğru içerik modeli olan iş sorununun modelinde sonuçlarını değerlendirmelidir yanıtlamak üzere tasarlanmıştır.

Bu konuda, genel iş akışında açıklanmaktadır. Business Intelligence Development Studio veya SQL Server Management Studio doğruluğunu ölçmek için bir araştırma modeli. Kullanmakta olduğunuz araştırma modeli ve seçtiğiniz grafik türü, bağlı olarak bazı seçenekler biraz farklı, kullanılamaz ve varsayılan olarak yapılandırılmış olabilir, ancak genel işlem aşağıdaki gibidir:

  1. Bir modeli veya yapısını sınamak için bu seçeneği seçin.

  2. Sınama verileri seçin.

  3. Isteğe bağlı olarak, sınama veriyi süzün.

  4. Bir grafik türü seçin ve uygun görüntüleyicide açmak.

  5. Isteğe bağlı olarak Grafiği özelleştirin.

Adım adım bir yordam için bkz: Nasıl Yapılır: Bir doğruluğu grafik için oluşturma bir araştırma modeli.

Bir model veya yapı seçme

It is common practice to build several data mining models for each data mining structure, and for each model to use a different algorithm or set of parameters.Analysis Services makes it easy to test multiple related mining models in the same chart.Ancak, bir doğruluk grafikte çıkış için yalnızca bir tek araştırma modeli de seçebilirsiniz.

Içinde Business Intelligence Development Studio, araştırma yapısı'nı seçin ve ardından Madenciliği doğruluğu grafik sekmesi doğruluk grafikleri için bir tasarım alanı'nı açın.Içinde SQL Server Management Studio, araştırma yapısı'nı sağ tıklatın ve sonra seçin. Görünüm yükseltme grafiği , aynı tasarım alanı'nı açın ve her türlü doğruluk grafik oluşturmak için.

Bir grafikte birden çok madenciliği modelleri eklerseniz, aynı tahmin edilebilir olan madenciliği modelleri seçmelisiniz öznitelik.yükseltme grafiği, kar grafiği, dağılım çizim veya sınıflandırmaya matris oluşturursanız, grafiğe kullanarak, modelleri seçebileceğiniz Giriş Seçimi tab.Ancak, bir çapraz doğrulama raporu oluşturma Analysis Services aynı öngörülebilir özniteliğine sahip tüm modeller analiz eder.

Sınama verileri seçme

yükseltme grafiği, kar grafiği ya da dağılım çizim oluşturmadan önce model'yi değerlendirdiğiniz için kullanacağınız veri belirtmeniz gerekir.Because the data that you use for evaluation greatly affects the results of evaluation, SQL Server 2008 Analysis Services provides the following options for specifying test data:

  • Sınama olarak tanımladığı bir gizleme bölümü kullanarak küme veri araştırma yapısı oluşturduğunuzda.Sınama verisi olarak araştırma yapısı verinin bir bölümünü kullanarak yapabilirsiniz ölçü modelleri yapısındaki tüm sürekli olarak.

  • Bir dış veri tanımlama kaynak sınama kullanılacak.

  • Bir dış veri tanımlama kaynak ve servis talepleri için ilgili alt küme küme verileri sınırlamak için filtre uygulama.Bir süzgeci yeniden tanımlayarak, belirli koşulları karşılayan veya belirli ilgisini olan servis taleplerini içerir sınama verileri seçebilirsiniz.

  • Eğitim servis taleplerini modeli tarafından kullanılan geçerli bir süzgeç kullanma.Bir model süzgeci yeniden tanımlayarak, bir veri alt küme küme kümesi için zaman sınırlama ve ayrıca, belirli bir modeli her zaman benzer verileri kullanarak kısmını emin olun.

Bir çapraz doğrulama rapora oluşturursanız Business Intelligence Development Studio veya SQL Server Management Studio, varsayılan olarak Analysis Services varsa modeli için tanımlanmış gizleme bölümü kullanır. gizleme bölüm, tanımlanmışsa Analysis Services Tüm kullanan küme eğitim durumda.

Bir yükseltme grafiği, kar grafiği oluşturursanız, çizim veya sınıflandırmaya matrisinde dağılım. Business Intelligence Development Studio veya SQL Server Management Studio, kullandığınız Giriş Seçimi sekmesi madenciliği doğruluğu grafik görünümünde veri madenciliği modelleri sınama için kullanılacağını belirtmek için veri madenciliği tasarımcısının.Seçenekler aşağıdaki gibidir:

araştırma modeli sınama durumlarda kullanın.

Servis taleplerini araştırma modeli test madenciliği yapıdır verilerinden alınır, ancak modelini sınamak için kullanılan servis taleplerini sınırlamak için bir filtre uygulanır.Bir model süzgeci bir küme koşullarını oluşturun ve sonra araştırma modeli ile birlikte saklayın.Filtre koşulu araştırma modeli kaydedildiği için model alıştırması sırasında varsayılan olarak uygulanır.Modeli sınama, filtre olarak kullanabilirsiniz veya farklı bir kullanabilirsiniz küme sınama; böylece veri modeli süzgeç atlayabilir.Uygulanan süzgeç değiştirmek istediğiniz bir araştırma modeli, modeli filtresini değiştirmek ve daha sonra model reprocess.Alternatif olarak, model bir kopyasını oluşturabilir ve sonra da kopyası üzerinde farklı bir süzgeç oluşturun.

Modeli süzgeçleri hakkında daha fazla bilgi için bkz: Süzgeçleri için madenciliği modelleri oluşturma (Analysis Services - veri madenciliği).

Süzgeç bir araştırma modeli oluşturmak nasıl bir açıklaması için bkz: Nasıl Yapılır: Bir süzgeç için geçerli bir araştırma modeli.

araştırma yapısı sınama durumlarda kullanın.

Bir sınama verileri tanımlanmışsa, doğruluk ölçmek için bu seçeneği kullanabilirsiniz küme gizleme yüzde veya gizleme için kullanılacak bir servis talebi sayısı tanımlayarak, araştırma yapısı oluşturduğunuzda.Sınama, tanımını küme yapısı ile birlikte depolanır.Bu nedenle, sınama küme, bu yapıyı temel alan herhangi bir model ile kullanılabilir.

Not

Süzgeç, doğrudan araştırma yapısı gizleme verisi oluşturamıyor.Ancak, bir geçici çözüm olarak, bu verileri süzmek istiyorsanız, özgün veri kaynağı görünümü gibi bir dış veri kaynağına yeniden ve uygulayabilirsiniz bir süzgeç dış veri kaynağına.

Daha fazla bilgi için bkz: Veri eğitimi ve kümeleri sınama bölümleme (Analysis Services - veri madenciliği).

Farklı bir veri belirtmek küme

Içinde SQL Server 2005, dış veri kullanmak için bir araştırma modeli doğruluğunu sınamak için tek yol olduğu küme. Bu seçenek yine de sağlanmıştır. SQL Server 2008, ancak artık dış veriye bağlı bir süzgeç de tanımlayabilirsiniz.

Bir dış veri kaynağını kullanmak için , herhangi bir girdi için kullanmak istediğiniz dış veri sütunlarından sütunlar için eşlenmelidir araştırma modeli.Bazı sütunlar, ancak dış veriler yoksaymayı seçebilirsiniz küme en az madenciliği modelinde tahmin edilebilir sütuna eşlenen bir sütun içermelidir.Modeline bağlı olarak, sütun veya sütunları için tahmin gerekli özniteliklere sahip bir dış veri eşleme gerekebilir.

veri madenciliği Tasarımcısı'nda kullandığınız Giriş Seçimi sekmesini ve Sütun eşleme belirtin. iletişim kutusunda girdiyi seçmek için tablo olan modeller karşı doğrulandı.Giriş tablosu, tablolardaki sütunları seçin araştırma yapısı and Giriş tabloya seçin. otomatik olarak eşleştirilmiş birlikte.Eşlemeleri tıklatarak gerektiği gibi değiştirebilirsiniz bir sütun, araştırma yapısı tablo ve sürüklemeGiriş tabloya seçin. tablosudur.Verilerin bir iç içe geçmiş tablo içeriyorsa, bu tabloyu kullanarak de ekleyebilirsiniz Iç içe geçmiş tablo seçin. bağlantı.

Not

tahmin edilebilir sütun Her zaman eşlenmelidir.Eşleştirilmiş sütunlar, NULL değerleri olarak madenciliği modeline beslenir.

Isteğe bağlı olarak, karşılık gelen sütun eşlemeli sonra tahmin edilebilir sütun için bir hedef durumunu belirtebilirsiniz.Öngörülebilir sütun durumunu boş bırakırsanız, ne kadar iyi modeli, tahmin edilebilir sütun durumu ne olursa olsun gerçekleştirir yükseltme grafiği öngörür.Veya belirtilen bir durum öngörülebilir sütunun olmadan lift grafikler oluşturma arasındaki farklar hakkında daha fazla bilgi için bkz: Grafik kaldırın (Analysis Services - veri madenciliği).

Ayrıca, dış verileri bir süzgeç oluşturma seçeneğiniz vardır.Bir süzgeç oluşturma konusunda açıklama için bkz: Nasıl Yapılır: Bir doğruluğu grafik için giriş satırları süzme.

The Synchronize Prediction Columns and Values option coordinates the predictable attributes in the external data kaynak and in the araştırma modeli so that, even if they have a different name, they are derived from the same tahmin edilebilir sütun during model training.Aynı temel verilere işaret eden iki araştırma yapısı sütun varsa, bu kullanışlıdır, ancak sütunlar farklı belki etiketlenmiştir.

Temizleyin, Tahmin sütunlar ve değerleri eşitleyin. onay kutusunu, herhangi bir geçerli tahmin edilebilir sütun ve değere seçebilirsiniz ve sonuçlar algılama yapmak, sonuçlar birlikte çizilir.Açıkça aynı değerleri kümesine eşlemek öngörülebilir iki öznitelik Karşılaştırılacak çalışıyorsanız, bu seçeneği temizleyin.Ancak, iki öznitelik doğruluk açısından maddelerdeki olmayabilir bilmelisiniz.Örneğin, yüksek, orta ve düşük demetleri gelir discretizes bir modeli geliri 150.000 +, 50.000-100.000 ve 10. 000-50 000 aralıklardaki gruplandıran bir modeline benzer olabilir.Ancak, onay kutusunu temizleyin, önce özniteliklerini benzer olduğunu doğrulamalısınız.

Daha fazla bilgi için:Nasıl Yapılır: tahmin edilebilir sütun için bir doğruluğu grafiği seçin..., Veri madenciliği araçları kullanarak

Verilere Filtre Uygulama

Geliştirmek ve sınamak için kullanılan verileri süzebilirsiniz bir veri madenciliği aşağıdaki yöntemlerle model:

  • Depolanan bir süzgeç ile modeli oluşturun.

  • Bir dış verilere filtre uygulama kaynak.

Bir filtre tanımladığınızda, gelen verileri esas olarak bir WHERE yan tümce oluşturuyorsunuz.Bir giriş verileri süzme işlemi, küme model değerlendirmek için kullanılan, süzgeç ifade için çevrilmiş bir Transact-SQL Tablo ve grafik oluşturduğunuz zaman, giriş tabloya uygulanmış. Sonuç olarak, sınama servis talebi sayısı büyük oranda azaltılabilir.

Buna ek olarak, filtre uyguladığınızda bir araştırma modeli, oluşturduğunuz süzgeç ifade bir veri madenciliği Uzantıları (DMX) ifade çevrilen ve tek tek model için uygulanır.Bir model için bir süzgeç uyguladığınızda, yalnızca özgün verilerin alt küme küme küme modelin geliştirmek için kullanılır.Bir sınama verileri tanımlanmışsa küme yapısı oluşturduğunuzda, yalnızca sahibin meşru olarak içinde madenciliği yapı eğitim olan durumlar eğitim için kullanılan modeli servis taleplerini içerir. küme ve hangi Filtre koşullarını karşılayan.Buna ek olarak, seçeneğini seçtiğinizde araştırma modeli sınama durumlarda kullanın., sınama servis taleplerini araştırma yapısı sınamada olduğu durumlarda dahil küme ve hangi Filtre koşullarını karşılayan.Filtre koşulları modeli servis taleplerini detaylandırma sorgulamaları için de geçerlidir.

Ancak, gizleme verisi tanımlamak yoksa küme, modeli servis taleplerini sınamak için kullanılan tüm servis talepleri verilerde dahil küme, filtre koşulları karşılayan.

Bu nedenle, birden fazla modeli, farklı bir süzgeç aynı araştırma yapısı temel alan bile olabilir ve sonuç olarak, farklı veri eğitim ve sınamak için kullanabilirsiniz.Seçeneği seçerseniz araştırma modeli sınama durumlarda kullanın. doğruluk grafik oluşturduğunuzda, sınama ve eğitim kümeleri durumlarda toplam sayısı, sınanmakta olan modelleri arasında önemli ölçüde değişebilir bilmeniz.

Not

Varolan bir araştırma modeli için bir süzgeç ekleyin veya filtre koşulları değiştirmek, süzgeç etkisini görmek için araştırma modeli reprocess gerekir.

Kullanılan gerçek eğitim servis taleplerini gözden geçirmek için , DMX içerik sorgu aşağıdaki gibi oluşturabilirsiniz:

SELECT * from <model>.CASES WHERE IsTrainingCase()

veya:

SELECT * from <model>.CASES WHERE IsTestCase()

Bu servis talepleriyle yapısını durumlarda karşılaştırmak için , aşağıdaki DMX içerik sorgu oluştur:

SELECT * FROM <structure>.CASES WHERE IsTestCase()

Not

Sorgu içerik modeli talepleriyle çalıştırmak için , etkinleştirmelisiniz Drillthough model üzerinde.

Süzgeçler, uygulayabilirsiniz ve süzgeç ifadeleri nasıl değerlendirildiği türleri hakkında daha fazla bilgi için bkz: Süzgeç sözdizimi ve örnekleri model (Analysis Services - veri madenciliği).

Bir grafik türü seçme ve grafik görüntüleme

Seçtiğiniz grafik türüne bağlı daha fazla grafikte gözatmak için seçenekleri, yapılandırma seçeneğine sahipsiniz veya Pano ve Excel'deki verilerle çalışma grafiği kopyalayın.

NOT   Çizelgeler ve bunların tanımları kaydedilmez.Bir grafik içeren bir pencereyi kapatırsanız, grafiği yeniden oluşturmanız gerekir.

yükseltme grafiği

Modeller ve sınama veri seçeneklerini yapılandırdıktan sonra tıklatın yükseltme grafiği sekmesi sonuçlar görüntüleyin.Ayrıca, grafiği Pano'ya kopyalayın veya tek tek eğilim çizgileri veya veri noktası ayrıntılarını, mining göstergede görüntüleyebilirsiniz.

Daha fazla bilgi için bkz: Grafik kaldırın (Analysis Services - veri madenciliği) ve yükseltme grafiği Sekmesini (madenciliği doğruluğu Grafiği görünümü).

kar grafiği

Modeller ve sınama veri seçeneklerini yapılandırdıktan sonra tıklatın Grafik kaldırın. Seçim sekmesikar grafiği from the Grafik türü listesine küme grafik seçeneklerini kar tıklatın ve sonra Tamam sonuçlar görüntülemek için.Kullanabileceğiniz Kar hesap ayarları sayısı kadar farklı maliyet seçenekleri deneyin ve grafik olarak görüntülemek istediğiniz iletişim kutusu.Mining göstergenin her modeli için tahmini kar ile ilgili ayrıntılı bilgileri içerir.Panoya ile Excel'de çalışmak için grafik ve mining gösterge içeriğini kopyalayabilirsiniz.

Daha fazla bilgi için bkz: Grafik Kar (Analysis Services - veri madenciliği) ve Kar hesap ayarları iletişim kutusu (madenciliği doğruluğu Grafiği görünümü).

Çizim dağılım.

Tıklattığınızda uygun modeli tipini seçtiyseniz Grafik kaldırın. sekmesinde, grafik türünü otomatik olarak küme içinÇizim dağılım. ve bir dağılım çizim görüntülenir.Herhangi bir yapılandırma olasıdır.Ayrıca, grafiği Pano'ya kopyalayın ve grafiği grafik olarak Excel veya başka bir uygulamaya yapıştırdığınızda.

Daha fazla bilgi için bkz: Çizim dağılım (Analysis Services - veri madenciliği).

Sınıflandırma matrisi

Bir sınıflandırma matris için kullanmak Giriş Seçimi modeller ve sınama verileri seçmek için sekme ve tıklatın.Sınıflandırma matrisi sekmesi sonuçlar görüntüleyin.Sınıflandırma matris içeriğini modeli türleri için aynıdır ve yapılandırılamaz.Grafikte veri panoya kopyalayabilir ve bu sonra ile Excel'de çalışır.

Daha fazla bilgi için bkz: Sınıflandırma matris (Analysis Services - veri madenciliği) veya Sınıflandırma matris sekmesi (madenciliği doğruluğu Grafiği görünümü).

Karşılıklı doğrulama raporu

araştırma yapısı seçtikten sonra bir çapraz doğrulama raporu veya araştırma modeli çözüm gezgini'da tıklatın Doğrulama arası sekmesi, tüm ilgili seçenekleri Yapılandır'i sonuçlar Al raporu oluşturmak için.Herhangi bir yapılandırma olasıdır.Çapraz doğrulama rapor biçimini modeli türleri için aynıdır ve yapılandırılamaz.Ancak raporun içeriğini, çözümleme modeli türü ve öngörülebilir özniteliği veri türüne bağlı olarak değişir.Ayrıca rapor sonuçlarını panoya kopyalayın ve Excel'deki verilerle çalışmak.

Daha fazla bilgi için bkz: çapraz doğrulama (Analysis Services - veri madenciliği) veya çapraz doğrulama Rapor (Analysis Services - veri madenciliği).