Veri madenciliği modelleri doğrulama (- Analysis Services veri madenciliği)
Doğrulama, ne kadar iyi karşı gerçek veri madenciliği modelleriniz gerçekleştirmek değerlendiriliyor işlemidir.Kendi kalitesini ve özelliklerini, önce anlayarak, veri madenciliği modelleri doğrulamak önemlidir dağıtmak üretim ortamına onları.
Kalitesini ve özelliklerini veri Değerlendirme için çeşitli yaklaşımlar vardır araştırma modeli.İlk veri veya modeli sorunları olup olmadığını belirlemek için istatistiksel geçerlilik çeşitli önlemleri kullanımını içerir.İkinci olarak, eğitim ve Öngörüler doğruluğunu test etmek için kümeleri sınama içine verileri ayrı.Son olarak, iş uzmanlar gözden geçirmek isteyebilir. sonuçlar keşfedilen desenleri hedeflenen iş senaryosunda anlam yüklü olup olmadığını belirlemek için veri madenciliği model.Bu yöntemlerin tümü, veri madenciliği metodolojisi yararlı ve inventory oluşturmak, sınamak ve belirli bir sorunun yanıtlanması için modeller geliştirmek gibi kullanılır.
This section introduces some basic concepts related to model quality, and introduces the strategies for model validation that are provided in Microsoft SQL Server 2008 Analysis Services. For an overview of how model validation fits into the larger data mining process, see Veri Araştırma Projeleri (Analysis Services - veri madenciliği).
Veri madenciliği modelleri ölçmek için ölçütler
Veri doğrulama yöntemlerinin çoğunda araştırma modeli iş sorulara doğrudan yanıt, ama iş ya da geliştirme kararı size yol göstermesi için kullanılan ölçüler sağlar.Bir model olduğunda yeterince, iyi söylemek kapsamlı kural yok veya yeterli veri varsa.
Veri madenciliği kıstası genellikle doğruluk, güvenilirlik ve kullanışlılığı kategoriye ayrılır.
Doğruluk, güvenilirlik ve kullanışlılığı
Doğruluk ne kadar iyi sağlanmış veri özniteliklere sahip bir sonuca modeli belirtilirler ölçü.Doğruluk çeşitli önlemleri vardır, ancak tüm doğruluk kullanılan verilere bağımlı önlemlerdir.Gerçekte, eksik veya yaklaşık değerler olabilir veya verileri birden çok işlem tarafından değiştirilmiş.Özellikle veri karakteristiklerini içinde oldukça uniform ise özellikle aşamasında tanımaya ve geliştirme, belirli bir miktarda veri hata kabul karar verebilirsiniz.Örneğin, bu mağazaya sürekli olarak yanlış hesap yöntem kullanıyor olsa bile, Satışlar geçmişte dayanarak belirli bir deponun için öngörür bir model kesinlikle ilişkili ve çok doğru olabilir.Bu nedenle, doğruluk ölçüleri değerlendirmeler, güvenilirliği ile dengelenmelidir.
Güvenilirlik yol assesses, bir veri araştırma modeli farklı veri kümeleri üzerinde gerçekleştirir.Bir veri araştırma modeli Öngörüler aynı türünü üreten veya desenleri sağlanan sınama verileri bakılmaksızın aynı genel tür bulur güvenilir olur.Örneğin, yanlış hesap yöntem kullanılan deposu oluşturmak modeli de diğer mağazalarda generalize ve bu nedenle güvenilir olmayacaktır.
Yararlılığını olup modeli yararlı bilgiler sağlar söylemek çeşitli ölçümler içerir.Örneğin, bir veri araştırma modeli correlates satış yeri saklamak doğru ve güvenilir olmasına rağmen aynı konumda daha fazla mağazalar ekleyerek sonucunda generalize olamaz çünkü yararlı olmayabilir.Üstelik, neden daha fazla satış belirli konumlara sahip, temel iş soruyu yanıtlayın.Ayrıca başarılı olarak görünen bir modeli fark olgu arası-verilerin bağıntıları dayandığı anlamsız, çünkü.
Microsoft veri madenciliği Framework
NET-dm tanımlama, geliştirme ve veri madenciliği proje uygulama adımları açıklar tanınmış bir metodoloji var.Ancak, NET-dm nasıl kapsam ve zamanlama bir proje içinde belirli yönergeler sağlamak kavramsal bir çerçeve vardır.Veri madenciliği de ilgilenen ancak planlama nereden başlayacağınızı iş kullanıcılar belirli gereksinimlerine ve içinde nitelikli olabilir geliştiriciler gereksinimlerini daha iyi karşılamak için.net uygulama geliştirme, ancak veri madenciliği için yeni olan Microsoft içeren kapsamlı bir Sistem Değerlendirme veri madenciliği proje uygulamak için bir yöntem geliştirdi
Daha fazla bilgi için bkz: Microsoft veri Mining kaynakları sayfa.
sql Server Analysis Services madenciliği Model doğrulama olarak giderme yaklaşımları
SQL Server 2008 birden fazla yaklaşımlar geliştirme metodolojisi mining veri tüm aşamalarını destekleyen veri madenciliği çözümleri, doğrulanması için destekler.
Veri eğitimi ve kümeleri sınama içine bölümleme
Veri eğitimi ve kümeleri sınama içine bölümleme Değerlendirme için verilerin hazırlanması için kurulan bir tekniktir.Verileri bir bölümünün eğitim verileri küme test etme ve kalan verileri kullanıldığı için eğitim için ayrılmıştır.Model tamamlandıktan sonra modeli sınama küme karşı Öngörüler yapmak için kullanılır.Eğitim küme verileri ile eğitim için kullanılan aynı verilerden rasgele seçildiğinden, sınama dan türetmek doğruluk ölçüler veri tutarsızlıkları tarafından etkilenebilir ve bu nedenle modeli özelliklerini daha iyi yansıtacak daha düşüktür.
Daha fazla bilgi için bkz: Veri eğitimi ve kümeleri sınama içine bölümleme (Analysis Services - veri madenciliği).
Karşılıklı doğrulama veri madenciliği modelleri
Karşılıklı doğrulama, bir dataset birçok küçük cross-sections bölüm ve birden çok modelleri tam veri küme geçerliliğini sınamak için cross-sections oluşturmak sağlar.Analysis Servicessonra her bölüm için ayrıntılı doğruluk ölçülerini oluşturur.Bu bilgileri kullanarak, tek bir modelin kalitesini artırmak veya belirli bir veri küme için en iyi modelleri tanıtmak.
Daha fazla bilgi için bkz: Karşılıklı doğrulama (- Analysis Services veri madenciliği).
Araştırma modeli doğruluğu grafik oluşturma
Microsoft SQL Server Analysis Services provides tools to help you graph prediction accuracy, test the model against new or existing data, or compare multiple models in charts and reports.
A yükseltme grafiği yöntemi kullanarak bir veri alma geliştirme görselleştirmenin araştırma modeli, rasgele tahmin karşılaştırın.De oluşturabilirsiniz Kar grafikleri , mali kazanç veya ilişkilendir maliyetleri bir araştırma modeli kullanımını ve dağılım çizim regresyon modeller için.A sınıflandırma matris iyi ve kötü tahminler içine sıralama yöntem olan bir tablo böylece hızlı ve kolayca doğru hedef değer modeli öngörür ölçmek.
Daha fazla bilgi için Model doğruluğu grafik için Araçlar (Analysis Services - veri madenciliği).
Ayrıca modeller eğitmek ve aynı kaynak verisine farklı bileşimleri test etmek için çeşitli şekillerde filtre uygulayabilirsiniz.Daha fazla bilgi için bkz: Araştırma modeli doğruluğu ölçme (Analysis Services - veri madenciliği).
Göz atma ve sorgulamaya modelini içerik ve servis talepleri
Analysis Services veri madenciliği görüntüleyicileri gözatma ve modeli küme sağlar.İçerik Yardım sorguları modelini daha iyi anlamak ve beklenmedik sorunlar sizin yaklaşım veya verileri bulmak da oluşturabilirsiniz.Veri madenciliği Extensions (dmx) kullanarak içerik bir sorgu oluşturduğunuzda, araştırma modeli tarafından keşfedilen desenleri hakkında istatistiksel bilgi almak veya özel desenler modeli tarafından bulunan destek servis taleplerini almak.Ayrıca ayrıntılı olarak bulmak veya model içinde yer almayan ayrıntılı bilgi sunmak için temel araştırma yapısı, ayrıntıya aracılığıyla veya duruma eylem desenleri verilerde üzerinde.
Sorgu modeli içeriği hakkında daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama (- Analysis Services veri madenciliği).
Modeli içeriği gözatma hakkında daha fazla bilgi için bkz: Veri madenciliği Model görüntüleme.
Modeli içeriği belirli algoritmalar yorumlama hakkında daha fazla bilgi için bkz: Veri madenciliği algoritmaları (Analysis Services - veri madenciliği).