Aracılığıyla paylaş


Veri madenciliği Sihirbazı (Analysis Services - veri madenciliği)

The Data Mining Wizard in Microsoft SQL Server Analysis Services starts every time that you add a new mining structure to a data mining project.Sihirbaz, yeni madenciliği yapıları tanımlamanıza yardımcı olur ve veri madenciliği için kullanacağınız veri kaynakları seçer.Sihirbaz ayrıca verilerde partition araştırma yapısı eğitim ve test kümeleri ve her yapısı için bir başlangıç araştırma modeli ekleme yardımı.

Varolan bir içerik madenciliği yapısının türetilmiş veri kaynağı görünümü veya küp.Hangi sütunların eklemek için seçebileceğiniz araştırma yapısı.Bu sütun, o yapısını esas alan tüm modeller kullanabilirsiniz.Kullanıcıları etkinleştirebilirsiniz bir veri madenciliği madenciliği modelinin madenciliği modelinde bulunmayan ek araştırma yapısı sütunları görmek için sonuçlar gelen detaya modeli.

Veri madenciliği Sihirbazı'nı kullanarak bir veri araştırma yapısı ve modeli oluşturduğunuzda, aşağıdaki kararları gerekir:

  • Veri araştırma yapısı ve modeli ilişkisel bir veritabanında veya bir OLAP veritabanındaki, varolan bir küp oluşturmak etkinleştirilmeyeceğini belirtir.

  • Eğitim içinde kullanmak için ne kadar veri ve için ne kadar küme sınamak için ayırabilirsiniz.Bir çıkarma yapı eğitim ve veri küme s sınama bölümlemek, bu yapısını esas alan tüm modeller, sınama kullanabilirsiniz küme.

  • Hangi sütunların veya, tahmin ve sütunlar için hangi özniteliklerin veya öznitelikleri çözümlemesi için giriş olarak kullanılacak.Her yapısı, durum bir kaydı benzersiz olarak tanıtan bir anahtar da içermesi gerekir.

  • Hangi algoritmasını kullanmak için.The algorithms provided in SQL Server Analysis Services have different characteristics and produce different results.Farklı algoritmaları kullanılarak birden çok modelleri oluşturun veya farklı modelleri oluşturmak kullanılan algoritmaları parametrelerini değiştir..

veri madenciliği sihirbaz, bu kararlar almanıza yardım işlevselliği sağlar:

  • durum tanımlamak, sihirbaz sayfalarını küme.Büyük tablolarda ve iç içe geçmiş tablolar bir ilişkisel verilerden seçebilirsiniz kaynak, veya bir OLAP veri kaynak ve sonra büyük/küçük durum tuşu ve durum düzey sütunları seçin ve isteğe bağlı süzgeçler küpü ayarlayın.

  • Verileri sütunlara çözümlemenize ve sütunlar için kullanım önerilir iletişim kutuları.

  • Otomatik algılama sütun içeriği ve veri türleri.

  • Madenciliği model, bir OLAP verilerini esas alıyorsa, otomatik küp dilimleme kaynak.

Veri madenciliği Sihirbazı'nı tamamladıktan sonra araştırma yapısı değiştirmek için veri madenciliği Designer'ı kullanın ve modeller, model, doğruluğunu görmek için yapı ve model özelliklerini görüntülemek veya Öngörüler modeller kullanarak yapın.

Daha fazla bilgi için:Veri madenciliği Tasarımcısı

Veri madenciliği Sihirbazı'nı kullanma

Veri madenciliği Sihirbazı başlatmak için , yeni bir araştırma yapısı ekleme bir Analysis Services çözüm gezgini'ı kullanarak, proje veya Proje menu in Business Intelligence Development Studio.

veri madenciliği sihirbaz kaydedilip bağlı olarak iki dalı olan verilerinizi kaynak ilişkisel ya da bir küpteki:

  • Ilişkisel madenciliği modelleri

  • OLAP madenciliği modelleri

Not

Bir küp veya OLAP veritabanı veri madenciliği yapmanız gerekmez.OLAP boyutları veya OLAP toplamalardan veya bu hesaplamaların sonuçlarını benim istediğiniz veya verileriniz zaten bir küpteki depolandığı sürece, ilişkisel bir tablo veya veri kullanmanızı öneririz kaynak veri madenciliği için.

Ilişkisel madenciliği modelleri

Bir ilişkisel veri madenciliği modelinden oluşturduğunuz zaman kaynak içinde Analysis Services, ilk veri madenciliği sihirbazda varolan bir ilişkisel veritabanı modelinin yapısını tanımlamak için kullanmak istediğiniz belirttiğiniz. araştırma yapısı oluşturma seçeneğiniz de vardır veya araştırma yapısı ve bir ilişkili veri araştırma modeli.Oluşturmayı seçerseniz bir araştırma modeli, kullanmak istediğiniz veri madenciliği çözümlemesi türü için en uygun olan algoritması'nı seçerek veri madenciliği teknik belirtmeniz gerekir.

Daha fazla bilgi için:Veri madenciliği algoritmaları (Analysis Services - veri madenciliği)

Veri kaynağı görünüme ve tablo türlerini belirtme

Sihirbazın sonraki adımlar araştırma yapısı tanımlamak için ve belirtmek için kullanmak istediğiniz belirli bir veri kaynağı görünümü seçmek için olan bir durum tablo.durum tablo veri araştırma modeli eğitim ve isteğe bağlı olarak test için kullanılır.Ayrıca, iç içe geçmiş bir tablo belirtebilirsiniz.

durum Tablo seçme önemli bir karardır.durum tablo analiz etmek istediğiniz varlıkları içermelidir: Örneğin, müşteriler ve demografik bilgilerini. Iç içe geçmiş tablo, genellikle içinde varlıklardan hakkında ek bilgi içeren durum müşteri veya varlık ile çoğa bir ilişki olan öznitelikleri gerçekleşme hareketleri gibi tablo.Örneğin, iç içe geçmiş tablo s katılan Müşteriler durumda tablo her müşteriler veya bir listeyi hobileriniz, satın alınan ürünlerin listesini içerebilir.Daha fazla bilgi için:Tabloları iç içe geçmiş (Analysis Services - veri madenciliği)

Sütun kullanım belirtme

durum tablo ile iç içe geçmiş tablolar belirttiğinizde, kullanım türünü de içeren tablodaki her sütun için belirlediğiniz araştırma yapısı.Bir sütun için bir kullanım türü belirtmezseniz, sütun madenciliği yapısında eklenmeyecek.

Veri madenciliği sütunları dört türlerinden biri olabilir: anahtar, girişi, tahmin edilebilir veya girdi ve öngörülebilir bir birleşimi. Anahtar sütunlar, bir tablodaki her satır için benzersiz bir tanımlayıcı içerir.Olanlar gibi bazı madenciliği modelleri kümeleme sıralamasına dayanan veya seriler algoritmaları saat, birden çok anahtar sütun içerebilir.Bu birden çok anahtar bileşik anahtar ilişkisel bir fikir değildir, ancak bunun yerine saat serisi ve sırası çözümlemesi kümeleme desteği sağlamak üzere seçilmiş olması gerekir.Daha fazla bilgi için bkz: Microsoft saat Serisi algoritması veya Microsoft Dizi Kümeleme algoritmasısı.

Giriş sütunlar içinden Öngörüler yapılan bilgileri sağlar.Tahmin edilebilir olan sütunlar, tahmin çalıştığınızda bilgileri içeren araştırma modeli.

Örneğin, müşteri kimlikleri, nüfus bilgileri ve her müşteri belirli bir depolama geçirdiği para miktarını bir dizi tablo içerebilir.Müşteri KIMLIĞI müşterinin benzersiz olarak tanıtan ve büyük bir tablo, iç içe geçmiş tablolar için de ilişkili olduğu; bu nedenle, müşteri KIMLIĞI anahtar sütun olarak kullanırsınız.Giriş sütunlar ve her müşteri tahmin edilebilir sütun olarak geçirdiği para miktarını açıklayan bir sütun, nüfus bilgileri sütunlarından seçimi kullanabilirsiniz.Daha sonra oluşturmak bir araştırma modeli ne kadar para, bir müşteri bir depoda geçirdiği için demografisi ilişkilendirir.Bu model pazarlama hedeflenen için temel olarak kullanabilirsiniz.

veri madenciliği sihirbaz sağlar Öner öngörülebilir sütun seçtiğinizde etkin özelliği. Veri, sık oluşturmak gerekenden daha fazla sütun içeren bir araştırma modeli.The Suggest feature calculates a numeric score, from 0 to 1, that describes the relationship between each column in the dataset and the tahmin edilebilir sütun.Üzerinde bu Skor bağlı olarak, özellik çıkarma model için giriş olarak kullanılacak sütun önerir.Kullanıp kullanmadığımı Öner özelliği, önerilen sütunlarını gereksinimlerinize seçimleri değiştirmek veya öneriler yoksay.

Içerik ve veri türlerini belirtme

Bir veya daha fazla öngörülebilir bir sütun ve giriş sütunları seçtikten sonra her sütun için içerik ve veri türlerini belirtebilirsiniz.

Daha fazla bilgi için:Veri türleri (veri madenciliği), Içerik türleri (veri madenciliği)

Veri eğitimi ve kümeleri sınama halinde bölün.

Sihirbazı tamamlamadan önce son adım, verilerinizi, eğitim ve kümeleri sınama partition sağlamaktır.Sınama verilerin bir kısmını tutulacağı yeni önemlidir SQL Server 2008 ve, tutarlı bir sağlama için kullanımı kolay bir mekanizma sağlar küme sınamasına veri madenciliği yeni yapısını ile ilişkili tüm madenciliği modelleri ile kullanılabilir.

Kalan tüm eğitim için kullanılacak ve sınama için verilerin belirli bir yüzdesini kullanılması gerektiğini belirtebilirsiniz.Ayrıca, sınama için kullanmanız için bir servis talebi sayısını belirtebilirsiniz.Bölüm tanımını, araştırma yapısı, bu yapıyı temel alan yeni bir model oluşturmak için her veri sınama kümesi modeli doğruluğunu değerlendirme için kullanılabilir böylece depolanır.

Daha fazla bilgi için:Veri madenciliği modelleri doğrulanıyor (Analysis Services - veri madenciliği), Veri eğitimi ve kümeleri sınama bölümleme (Analysis Services - veri madenciliği)

Sihirbazı Tamamlanıyor

Sihirbazın son adımda, araştırma yapısı ve da ilişkili ad sağlamaktır araştırma modeli.Seçerseniz Ayrıntıya aracılığıyla izin verişlevselliği ile ayrıntıya modelde etkinleştirildi.Bu model oluşturmak için kullanılan kaynak verileri inceleyin uygun izinlere sahip kullanıcılar sağlar.

Daha fazla bilgi için:detaylandırma madenciliği modelleri ve madenciliği yapıları kullanarak (Analysis Services - veri madenciliği)

Başa Dön

OLAP madenciliği modelleri

Bir OLAP verileri bir çok boyutlu madenciliği modelinden oluşturduğunuz zaman kaynak içinde Analysis Services, ilk veri madenciliği sihirbazda var olan bir küp modelinin yapısını tanımlamak için kullanmak istediğiniz belirttiğiniz. Yalnızca araştırma yapısı oluşturma veya araştırma yapısı artı bir ilişkili veri araştırma modeli oluşturma seçeneğiniz de vardır.Oluşturmayı seçerseniz bir araştırma modeli, sorun iş için en uygun olan algoritması'nı seçerek kullanmak için veri madenciliği teknik belirtmeniz gerekir.

Daha fazla bilgi için:Veri madenciliği algoritmaları (Analysis Services - veri madenciliği)

Verileri belirtme kaynak ve durum anahtar

Sonra küpü boyut kullanılacak seçin kaynak araştırma yapısı tanımlamak için.Anahtar olarak kullanılacak bir öznitelik seçin sonra ya da büyük/küçük durum tuşu, of the araştırma modeli.

Not

Oluşturduğunuz OLAP araştırma modeli ve Kaynak küp model oluşturmak için kullandığınız aynı bulunmalıdır Analysis Services Veritabanı.

Durum düzey sütunlar ve sütun kullanımını belirtme

Bir durum anahtar seçtikten sonra öznitelikleri ve bu anahtar ilişkili önlemler sonraki ağaç görünümünde görüntülenen sayfa sihirbazın.Bu listeden yapısının sütun olarak kullanılacak ölçümleri ve öznitelikleri seçin.Bu sütun olarak bilinir durum düzey sütunlar.Ilişkisel modelde de nasıl her sütunun sonraki yapabileceğiniz yapısındaki kullanılması gerektiğini belirtmelisiniz gibi sayfa sihirbazın.Sütunları, anahtar, giriş, tahmin edilebilir, giriş ve tahmin edilebilir veya seçilmemiş olabilir.

Iç içe geçmiş tablolar ekleme

Veri madenciliği sihirbaz OLAP dalına araştırma modeli yapısına iç içe geçmiş tablolar eklemek için bu seçeneği içerir.Üzerinde Sütun kullanımı araştırma modeli belirtin. sayfa sihirbazın seçeneğini tıklatınIç içe geçmiş tablolar ekleme iç içe geçmiş tablolar eklemek için adım adım yol gösteren ayrı bir iletişim kutusu açmak için.Yalnızca bu boyut için geçerli olan ölçü grupları görüntülenir.Büyük boyut yabancı anahtar içeren ölçü grubu seçin.Ardından, her sütun için kullanım ölçü grubunda giriş veya öngörülebilir belirtin.Sihirbaz, iç içe geçmiş tablo sonra büyük/küçük durum tabloya ekler.Iç içe geçmiş tablo için varsayılan ad yuvalanmış boyut adı olsa da, iç içe geçmiş tablo ve sütunlarını yeniden adlandırabilirsiniz.Daha fazla bilgi için:Tabloları iç içe geçmiş (Analysis Services - veri madenciliği)

Içerik ve veri türlerini belirtme

Bir veya daha fazla öngörülebilir bir sütun ve giriş sütunları seçtikten sonra her sütun için içerik ve veri türlerini belirtebilirsiniz.

Daha fazla bilgi için:Veri türleri (veri madenciliği), Içerik türleri (veri madenciliği)

Kaynak küp dilimleme

Sihirbaz OLAP dalında sınırlayabilirsiniz kapsam araştırma modeli alıştırması önce kaynak küp dilimleme tarafından madenciliği modelinizin.Küp dilimleme eklemek için benzer bir WHERE bir SQL deyim için yan tümce. Örneğin, bir küp, ürün satın hakkında bilgi içeriyorsa, 30'dan fazla öznitelik yaş, cinsiyet sütun için yalnızca kadın ve bir satınalma tarih Mart 2000'den önceki yok sınırlayabilir.Biçimde, model, 30 yıl eski kim ve Mart 2000 sonrasındaki bir ürün satın kullanan bir kadın kapsamını kaplayacak şekilde sınırlandırabilirsiniz.

Veri eğitimi ve kümeleri sınama halinde bölün.

Sihirbazı tamamlamak için önce son adım, eğitim ve kümeleri sınama küpten kullanılabilir veri bölümü sağlamaktır.Bölüm tanımını, araştırma yapısı, bu yapıyı temel alan yeni bir model oluşturmak için her veri sınama kümesi modeli doğruluğunu değerlendirme için kullanılabilir böylece depolanır.

Daha fazla bilgi için:Veri madenciliği modelleri doğrulanıyor (Analysis Services - veri madenciliği), Veri eğitimi ve kümeleri sınama bölümleme (Analysis Services - veri madenciliği)

Sihirbazı Tamamlanıyor

Sihirbazın son adımda, araştırma yapısı ve da ilişkili ad sağlamaktır araştırma modeli.Seçerseniz Ayrıntıya aracılığıyla izin verişlevselliği ile ayrıntıya modelde etkinleştirildi.Bu model oluşturmak için kullanılan kaynak verileri inceleyin uygun izinlere sahip kullanıcılar sağlar.kaynak küp temel alan yeni bir boyut eklemek isteyip istemediğinizi de belirtebilirsiniz araştırma modeli, veya yeni bir küp oluşturmak araştırma modeli.

Daha fazla bilgi için:detaylandırma madenciliği modelleri ve madenciliği yapıları kullanarak (Analysis Services - veri madenciliği)

Başa Dön