Aracılığıyla paylaş


Microsoft kümeleme algoritması

The Microsoft kümeleme algorithm is a segmentlere ayırma algorithm provided by SQL Server 2008 Analysis Services (SSAS). Algoritma, benzer özelliklere sahip bir küme bir dataset içinde grup servis taleplerine yinelemeli bir teknik kullanır.Bu gruplandırmalar, veri araştırma anomalies veri tanımlama ve Öngörüler oluşturmak için yararlıdır.

Küme modelleri, mantıksal olarak rasgele bir gözlem türetmek olmayan bir dataset ilişkiler tanımlayın.Örneğin, mantıksal olarak tarafından bisiklet için işlerini commute kişiler genellikle nerede çalıştıklarını gelen şehirlerarası live değil, discern.Algoritma, ancak ilgili olarak açık olan bisiklet commuters diğer özelliklerini de bulabilirsiniz.Aşağıdaki çizimde, Küme B çalışmamasına bisiklet Sürün eğilimindedir kişiler hakkındaki verileri temsil eden, çalışmaya sürücü eğilimindedir kişiler hakkında BIR temsil veri küme.

Cluster pattern of commuter tendencies

Kümeleme algoritması diğer veri madenciliği algoritmaları gibi farklı Microsoft Bir küme modeli oluşturmak için tahmin edilebilir sütun tanımlamak zorunda değilsiniz, bu ağaçlar algoritmasını karar. Kümeleme algoritması kesinlikle verileri varolan ilişkileri ve algoritmayı tanımlayan bir küme modeli eğitir.

Örnek

Bir gruba kimin benzer demografik bilgi paylaşmak ve kimin benzer ürünleri satın dikkate Adventure Works Şirket. Bu grup, bir veri kümesinin temsil eder.Bu tür kümeler, veritabanında var olabilir.Bir küme sütunların gözleme tarafından daha açıkça nasıl, birbiriyle ilişkili bir veri kayıtlarında görebilirsiniz.

Karma algoritması'nasıl çalışır?

The Microsoft kümeleme algorithm first identifies relationships in a dataset and generates a series of clusters based on those relationships. Bir dağılım çizim nasıl algoritması, verileri gruplandıran aşağıdaki çizimde gösterildiği gibi görsel olarak göstermek için kullanışlı bir yoldur.Dağılım çizdirmek için tüm durum s veri kümesi ve her temsil durum grafikte noktasıdır.Kümeleri, grafikte noktaları Grup ve algoritma tanımlayan ilişkiler görülmektedir.

Scatter plot of cases in a dataset

Algoritma ilk kümelerini tanımlayan sonra ne kadar iyi kümeleri gruplandırmalar noktalarını temsil eden hesaplar ve daha iyi verileri temsil eden küme oluşturmak için bu gruplandırmalar yeniden dener.Algoritma, bu sonuçlar daha kümelerini yeniden tanımlama tarafından artırmak edemiyor kadar bu işlem boyunca sırayla dolaşır.

Algoritma belirten bir bir teknik kümeleme, küme en fazla sayısını sınırlama veya bir küme oluşturmak için gerekli desteği miktarını değiştirme'yi seçerek çalışma biçimini özelleştirebilirsiniz.Daha fazla bilgi için bkz:Microsoft kümeleme algoritması teknik başvurusu.

Veri kümeleme modeller için gerekli.

Ne zaman, veri eğitim kullanımda hazırlıklı bir kümeleme modeli, ne kadar veri gereklidir ve verileri nasıl kullanıldığı gibi belirli algoritması, gereksinimlerini anlamalısınız.

Gereksinimlerini bir kümeleme model şunlardır:

  • Tek bir key sütun   Her model, her kaydı benzersiz olarak tanımlayan bir sayı veya metin sütun içermelidir.Bileşik anahtar izin verilmez.

  • Giriş bir sütun   Her model kümeleri oluşturmak için kullanılan değerleri içeren giriş en az bir sütun içermelidir.Çoğu sütunları istediğiniz, ancak her bir sütundaki değerleri sayısına bağlı olarak, ek sütunlarının eklenmesi artırabilirsiniz giriş olarak olabilir saat modeli alıştırması sürer.

  • Isteğe bağlı olarak tahmin edilebilir sütun   Algoritma öngörülebilir bir sütun, model oluşturmak için gerekli değildir, ancak neredeyse herhangi bir veri türünün öngörülebilir bir sütun ekleyebilirsiniz.Öngörülebilir sütun değerleri için giriş olarak kabul kümeleme modelini veya tahmin yalnızca kullanılması gerektiğini belirtebilirsiniz.Örneğin, yaş ya da bölge demografisi kümeleme tarafından müşteri geliri tahmin etmek istiyorsanız, gelir olarak belirtirsiniz PredictOnly ve tüm diğer sütunları, bölge veya geçerlilik süresi, girdi ekleyin.

Içerik türü ve modeli kümeleme için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimler bölümüne bakın. Microsoft kümeleme algoritması teknik başvurusu.

kümeleme Modeli görüntüleme

Model keşfetmek için Microsoft Cluster Görüntüleyicisi.Bir küme modeli görüntülediğinizde Analysis Services kümeleri arasındaki ilişkileri gösterir ve ayrıntılı bir profil her kümenin diğer her kümeden ayırt özniteliklerin listesini ve tüm eğitim veri özelliklerini sağlar Diyagram kümeleri gösterir küme. Daha fazla bilgi için bkz:Görüntüleme bir araştırma modeli Microsoft Cluster Görüntüleyici ile.

Daha fazla ayrıntı öğrenmek isterseniz, modelde göz atabiliyor Microsoft Genel içerik ağacı Görüntüleyicisi.Içerik modeli için depolanan dağıtım için her düğümde bulunan tüm değerler, her küme ve diğer bilgileri olasılığını içerir.Daha fazla bilgi için bkz:araştırma modeli Modeller kümeleme için içerik (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Model eğitilmiş sonra sonuçlar incelemek veya Öngörüler yapmak için kullanın ve desenler kümesi olarak depolanır.

Yeni veriler, bulunmuş kümeleri mi uyguladığı konusunda Öngörüler geri dönmek veya kümeleri hakkında açıklayıcı istatistikler elde etmek için bir sorgu oluşturabilirsiniz.

Bir veri araştırma modeli sorgular oluşturma hakkında daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği). Bir küme modeli sorguları kullanma örnekleri için bkz: kümeleme Modeli sorgulama (Analysis Services - veri madenciliği).

Açıklamalar

  • Öngörü modeli biçimlendirme dili (madenciliği modelleri oluşturmak için PMML) kullanılmasını destekler.

  • detaylandırma destekler.

  • OLAP madenciliği modelleri kullanımını ve veri madenciliği boyutları oluşturulmasını destekler.