Aracılığıyla paylaş


Microsoft Dizi Kümeleme algoritmasısı

The Microsoft Sequence Clustering algorithm is a sequence analysis algorithm provided by Microsoft SQL Server Analysis Services.Bu algoritma, aşağıdaki yolları tarafından bağlanmış olaylar içeren bir veri araştırmak için kullanabilirsiniz veya sıraları.Algoritma, aynı gruplandırma veya kümeleme, veri serilerinin tarafından yaygın olan sıraları bulur.Serileri bazı örnekler şunlardır:

  • Kullanıcıların gezinmek veya bir Web sitesine oluşturan tıklatın yollarını açıklayan veriler.

  • Veri, bir müşteri maddeleri bir alışveriş arabası adresindeki çevrimiçi bir satıcıya ekler sırasını açıklar.

Bu algoritma için birçok yolla benzer Microsoft Kümeleme algoritması. Ancak, benzer özniteliklere, içeren servis talepleri kümeleri bulma Microsoft Sıra kümeleme algoritması, bir sıra benzer yolları içeren servis talepleri kümeleri bulur.

Örnek

AdventureWorks Web sitesi, hangi sayfaları ziyaret siparişle ilgili ve hangi sayfaları, kullanıcıların ziyaret site hakkında bilgi toplar.Çevrimiçi sipariş şirket sağladığı için müşterilerin siteye oturum gerekir.Bu bilgi için her müşteri profili şirketle tıklatın sağlar.Kullanarak Microsoft Bu veriler kümeleme algoritmasına sırası, şirket, gruplar veya benzer bir desen veya tıklatma dizisi yüklemiş olan müşterilerin kümelerini bulabilirsiniz. Şirketin belirli bir ürünün satışı hangi sayfaların en yakın ilgili tanımlamak ve olasılıkla sonraki ziyaret sayfalarıdır tahmin etmek için kullanıcıların, Web sitesi nasıl hareket çözümlemek için bu kümeler daha sonra kullanabilirsiniz.

Karma algoritması'nasıl çalışır?

The Microsoft Sequence kümeleme algorithm is a hybrid algorithm that combines kümeleme techniques with Markov chain analysis to identify clusters and their sequences. Hallmarks birini Microsoft Sıra kümeleme algoritması sırası veri kullanmasıdır. Bu veriler bir dizi ürün Satınalmalar veya belirli bir kullanıcı için Web tıklatır gibi durumlarda, bir veri kümesi arasında geçişler veya olayları bir dizi genellikle temsil eder.Algoritma tüm geçiş olasılıklar inceler ve farklar ölçer veya dataset, hangi sıralarını belirlemek için tüm olası serilerinde arasında mesafeler, kümeleme için giriş kullanılacak en iyi değil.Algoritma aday listesi serilerini oluşturduktan sonra sırası bilgi giriş olarak EM yöntem için kullandığı kümeleme.

Uygulama ayrıntılı bir açıklaması için bkz: Microsoft Teknik Başvurusu algoritması kümeleme sırası.

Modeller kümeleme sırası için gerekli veri

Veri modeli kümeleme bir sıra eğitim amacıyla hazırladığınızda ne kadar veri gereklidir ve verileri nasıl kullanıldığı gibi belirli algoritması, gereksinimlerini anlamalısınız.

Model kümeleme bir sıra için gerekenler şunlardır:

  • Tek bir key sütun   Model kümeleme BIR sıra kayıtları tanımlayan bir anahtar gerektirir.

  • Sütun sırası   Sıra verileri için bir sıra KIMLIK sütunu olan bir iç içe geçmiş tablo model olması gerekir.Herhangi bir sıralanabilir veri türleri, sıra KIMLIĞI olabilir.Örneğin, sütun sırası olayları tanımlayan sürece bir Web sayfa tanıtıcısı, bir tamsayı ya da bir metin dizesi kullanabilirsiniz.Yalnızca bir sıra tanıtıcısı, her sıra için izin verilen ve yalnızca bir sıra türü, her modelinde izin verilmez.

  • Isteğe bağlı olmayan sıra öznitelikleri    Algoritma ve buna ek olarak sıralaması için ilgili diğer öznitelikleri destekler.Bu öznitelikler, iç içe geçmiş sütunlar içerebilirsiniz.

Örneğin, önceki AdventureWorks Web sitesi bildirilmiş örnekte, modeli kümeleme bir sıra büyük/küçük durum tablosu, ilgili olmayan sıra öznitelikleri gibi her sipariş için belirli bir müşteri demografisi ve müşteri sitesine göz veya içine bir alışveriş arabası sıralama bilgileri gibi öğeleri yerleştirmek sırasını içeren iç içe geçmiş bir tablo sipariş bilgileri içerebilir.

Içerik türleri ve modelleri kümeleme sırası için desteklenen veri türleri hakkında daha ayrıntılı bilgi için gereksinimler bölümüne bakın. Microsoft Teknik Başvurusu algoritması kümeleme sırası.

Model kümeleme bir sıra görüntüleme

Bu algoritma için oluşturduğu araştırma modeli verilerdeki en yaygın olan sıraları içerir.Model keşfetmek için Microsoft, sıra küme Görüntüleyicisi.Model, kümeleme bir sıra görüntülediğinizde Analysis Services birden çok geçişler içeren kümeleri gösterir. Ayrıca, ilgili istatistikleri görüntüleyebilirsiniz.Daha fazla bilgi için bkz:Görüntüleme bir araştırma modeli Microsoft sıra küme Görüntüleyici ile.

Daha fazla ayrıntı öğrenmek isterseniz, modelde göz atabiliyor Microsoft Genel içerik ağacı Görüntüleyicisi.Içerik modeli için depolanan dağıtım için her düğümde bulunan tüm değerler, her küme ve geçişleri ayrıntılarını olasılığını içerir.Daha fazla bilgi için bkz:araştırma modeli Sırası modeller kümeleme için içerik (Analysis Services - veri madenciliği).

Öngörüler oluşturma

Model eğitilmiş sonra sonuçlar kümesi desenler olarak depolanır.Yeni bir sıra, büyük olasılıkla bir sonraki adıma tahmin etmek için verilerde en yaygın sıralarının açıklamaları kullanabilirsiniz.Algoritma, diğer sütunları içerdiğinden, sıralı veri ve sıralı erişim olmayan girişler arasındaki ilişkileri belirlemek için elde edilen modelini kullanabilirsiniz.Örneğin, model için demografik veriler eklerseniz, belirli müşteri grupları için Öngörüler yapabilirsiniz.Tahmin sorgularını Öngörüler değişken bir dizi döndürür veya tanımlayıcı istatistik dönmek için özelleştirilebilir.

Bir veri araştırma modeli sorgular oluşturma hakkında daha fazla bilgi için bkz: Veri madenciliği modelleri sorgulama (Analysis Services - veri madenciliği). Model kümeleme, bir sıra ile sorgular kullanma örnekleri için bkz: Model kümeleme bir sıra sorgulama (Analysis Services - veri madenciliği).

Açıklamalar

  • Öngörü modeli biçimlendirme dili (madenciliği modelleri oluşturmak için PMML) kullanımını desteklemez.

  • detaylandırma destekler.

  • OLAP madenciliği modelleri kullanımını ve veri madenciliği boyutları oluşturulmasını destekler.