Microsoft doğrusal regresyon algoritması teknik başvurusu
The Microsoft Linear regresyon algorithm is a special sürüm of the Microsoft Decision Trees algorithm that is optimized for modeling pairs of continuous attributes. Bu konu algoritma uygulaması açıklıyor algoritma davranışını özelleştiren açıklar ve modelleri sorgulama hakkında ek bilgilere bağlantılar sağlar.
Doğrusal regresyon algoritma uygulaması
Karar ağaçları Microsoft algoritması, pek çok görevi için kullanılabilir: doğrusal regresyon, sınıflandırma ya da ilişkiyi çözümlemesi. Bu algoritma doğrusal regresyon amacı gerçekleştirmek için , büyüme ağacının kısıtlayın ve tüm verileri tek bir düğüm modelinde tutmasına algoritması parametrelerinin denetlenir.Diğer bir deyişle, doğrusal regresyon dayalı bir karar ağacı rağmen konsol ağacında tek bir kök ve hiçbir dalları içerir: tüm veri, kök düğümü bulunur.
Bu algoritma 's gerçekleştirmek için MINIMUM_LEAF_CASES parametre algoritma araştırma modeli eğitmek için kullandığı durumlarda toplam sayısına eşit veya sıfırdan büyük küme. Bu şekilde ayarlanması parametresi, algoritma hiçbir zaman bir bölünme oluşturmak ve bu nedenle, bir doğrusal regresyon uygular.
Regresyon çizgisinin gösteren Denklem genel biçimi alır... y = ax + bve regresyon denklemi bilinir.Değişken y çıkış değişkeni, temsil eder.x ve giriş değişkeni temsil eder.C and b ayarlanabilir katsayıları şunlardır.Tamamlanan araştırma modeli sorgulayarak katsayıları intercepts ve regresyon formülün hakkındaki diğer bilgileri alabilirsiniz.Daha fazla bilgi için bkz:Bir doğrusal regresyon modeli sorgulama (Analysis Services - veri madenciliği).
Skor yöntemleri ve özellik seçimi
Tüm Analysis Services veri madenciliği algoritmaları, çözümleme geliştirmek ve işleme yükü azaltmak için özellik seçimi otomatik olarak kullanır. Doğrusal regresyon özellik seçimi için kullanılan yöntem interestingness skor, yalnızca model desteklediğinden sürekli sütunları destekler.Başvuru, aşağıdaki tablo doğrusal regresyon algoritma ve karar ağaçları algoritması için özellik seçimi arasındaki fark gösterilir.
Algoritma |
Analiz yöntem |
Açıklamalar |
---|---|---|
Doğrusal regresyon |
Interestingness Skoru |
Varsayılan. Karar ağaçları algoritması ile kullanılabilen diğer özellik seçim yöntemlerini discrete değişkenleri için geçerlidir ve bu nedenle doğrusal regresyon modelleri için uygun değildir. |
Karar ağaçları |
Interestingness Skoru Shannon'ın Entropisi Bayesian K2 önceki ile Bayesian Dirichlet ile Tekdüzen önceki (varsayılan) |
Herhangi bir sütun, ikili olmayan sürekli bir değer içermiyorsa, interestingness skor için tüm sütunları, tutarlılığı sağlamak için kullanılır.Aksi halde varsayılan veya belirtilen yöntem kullanılır. |
Karar ağaçları model için özellik seçimi denetleyen algoritma parametreleri MAXIMUM_INPUT_ATTRIBUTES ve MAXIMUM_OUTPUT ' dir.
Doğrusal regresyon algoritması'nı özelleştirme
The Microsoft Linear regresyon algorithm supports parameters that affect the behavior, performance, and accuracy of the resulting araştırma modeli. Ayrıca küme bayraklarını araştırma modeli sütunlarda modelleme veya verilerin işlenme biçimini denetlemek için yapı sütunları mining.
Algoritma parametreleri ayarlama
Aşağıdaki tabloda parametreleri için sağlanan listeler Microsoft Doğrusal regresyon algoritması.
Parameter |
Açıklama |
---|---|
MAXIMUM_INPUT_ATTRIBUTES |
Algoritma işleyebileceği giriş özniteliklerini tanımlayan önce bu özellik seçimi çağırır.küme Bu özellik seçimi devre dışı bırakmak için 0 değeri. Varsayılan değer 255'dir. |
MAXIMUM_OUTPUT_ATTRIBUTES |
Algoritma işleyebileceği bir çıkış özniteliklerini tanımlayan önce bu özellik seçimi çağırır.küme Bu özellik seçimi devre dışı bırakmak için 0 değeri. Varsayılan değer 255'dir. |
FORCED_REGRESSOR |
Belirtilen sütun olarak algoritması tarafından hesaplanan sütun önemi ne olursa olsun, regressors olarak kullanılacak algoritma zorlar. |
Flags model oluşturma
The Microsoft Linear regresyon algorithm supports the following modeling flags. araştırma yapısı veya araştırma modeli oluşturduğunuzda, modelleme bayraklarını belirtmek için tanımladığınız nasıl değerleri her sütun çözümlemesi sırasında işlenir.Daha fazla bilgi için bkz:Flags (veri madenciliği) model oluşturma.
Bayrak model oluşturma |
Açıklama |
---|---|
null DEĞİL |
Sütun null içeremez gösterir.Analysis Services null karşılaşırsa modeli eğitim sırasında bir hata neden olur. araştırma yapısı sütunlar için geçerlidir. |
regresör |
sütun çözümleme sırasında olası bir bağımsız değişken kabul sürekli sayısal değerler içerdiğini gösterir.
Note:
Sütunu son modelinde bir regresör olarak kullanılacak bir sütun olarak bir regresör bayrak atama garantilemez.
araştırma modeli sütunlar için geçerlidir. |
Regressors, doğrusal regresyon modeller
Doğrusal regresyon modeli esas alan Microsoft Karar ağaçları algoritması. Ancak, kullanmadığınız bile Microsoft Bir ağaç veya sürekli öznitelik bulunan bir gerileme temsil eden bir düğüm, doğrusal regresyon algoritması, herhangi bir karar ağacı model içerebilir.
Sürekli bir sütun, bir regresör gösteren belirtmeniz gerekmez.The Microsoft Decision Trees algorithm will partition the dataset into regions with meaningful patterns even if you do not küme the regresör flag on the sütun. Fark olan zaman, küme modelleme bayrak, regresyon denklemi formunun bulmak algoritmayı deneyecek bir * C1 + b * C2 +... desenleri ağacının düğümlerin sığdırmak için.Kalan toplamı olarak hesaplanır ve çok iyi bir sapma ise, konsol ağacında bir bölünme zorlanır.
Örneğin, müşterinin satın alma davranışı kullanarak tahmin Geliri olarak, öznitelik ve küme bayrak sütun modelleme regresör, karma algoritması ilk sığacak şekilde deneyinGeliri değerleri standart regresyon formül kullanarak.Sapma çok büyük ise, regresyon formülün durdurulmuş ve diğer bir özniteliğine göre ağacı bölünmesi.Karar ağacında algoritması bir regresör gelir için her dalları sonra bölme sığdırmak daha sonra deneyin.
Algoritma belirli bir regresör kullanmanızı güvence altına almak için FORCED_REGRESSOR parametresini kullanabilirsiniz.Bu parametre, Microsoft karar ağaçları ve Microsoft doğrusal regresyon algoritmalarıyla kullanılabilir.
Gereksinimler
Bir doğrusal regresyon modelini bir anahtar sütunu, giriş sütunları ve tahmin edilebilir olan en az bir sütun içermelidir.
Girdi ve öngörülebilir bir sütun
The Microsoft Linear regresyon algorithm supports the specific input columns and predictable columns that are listed in the following tablo. Içerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: Içerik türleri (veri madenciliği).
Sütun |
Içerik türleri |
---|---|
Giriş bir öznitelik |
Sürekli, Döngüsel, anahtar, tablo ve sipariş |
Öngörülebilir bir öznitelik |
Sürekli döngüsel ve Siparişli |
Not
Cyclical ve Ordered içerik türleri desteklenir, ancak algoritma bunları gibi farklı değerleri kabul eder ve özel bir işlem gerçekleştirmez.