Aracılığıyla paylaş


Microsoft doğrusal regresyon algoritması teknik başvurusu

The Microsoft Linear regresyon algorithm is a special sürüm of the Microsoft Decision Trees algorithm that is optimized for modeling pairs of continuous attributes. Bu konu algoritma uygulaması açıklıyor algoritma davranışını özelleştiren açıklar ve modelleri sorgulama hakkında ek bilgilere bağlantılar sağlar.

Doğrusal regresyon algoritma uygulaması

Karar ağaçları Microsoft algoritması, pek çok görevi için kullanılabilir: doğrusal regresyon, sınıflandırma ya da ilişkiyi çözümlemesi. Bu algoritma doğrusal regresyon amacı gerçekleştirmek için , büyüme ağacının kısıtlayın ve tüm verileri tek bir düğüm modelinde tutmasına algoritması parametrelerinin denetlenir.Diğer bir deyişle, doğrusal regresyon dayalı bir karar ağacı rağmen konsol ağacında tek bir kök ve hiçbir dalları içerir: tüm veri, kök düğümü bulunur.

Bu algoritma 's gerçekleştirmek için MINIMUM_LEAF_CASES parametre algoritma araştırma modeli eğitmek için kullandığı durumlarda toplam sayısına eşit veya sıfırdan büyük küme. Bu şekilde ayarlanması parametresi, algoritma hiçbir zaman bir bölünme oluşturmak ve bu nedenle, bir doğrusal regresyon uygular.

Regresyon çizgisinin gösteren Denklem genel biçimi alır... y = ax + bve regresyon denklemi bilinir.Değişken y çıkış değişkeni, temsil eder.x ve giriş değişkeni temsil eder.C and b ayarlanabilir katsayıları şunlardır.Tamamlanan araştırma modeli sorgulayarak katsayıları intercepts ve regresyon formülün hakkındaki diğer bilgileri alabilirsiniz.Daha fazla bilgi için bkz:Bir doğrusal regresyon modeli sorgulama (Analysis Services - veri madenciliği).

Skor yöntemleri ve özellik seçimi

Tüm Analysis Services veri madenciliği algoritmaları, çözümleme geliştirmek ve işleme yükü azaltmak için özellik seçimi otomatik olarak kullanır. Doğrusal regresyon özellik seçimi için kullanılan yöntem interestingness skor, yalnızca model desteklediğinden sürekli sütunları destekler.Başvuru, aşağıdaki tablo doğrusal regresyon algoritma ve karar ağaçları algoritması için özellik seçimi arasındaki fark gösterilir.

Algoritma

Analiz yöntem

Açıklamalar

Doğrusal regresyon

Interestingness Skoru

Varsayılan.

Karar ağaçları algoritması ile kullanılabilen diğer özellik seçim yöntemlerini discrete değişkenleri için geçerlidir ve bu nedenle doğrusal regresyon modelleri için uygun değildir.

Karar ağaçları

Interestingness Skoru

Shannon'ın Entropisi

Bayesian K2 önceki ile

Bayesian Dirichlet ile Tekdüzen önceki (varsayılan)

Herhangi bir sütun, ikili olmayan sürekli bir değer içermiyorsa, interestingness skor için tüm sütunları, tutarlılığı sağlamak için kullanılır.Aksi halde varsayılan veya belirtilen yöntem kullanılır.

Karar ağaçları model için özellik seçimi denetleyen algoritma parametreleri MAXIMUM_INPUT_ATTRIBUTES ve MAXIMUM_OUTPUT ' dir.

Doğrusal regresyon algoritması'nı özelleştirme

The Microsoft Linear regresyon algorithm supports parameters that affect the behavior, performance, and accuracy of the resulting araştırma modeli. Ayrıca küme bayraklarını araştırma modeli sütunlarda modelleme veya verilerin işlenme biçimini denetlemek için yapı sütunları mining.

Algoritma parametreleri ayarlama

Aşağıdaki tabloda parametreleri için sağlanan listeler Microsoft Doğrusal regresyon algoritması.

Parameter

Açıklama

MAXIMUM_INPUT_ATTRIBUTES

Algoritma işleyebileceği giriş özniteliklerini tanımlayan önce bu özellik seçimi çağırır.küme Bu özellik seçimi devre dışı bırakmak için 0 değeri.

Varsayılan değer 255'dir.

MAXIMUM_OUTPUT_ATTRIBUTES

Algoritma işleyebileceği bir çıkış özniteliklerini tanımlayan önce bu özellik seçimi çağırır.küme Bu özellik seçimi devre dışı bırakmak için 0 değeri.

Varsayılan değer 255'dir.

FORCED_REGRESSOR

Belirtilen sütun olarak algoritması tarafından hesaplanan sütun önemi ne olursa olsun, regressors olarak kullanılacak algoritma zorlar.

Flags model oluşturma

The Microsoft Linear regresyon algorithm supports the following modeling flags. araştırma yapısı veya araştırma modeli oluşturduğunuzda, modelleme bayraklarını belirtmek için tanımladığınız nasıl değerleri her sütun çözümlemesi sırasında işlenir.Daha fazla bilgi için bkz:Flags (veri madenciliği) model oluşturma.

Bayrak model oluşturma

Açıklama

null DEĞİL

Sütun null içeremez gösterir.Analysis Services null karşılaşırsa modeli eğitim sırasında bir hata neden olur.

araştırma yapısı sütunlar için geçerlidir.

regresör

sütun çözümleme sırasında olası bir bağımsız değişken kabul sürekli sayısal değerler içerdiğini gösterir.

NoteNote:
Sütunu son modelinde bir regresör olarak kullanılacak bir sütun olarak bir regresör bayrak atama garantilemez.

araştırma modeli sütunlar için geçerlidir.

Regressors, doğrusal regresyon modeller

Doğrusal regresyon modeli esas alan Microsoft Karar ağaçları algoritması. Ancak, kullanmadığınız bile Microsoft Bir ağaç veya sürekli öznitelik bulunan bir gerileme temsil eden bir düğüm, doğrusal regresyon algoritması, herhangi bir karar ağacı model içerebilir.

Sürekli bir sütun, bir regresör gösteren belirtmeniz gerekmez.The Microsoft Decision Trees algorithm will partition the dataset into regions with meaningful patterns even if you do not küme the regresör flag on the sütun. Fark olan zaman, küme modelleme bayrak, regresyon denklemi formunun bulmak algoritmayı deneyecek bir * C1 + b * C2 +... desenleri ağacının düğümlerin sığdırmak için.Kalan toplamı olarak hesaplanır ve çok iyi bir sapma ise, konsol ağacında bir bölünme zorlanır.

Örneğin, müşterinin satın alma davranışı kullanarak tahmin Geliri olarak, öznitelik ve küme bayrak sütun modelleme regresör, karma algoritması ilk sığacak şekilde deneyinGeliri değerleri standart regresyon formül kullanarak.Sapma çok büyük ise, regresyon formülün durdurulmuş ve diğer bir özniteliğine göre ağacı bölünmesi.Karar ağacında algoritması bir regresör gelir için her dalları sonra bölme sığdırmak daha sonra deneyin.

Algoritma belirli bir regresör kullanmanızı güvence altına almak için FORCED_REGRESSOR parametresini kullanabilirsiniz.Bu parametre, Microsoft karar ağaçları ve Microsoft doğrusal regresyon algoritmalarıyla kullanılabilir.

Gereksinimler

Bir doğrusal regresyon modelini bir anahtar sütunu, giriş sütunları ve tahmin edilebilir olan en az bir sütun içermelidir.

Girdi ve öngörülebilir bir sütun

The Microsoft Linear regresyon algorithm supports the specific input columns and predictable columns that are listed in the following tablo. Içerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: Içerik türleri (veri madenciliği).

Sütun

Içerik türleri

Giriş bir öznitelik

Sürekli, Döngüsel, anahtar, tablo ve sipariş

Öngörülebilir bir öznitelik

Sürekli döngüsel ve Siparişli

Not

Cyclical ve Ordered içerik türleri desteklenir, ancak algoritma bunları gibi farklı değerleri kabul eder ve özel bir işlem gerçekleştirmez.