Aracılığıyla paylaş


Doğrusal Regresyon bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

İşlem hattında kullanmak üzere doğrusal regresyon modeli oluşturmak için bu bileşeni kullanın. Doğrusal regresyon, bir veya daha fazla bağımsız değişken ile sayısal sonuç veya bağımlı değişken arasında doğrusal bir ilişki kurmaya çalışır.

Doğrusal regresyon yöntemi tanımlamak ve etiketli bir veri kümesi kullanarak modeli eğitmek için bu bileşeni kullanırsınız. Daha sonra eğitilen model tahminlerde bulunmak için kullanılabilir.

Doğrusal regresyon hakkında

Doğrusal regresyon, makine öğrenmesinde benimsenen ve hattı sığdırmak ve hatayı ölçmek için birçok yeni yöntemle geliştirilmiş yaygın bir istatistiksel yöntemdir. Basitçe ifade etmek gerekirse, regresyon sayısal bir hedefin tahminini ifade eder. Basit bir tahmine dayalı görev için basit bir model istediğinizde doğrusal regresyon hala iyi bir seçimdir. Doğrusal regresyon, karmaşıklığı olmayan yüksek boyutlu, seyrek veri kümelerinde de iyi çalışma eğilimindedir.

Azure Machine Learning, doğrusal regresyona ek olarak çeşitli regresyon modellerini destekler. Bununla birlikte, "regresyon" terimi gevşek bir şekilde yorumlanabilir ve diğer araçlarda sağlanan bazı regresyon türleri desteklenmez.

  • Klasik regresyon sorunu tek bir bağımsız değişken ve bağımlı bir değişken içerir. Buna basit regresyon denir. Bu bileşen basit regresyonu destekler.

  • Birden çok doğrusal regresyon , tek bir bağımlı değişkene katkıda bulunabilecek iki veya daha fazla bağımsız değişken içerir. Tek bir sayısal sonucu tahmin etmek için birden çok girişin kullanıldığı sorunlar, çok değişkenli doğrusal regresyon olarak da adlandırılır.

    Doğrusal Regresyon bileşeni, diğer regresyon bileşenlerinin çoğu gibi bu sorunları çözebilir.

  • Çok etiketli regresyon , tek bir modelde birden çok bağımlı değişkeni tahmin etme görevidir. Örneğin, çok etiketli lojistik regresyonda bir örnek birden çok farklı etikete atanabilir. (Bu, tek bir sınıf değişkeni içinde birden çok düzeyi tahmin etme görevinden farklıdır.)

    Bu tür bir regresyon Azure Machine Learning'de desteklenmez. Birden çok değişkeni tahmin etmek için tahmin etmek istediğiniz her çıkış için ayrı bir öğrenci oluşturun.

İstatistikçiler yıllardır regresyon için giderek daha gelişmiş yöntemler geliştirmektedir. Bu, doğrusal regresyon için bile geçerlidir. Bu bileşen, hatayı ölçmek ve regresyon çizgisine uydurmak için iki yöntemi destekler: sıradan en küçük kareler yöntemi ve gradyan azalma.

  • Gradyan azalma , model eğitim sürecinin her adımındaki hata miktarını en aza indiren bir yöntemdir. Gradyan azalmayla ilgili birçok çeşitleme vardır ve çeşitli öğrenme sorunları için iyileştirme çalışmaları kapsamlı bir şekilde yapılmıştır. Çözüm yöntemi için bu seçeneği belirlerseniz, adım boyutunu, öğrenme oranını vb. denetlemek için çeşitli parametreler ayarlayabilirsiniz. Bu seçenek, tümleşik parametre süpürme kullanımını da destekler.

  • Normal en küçük kareler , doğrusal regresyonda en yaygın kullanılan tekniklerden biridir. Örneğin en küçük kareler, Microsoft Excel için Çözümleme Araç Takımı'nda kullanılan yöntemdir.

    Normal en küçük kareler, gerçek değerden tahmin edilen çizgiye kadar olan uzaklık karesinin toplamı olarak hatayı hesaplayan ve kare hatasını en aza indirerek modele uyan kayıp işlevini ifade eder. Bu yöntem, girişler ve bağımlı değişken arasında güçlü bir doğrusal ilişki olduğunu varsayar.

Doğrusal Regresyonu Yapılandırma

Bu bileşen, regresyon modelini uydurmak için farklı seçeneklerle iki yöntemi destekler:

Normal en küçük kareleri kullanarak regresyon modeli oluşturma

  1. Doğrusal Regresyon Modeli bileşenini tasarımcıdaki işlem hattınıza ekleyin.

    Bu bileşeni Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'ı genişletin ve doğrusal regresyon modeli bileşenini işlem hattınıza sürükleyin.

  2. Özellikler bölmesindeki Çözüm yöntemi açılan listesinde Sıradan En Küçük Kareler'i seçin. Bu seçenek regresyon satırını bulmak için kullanılan hesaplama yöntemini belirtir.

  3. L2 normalleştirme ağırlığı alanında, L2 normalleştirmesi için ağırlık olarak kullanılacak değeri yazın. Fazla uygunluktan kaçınmak için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenlileştirmenin model sığdırmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: Machine Learning için L1 ve L2 Düzenlileştirme

  4. Kesme noktası terimini görüntülemek istiyorsanız Kesme noktası terimini dahil et seçeneğini belirleyin.

    Regresyon formülünü gözden geçirmeniz gerekmiyorsa bu seçeneğin seçimini kaldırın.

  5. Rastgele sayı tohumu için isteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucuyu görmek için bir değer yazabilirsiniz.

    Aynı işlem hattının farklı çalıştırmaları arasında aynı sonuçları korumak istiyorsanız, bir tohum değeri kullanmak yararlı olur. Aksi takdirde, varsayılan değer sistem saatinden bir değer kullanmaktır.

  6. Modeli Eğit bileşenini işlem hattınıza ekleyin ve etiketli bir veri kümesini bağlayın.

  7. İşlem hattını gönderin.

Sıradan en küçük kareler modeli için sonuçlar

Eğitim tamamlandıktan sonra:

  • Tahminlerde bulunmak için eğitilen modeli Model Puanla bileşenine ve yeni değerlerden oluşan bir veri kümesine bağlayın.

Çevrimiçi gradyan azalmayı kullanarak regresyon modeli oluşturma

  1. Doğrusal Regresyon Modeli bileşenini tasarımcıdaki işlem hattınıza ekleyin.

    Bu bileşeni Machine Learning kategorisinde bulabilirsiniz. Modeli Başlat'ı genişletin, Regresyon'ı genişletin ve Doğrusal Regresyon Modeli bileşenini işlem hattınıza sürükleyin

  2. Özellikler bölmesinde, Çözüm yöntemi açılan listesinde, regresyon satırını bulmak için kullanılan hesaplama yöntemi olarak Çevrimiçi Gradyan Azalma'yı seçin.

  3. Eğitmen modu oluştur için modeli önceden tanımlanmış bir parametre kümesiyle eğitmek mi yoksa parametre süpürme kullanarak modeli iyileştirmek mi istediğinizi belirtin.

    • Tek Parametre: Doğrusal regresyon ağını nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz ve bir parametre süpürme çalıştırmak istiyorsanız bu seçeneği belirleyin. Yinelemek için bir değer aralığı seçin ve Modeli Ayarlama Hiper Parametreleri , en iyi sonuçları üreten hiper parametreleri belirlemek için sağladığınız ayarların tüm olası bileşimleri üzerinde yinelenir.

  4. Öğrenme hızı için stokastik gradyan azalma iyileştiricisi için ilk öğrenme oranını belirtin.

  5. Eğitim dönemlerinin sayısı için algoritmanın örneklerde kaç kez yinelenmesi gerektiğini belirten bir değer yazın. Az sayıda örnek içeren veri kümelerinde yakınsamaya ulaşmak için bu sayının büyük olması gerekir.

  6. Özellikleri normalleştirme: Modeli eğitmek için kullanılan sayısal verileri zaten normalleştirdiyseniz bu seçeneğin seçimini kaldırabilirsiniz. Varsayılan olarak, bileşen tüm sayısal girişleri 0 ile 1 arasında bir aralığa normalleştirir.

    Not

    Puanlama için kullanılan yeni verilere aynı normalleştirme yöntemini uygulamayı unutmayın.

  7. L2 normalleştirme ağırlığı alanında, L2 normalleştirmesi için ağırlık olarak kullanılacak değeri yazın. Fazla uygunluktan kaçınmak için sıfır olmayan bir değer kullanmanızı öneririz.

    Düzenlileştirmenin model sığdırmayı nasıl etkilediği hakkında daha fazla bilgi edinmek için şu makaleye bakın: Machine Learning için L1 ve L2 Düzenlileştirme

  8. Yinelemeler ilerledikçe öğrenme oranının düşmesini istiyorsanız Öğrenme hızını azalt seçeneğini belirleyin.

  9. Rastgele sayı tohumu için isteğe bağlı olarak, model tarafından kullanılan rastgele sayı oluşturucuyu görmek için bir değer yazabilirsiniz. Aynı işlem hattının farklı çalıştırmaları arasında aynı sonuçları korumak istiyorsanız, bir tohum değeri kullanmak yararlı olur.

  10. Modeli eğitme:

    • Eğitmen modu oluştur'u Tek Parametre olarak ayarlarsanız etiketli bir veri kümesini ve Modeli Eğitme bileşenini bağlayın.

    • Eğitmen modu oluştur'u Parametre Aralığı olarak ayarlarsanız etiketli bir veri kümesini bağlayın ve Modeli Ayarlama Hiper Parametreleri'ni kullanarak modeli eğitin.

    Not

    Modeli Eğitme'ye bir parametre aralığı geçirirseniz, yalnızca tek parametre listesindeki varsayılan değeri kullanır.

    Ayarlama Modeli Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir ayar aralığı beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile, belirttiğiniz tek değer süpürme boyunca kullanılır.

  11. İşlem hattını gönderin.

Çevrimiçi gradyan azalma sonuçları

Eğitim tamamlandıktan sonra:

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.