Değerleri Kırpma

Bu makalede Azure Machine Learning tasarımcısının bir bileşeni açıklanmaktadır.

Belirtilen eşiğin üzerindeki veya altındaki veri değerlerini ortalama, sabit veya başka bir yedek değerle tanımlamak ve isteğe bağlı olarak değiştirmek için Clip Values bileşenini kullanın.

Bileşeni, kırpmak istediğiniz sayıları içeren bir veri kümesine bağlar, çalışabileceğiniz sütunları seçer ve ardından bir eşik veya değer aralığı ve bir değiştirme yöntemi ayarlarsınız. Bileşen yalnızca sonuçları veya özgün veri kümesine eklenen değiştirilen değerlerin çıkışını verebilir.

Küçük Resim Değerlerini yapılandırma

Başlamadan önce kırpmak istediğiniz sütunları ve kullanılacak yöntemi belirleyin. Önce küçük bir veri alt kümesinde herhangi bir kırpma yöntemini test yapmanızı öneririz.

Bileşen, seçime eklediğiniz tüm sütunlara aynı ölçütleri ve değiştirme yöntemini uygular. Bu nedenle, değiştirmek istemediğiniz sütunları dışladığınızdan emin olun.

Bazı sütunlara kırpma yöntemleri veya farklı ölçütler uygulamanız gerekiyorsa, her benzer sütun kümesi için yeni bir Clip Values örneği kullanmanız gerekir.

  1. Clip Values bileşenini işlem hattınıza ekleyin ve değiştirmek istediğiniz veri kümesine bağlayın. Bu bileşeni Veri Dönüştürme'nin altında , Ölçek ve Azaltma kategorisinde bulabilirsiniz.

  2. Sütun listesi'nde, Küçük Resim Değerlerinin uygulanacağı sütunları seçmek için Sütun Seçici'yi kullanın.

  3. Eşik kümesi için açılan listeden aşağıdaki seçeneklerden birini belirleyin. Bu seçenekler, kabul edilebilir değerler ve kırpılması gereken değerler için üst ve alt sınırları nasıl ayarlayabileceğinizi belirler.

    • ClipPeaks: Değerleri tepelere göre kırptığınızda, yalnızca bir üst sınır belirtirsiniz. Bu sınır değerinden büyük değerler değiştirilir.

    • ClipSubpeaks: Değerleri alt değerlere göre kırptığınızda, yalnızca alt sınır belirtirsiniz. Bu sınır değerinden küçük değerler değiştirilir.

    • ClipPeaksAndSubpeaks: Değerleri tepelere ve alt çizgilere göre kırptığınızda, hem üst hem de alt sınırları belirtebilirsiniz. Bu aralığın dışındaki değerler değiştirilir. Sınır değerleriyle eşleşen değerler değiştirilmez.

  4. Önceki adımda yaptığınız seçime bağlı olarak, aşağıdaki eşik değerlerini ayarlayabilirsiniz:

    • Alt eşik: Yalnızca ClipSubPeaks'i seçerseniz görüntülenir
    • Üst eşik: Yalnızca ClipPeaks'i seçerseniz görüntülenir
    • Eşik: Yalnızca ClipPeaksAndSubPeaks'i seçerseniz görüntülenir

    Her eşik türü için Sabit veya Yüzdebirlik'i seçin.

  5. Sabit'i seçerseniz, metin kutusuna en büyük veya en küçük değeri yazın. Örneğin, 999 değerinin yer tutucu değer olarak kullanıldığını bildiğinizi varsayalım. Üst eşik için Sabit'i seçebilir ve üst eşik için Sabit değer'e 999 yazabilirsiniz.

  6. Yüzdebirlik'i seçerseniz, sütun değerlerini yüzdebirlik aralığıyla kısıtlarsınız.

    Örneğin, yalnızca yüzde 10-80 dilim aralığındaki değerleri tutmak ve diğer tüm değerleri değiştirmek istediğinizi varsayalım. Yüzdebirlik'i seçip daha düşük eşik için Yüzdebirlik değeri için 10, üst eşik için Yüzdebirlik değeri için 80 yazın.

    Yüzdebirlik aralıklarının nasıl kullanılacağına ilişkin bazı örnekler için yüzdebirlik dilimler bölümüne bakın.

  7. Bir yedek değer tanımlayın.

    Belirttiğiniz sınırlarla tam olarak eşleşen sayılar izin verilen değer aralığında kabul edilir ve bu nedenle değiştirilmez. Belirtilen aralığın dışında kalan tüm sayılar, yerine geçecek değerle değiştirilir.

    • Tepelerin yerine değer koy: Belirtilen eşikten büyük olan tüm sütun değerlerinin yerine geçecek değeri tanımlar.
    • Alt değerlerin yerine geçecek değer: Belirtilen eşikten küçük olan tüm sütun değerlerinin yerine kullanılacak değeri tanımlar.
    • ClipPeaksAndSubpeaks seçeneğini kullanırsanız, üst ve alt kırpılmış değerler için ayrı değiştirme değerleri belirtebilirsiniz.

    Aşağıdaki değiştirme değerleri desteklenir:

    • Eşik: Kırpılan değerleri belirtilen eşik değeriyle değiştirir.

    • Ortalama: Kırpılan değerleri sütun değerlerinin ortalamasıyla değiştirir. Değerler kırpılamadan önce ortalama hesaplanır.

    • Ortanca: Kırpılan değerleri sütun değerlerinin ortanca değeriyle değiştirir. Ortanca değer kırpılamadan önce hesaplanır.

    • Eksik. Kırpılmış değerleri eksik (boş) değerle değiştirir.

  8. Gösterge sütunları ekle: Belirtilen kırpma işleminin bu satırdaki verilere uygulanıp uygulanmadığını belirten yeni bir sütun oluşturmak istiyorsanız bu seçeneği belirleyin. Bu seçenek, yeni bir kırpma ve değiştirme değerleri kümesini test ederken kullanışlıdır.

  9. Üzerine yazma bayrağı: Yeni değerlerin nasıl oluşturulmasını istediğinizi belirtin. Varsayılan olarak, Clip Values istenen eşiğe kırpılmış tepe değerleriyle yeni bir sütun oluşturur. Yeni değerler özgün sütunun üzerine yazar.

    Özgün sütunu korumak ve kırpılmış değerlerle yeni bir sütun eklemek için bu seçeneğin seçimini kaldırın.

  10. İşlem hattını gönderin.

    Değerleri kırp bileşenine sağ tıklayın, Görselleştir'i seçin veya bileşeni seçin ve sağ paneldeki Çıkışlar sekmesine geçin, Bağlantı noktası çıkışlarındaki histogram simgesine tıklayarak değerleri gözden geçirin ve kırpma işleminin beklentilerinizi karşıladıklarından emin olun.

Yüzdebirlik dilimleri kullanarak kırpma örnekleri

Yüzdebirlik dilimlere göre kırpmanın nasıl çalıştığını anlamak için her biri 1-10 olan bir örneği olan 10 satırı olan bir veri kümesini göz önünde bulundurun.

  • Üst eşik olarak yüzdebirlik değeri kullanıyorsanız, 90. yüzdebirlik değerde, veri kümesindeki tüm değerlerin yüzde 90'ı bu değerden küçük olmalıdır.

  • Düşük eşik olarak yüzdebirlik değeri kullanıyorsanız, 10. yüzdebirlik değerde, veri kümesindeki tüm değerlerin yüzde 10'u bu değerden küçük olmalıdır.

  1. Eşik kümesi içinClipPeaksAndSubPeaks'i seçin.

  2. Üst eşik için Yüzde birlik'i seçin ve Yüzdebirlik değeri olarak 90 yazın.

  3. Üst yedek değer için Eksik Değer'i seçin.

  4. Düşük eşik için Yüzde birlik'i seçin ve Yüzdebirlik değeri için 10 yazın.

  5. Daha düşük yedek değer için Eksik Değer'i seçin.

  6. Bayrağın üzerine yaz seçeneğinin seçimini kaldırın ve Gösterge sütunu ekle seçeneğini belirleyin.

Şimdi üst yüzdebirlik eşik olarak 60 ve düşük yüzdebirlik eşiği olarak 30 kullanarak aynı işlem hattını deneyin ve eşik değerini değiştirme değeri olarak kullanın. Aşağıdaki tablo bu iki sonucu karşılaştırır:

  1. değerini eksik olarak değiştirin; Üst eşik = 90; Düşük eşik = 20

  2. değerini eşik ile değiştirin; Üst yüzdebirlik = 60; Düşük yüzdebirlik = 40

Özgün veriler yerine eksik değerini koy değerini eşik ile değiştirin
1

2

3

4

5

6

7

8

9

10
TRUE

TRUE

3, YANLIŞ

4, YANLIŞ

5, YANLIŞ

6, YANLIŞ

7, YANLIŞ

8, YANLIŞ

9, YANLIŞ

TRUE
4, DOĞRU

4, DOĞRU

4, DOĞRU

4, DOĞRU

5, YANLIŞ

6, YANLIŞ

7, DOĞRU

7, DOĞRU

7, DOĞRU

7, DOĞRU

Sonraki adımlar

Azure Machine Learning'in kullanabileceği bileşenler kümesine bakın.