İngilizce dilinde oku

Aracılığıyla paylaş


Değerleri Kırpma

Bu makalede Azure Machine Learning tasarımcısının bir bileşeni açıklanmaktadır.

Belirtilen eşiğin üzerindeki veya altındaki veri değerlerini ortalama, sabit veya başka bir alternatif değerle tanımlamak ve isteğe bağlı olarak değiştirmek için Clip Values bileşenini kullanın.

Bileşeni kırpmak istediğiniz sayıların yer aldığı bir veri kümesine bağlar, çalışabileceğiniz sütunları seçer ve ardından bir eşik veya değer aralığı ile bir değiştirme yöntemi ayarlarsınız. Bileşen yalnızca sonuçları veya özgün veri kümesine eklenen değiştirilmiş değerlerin çıkışını verebilir.

Küçük Resim Değerlerini yapılandırma

Başlamadan önce, kırpmak istediğiniz sütunları ve kullanılacak yöntemi belirleyin. Önce küçük bir veri alt kümesindeki kırpma yöntemlerini test kullanmanızı öneririz.

Bileşen, seçime eklediğiniz tüm sütunlara aynı ölçütleri ve değiştirme yöntemini uygular. Bu nedenle, değiştirmek istemediğiniz sütunları dışladığınızdan emin olun.

Bazı sütunlara kırpma yöntemleri veya farklı ölçütler uygulamanız gerekiyorsa, her benzer sütun kümesi için yeni bir Kırpma Değerleri örneği kullanmanız gerekir.

  1. Clip Values bileşenini işlem hattınıza ekleyin ve değiştirmek istediğiniz veri kümesine bağlayın. Bu bileşeni Veri Dönüştürme altında Ölçek ve Azalt kategorisinde bulabilirsiniz.

  2. Sütun listesi'nde, Küçük Resim Değerlerinin uygulanacağı sütunları seçmek için Sütun Seçici'yi kullanın.

  3. Eşik kümesi için açılan listeden aşağıdaki seçeneklerden birini seçin. Bu seçenekler, kabul edilebilir değerler ve kırpılması gereken değerler için üst ve alt sınırları nasıl ayarlayabileceğinizi belirler.

    • ClipPeaks: Değerleri tepelere göre kırptığınızda, yalnızca bir üst sınır belirtirsiniz. Bu sınır değerinden büyük değerler değiştirilir.

    • ClipSubpeaks: Değerleri alt değerlere göre kırptığınızda, yalnızca alt sınır belirtirsiniz. Bu sınır değerinden küçük değerler değiştirilir.

    • ClipPeaksAndSubpeaks: Değerleri tepelere ve alt çizgilere göre kırptığınızda, hem üst hem de alt sınırları belirtebilirsiniz. Bu aralığın dışındaki değerler değiştirilir. Sınır değerleriyle eşleşen değerler değiştirilmez.

  4. Önceki adımda yaptığınız seçime bağlı olarak, aşağıdaki eşik değerlerini ayarlayabilirsiniz:

    • Alt eşik: Yalnızca ClipSubPeaks'i seçerseniz görüntülenir
    • Üst eşik: Yalnızca ClipPeaks'i seçerseniz görüntülenir
    • Eşik: Yalnızca ClipPeaksAndSubPeaks'i seçerseniz görüntülenir

    Her eşik türü için Sabit veya Yüzdebirlik'i seçin.

  5. Sabit'i seçerseniz, metin kutusuna en büyük veya en küçük değeri yazın. Örneğin, 999 değerinin yer tutucu değer olarak kullanıldığını bildiğinizi varsayalım. Üst eşik için Sabit'i seçebilir ve üst eşik için Sabit değere 999 yazabilirsiniz.

  6. Yüzdebirlik'i seçerseniz, sütun değerlerini bir yüzdebirlik aralığıyla kısıtlarsınız.

    Örneğin, yalnızca 10-80 yüzdebirlik dilim aralığındaki değerleri tutmak ve diğerlerini değiştirmek istediğinizi varsayalım. Yüzdebirlik'i seçip daha düşük eşik için Yüzdebirlik değeri için 10 ve üst eşik için Yüzdebirlik değeri için 80 yazın.

    Yüzdebirlik dilim aralıklarının nasıl kullanılacağına ilişkin bazı örnekler için yüzdebirlik dilimler bölümüne bakın.

  7. Bir yedek değer tanımlayın.

    Belirttiğiniz sınırlarla tam olarak eşleşen sayılar, izin verilen değer aralığının içinde kabul edilir ve bu nedenle değiştirilmez. Belirtilen aralığın dışında kalan tüm sayılar yedek değerle değiştirilir.

    • Tepeler için değiştirme değeri: Belirtilen eşikten büyük olan tüm sütun değerlerinin yerine geçecek değeri tanımlar.
    • Alt değerlerin yerine değer: Belirtilen eşikten küçük tüm sütun değerlerinin yerine kullanılacak değeri tanımlar.
    • ClipPeaksAndSubpeaks seçeneğini kullanırsanız, üst ve alt kırpılmış değerler için ayrı değiştirme değerleri belirtebilirsiniz.

    Aşağıdaki değiştirme değerleri desteklenir:

    • Eşik: Kırpılan değerleri belirtilen eşik değeriyle değiştirir.

    • Ortalama: Kırpılan değerleri sütun değerlerinin ortalamasıyla değiştirir. Değerler kırpılamadan önce ortalama hesaplanır.

    • Ortanca: Kırpılan değerleri sütun değerlerinin ortanca değeriyle değiştirir. Değerler kırpılamadan önce ortanca değer hesaplanır.

    • Eksik. Kırpılan değerleri eksik (boş) değerle değiştirir.

  8. Gösterge sütunları ekle: Belirtilen kırpma işleminin bu satırdaki verilere uygulanıp uygulanmadığını bildiren yeni bir sütun oluşturmak istiyorsanız bu seçeneği belirleyin. Bu seçenek, yeni bir kırpma ve değiştirme değerleri kümesini test ederken kullanışlıdır.

  9. Üzerine yazma bayrağı: Yeni değerlerin nasıl oluşturulmasını istediğinizi belirtin. Varsayılan olarak, Clip Values istenen eşiğe kırpılan tepe değerleriyle yeni bir sütun oluşturur. Yeni değerler özgün sütunun üzerine yazılır.

    Özgün sütunu korumak ve kırpılmış değerlerle yeni bir sütun eklemek için bu seçeneğin seçimini kaldırın.

  10. İşlem hattını gönderin.

    Değerleri Kırp bileşenine sağ tıklayın, Görselleştir'i seçin veya bileşeni seçin ve sağ paneldeki Çıkışlar sekmesine geçin, Değerleri gözden geçirmek ve kırpma işleminin beklentilerinizi karşıladıdığından emin olmak için Bağlantı noktası çıkışlarındaki histogram simgesine tıklayın.

Yüzdebirlik değerleri kullanarak kırpma örnekleri

Yüzdebirlik dilimlere göre kırpmanın nasıl çalıştığını anlamak için, her biri 1-10 arasında bir örneği olan 10 satırlı bir veri kümesini göz önünde bulundurun.

  • Üst eşik olarak yüzdebirlik değeri kullanıyorsanız, 90. yüzdebirlik değerde, veri kümesindeki tüm değerlerin yüzde 90'ı bu değerden küçük olmalıdır.

  • Düşük eşik olarak yüzdebirlik değeri kullanıyorsanız, 10. yüzdebirlik değerde, veri kümesindeki tüm değerlerin yüzde 10'u bu değerden küçük olmalıdır.

  1. Eşik kümesi için ClipPeaksAndSubPeaks'i seçin.

  2. Üst eşik için Yüzdebirlik'i seçin ve Yüzdebirlik sayısı için 90 yazın.

  3. Üst yedek değer için Eksik Değer'i seçin.

  4. Düşük eşik için Yüzdebirlik'i seçin ve Yüzde birlik sayı olarak 10 yazın.

  5. Daha düşük yedek değer için Eksik Değer'i seçin.

  6. Bayrağın üzerine yaz seçeneğinin seçimini kaldırın ve Gösterge sütunu ekle seçeneğini belirleyin.

Şimdi üst yüzdebirlik eşik olarak 60 ve düşük yüzdebirlik eşiği olarak 30 kullanarak aynı işlem hattını deneyin ve eşik değerini değiştirme değeri olarak kullanın. Aşağıdaki tablo bu iki sonucu karşılaştırır:

  1. değerini eksik olarak değiştirin; Üst eşik = 90; Düşük eşik = 20

  2. değerini eşik ile değiştirin; Üst yüzdebirlik = 60; Düşük yüzdebirlik = 40

Özgün veriler yerine eksik değerini koy eşik ile değiştir
1

2

3

4

5

6

7

8

9

10
TRUE

TRUE

3, YANLIŞ

4, YANLIŞ

5, YANLIŞ

6, YANLIŞ

7, YANLIŞ

8, YANLIŞ

9, YANLIŞ

TRUE
4, DOĞRU

4, DOĞRU

4, DOĞRU

4, DOĞRU

5, YANLIŞ

6, YANLIŞ

7, DOĞRU

7, DOĞRU

7, DOĞRU

7, DOĞRU

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.