Veri kümesindeki Sütunları seçme

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

İşlemdeki bir veri kümesinden dahil edilecek veya hariç tutulacak sütunları seçer

Kategori: veri dönüştürme/işleme

Not

uygulama hedefi: yalnızca Machine Learning Studio (klasik)

benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.

Modüle genel bakış

bu makalede, aşağı akış işlemlerinde kullanılacak sütunların bir alt kümesini seçmek için Machine Learning Studio 'daki (klasik) veri kümesinde sütunları seçme modülünün nasıl kullanılacağı açıklanır. Modül, kaynak veri kümesinden sütunları fiziksel olarak kaldırmaz; Bunun yerine, bir veritabanı görünümü veya projeksiyonugibi sütunların bir alt kümesini oluşturur.

Bu modül özellikle bir aşağı akış işlemi için kullanılabilir sütunları sınırlandırmanız gerektiğinde veya gereksiz sütunları kaldırarak veri kümesinin boyutunu azaltmak istediğinizde yararlıdır.

Veri kümesindeki sütunlar, farklı bir düzende belirtseniz bile, özgün verilerle aynı sırada çıktılardır.

Veri kümesinde sütunları seçme kullanma

Bu modülün parametresi yok. Dahil edilecek veya hariç tutulacak sütunları seçmek için sütun seçiciyi kullanın.

Sütunları ada göre seçin

Modülde ada göre sütun seçmek için birden çok seçenek vardır:

  • Filtre ve arama

    Ada göre seçeneğine tıklayın.

    Zaten doldurulmuş bir veri kümesini bağladıysanız, kullanılabilir sütunların bir listesi görünmelidir. Hiçbir sütun görünmezse, sütun listesini görüntülemek için yukarı akış modüllerini çalıştırmanız gerekebilir.

    Listeyi filtrelemek için, arama kutusuna yazın. Örneğin, arama kutusuna harfi w yazarsanız liste, harfi w içeren sütun adlarını gösterecek şekilde filtrelenir.

    Sütunlar ' ı seçin ve sağ taraftaki bölmedeki seçili sütunları listeye taşımak için sağ ok düğmesine tıklayın.

    • Sürekli sütun adları aralığını seçmek için SHIFT + tıklamatuşlarına basın.
    • Seçime ayrı sütunlar eklemek için CTRL + tıklamatuşlarına basın.

    Kaydetmek ve kapatmak için onay işareti düğmesine tıklayın.

  • Diğer kurallarla birlikte adları kullanın

    Kurallar ile seçeneğine tıklayın.

    Belirli bir veri türünün sütunlarını gösterme gibi bir kural seçin.

    Ardından, seçim listesine eklemek için bu türden tek tek sütunları ada göre seçin.

  • Sütun adlarının virgülle ayrılmış bir listesini yazın veya yapıştırın

    Veri kümeniz çok genişse, sütunları tek tek seçmek yerine dizinleri veya oluşturulmuş ad listesini kullanmak daha kolay olabilir. Listeyi önceden hazırladığınıza varsayılarak:

    1. Kurallar ile seçeneğine tıklayın.
    2. Sütun yok' u seçin, Ekle' yi seçin ve sonra kırmızı ünlem işaretiyle metin kutusunun içine tıklayın.
    3. Önceden doğrulanan sütun adlarının virgülle ayrılmış bir listesini içine yapıştırın veya yazın. Herhangi bir sütunda geçersiz bir ad varsa modülü kaydedemezsiniz, bu nedenle adları önceden denetlediğinizden emin olun.

    Bu yöntemi, dizin değerlerini kullanarak sütunların bir listesini belirtmek için de kullanabilirsiniz. Sütun dizinleri ile çalışma hakkında ipuçları için örnekler bölümüne bakın.

Türe göre seçin

WıTH Rules seçeneğini kullanırsanız, sütun seçimlerinde birden çok koşul uygulayabilirsiniz. Örneğin, bir sayısal veri türünün yalnızca özellik sütunlarını almanız gerekebilir.

Ile başla seçeneği Başlangıç noktanızı belirler ve sonuçları anlamak için çok önemlidir.

  • Tüm sütunlar seçeneğini belirlerseniz, tüm sütunlar listeye eklenir. Ardından, belirli koşullara uyan sütunları kaldırmak için Dışla seçeneğini kullanmanız gerekir.

    Örneğin, tüm sütunlarla başlayabilir ve ardından sütunları ada veya türe göre kaldırabilirsiniz.

  • Sütun yok seçeneğini belirlerseniz, sütun listesi boş olarak başlar. Daha sonra listeye sütun eklemek için koşulları belirtirsiniz.

    Birden çok kural uygularsanız, her koşul eklenebilir. Örneğin, herhangi bir sütun olmadan başlamanızı ve sonra tüm sayısal sütunları almak için bir kural eklemenizi söyleyin. Otomobil fiyat veri kümesinde, 16 sütun sonucu oluşur. Ardından, yeni bir koşul eklemek için işaretine tıklayın + ve tüm özellikleri dahil et' i seçin. Elde edilen veri kümesi, bazı dize özelliği sütunları da dahil olmak üzere tüm sayısal sütunları ve tüm özellik sütunlarını içerir.

Sütun dizinine göre seçin

Sütun dizini, özgün veri kümesindeki sütunun sırasını ifade eder.

  • Sütunlar 1 ' den başlayarak ardışık olarak numaralandırılır.
  • Bir dizi sütun almak için kısa çizgi kullanın.
  • Veya -3 gibi 1- Açık uçlu belirtimlerde izin verilmez.
  • Yinelenen Dizin değerlerine (veya sütun adlarına) izin verilmez ve bir hata oluşmasına neden olabilir.

Örneğin, veri kümenizin en az sekiz sütunu olduğu varsayıldığında, birden çok bitişik olmayan sütun döndürmek için aşağıdaki örneklerden herhangi birini yapıştırabilirsiniz:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

Son örnek bir hatayla sonuçlanmaz; Ancak, sütunun 4 tek bir örneğini döndürür.

Sütun dizinleri ile çalışma hakkında ek ipuçları için örnekler bölümüne bakın.

Sütunların sırasını değiştir

Seçimdeki yinelenen öğelere Izin ver ve sütun sırasını koru seçeneği boş bir listeyle başlar ve ad ya da dizine göre belirttiğiniz sütunları ekler. Sütunları her zaman "doğal sırasıyla" döndüren diğer seçeneklerin aksine, bu seçenek sütunları ad veya listeettiğiniz sırada çıkarır.

Örneğin, Sütun1, Col2, Col3 ve col4 sütunlarına sahip bir veri kümesinde aşağıdaki listelerden birini belirterek sütunların sırasını ters çevirebilirsiniz ve sütun 2 ' yi dışarıda bırakabilirsiniz:

  • Col4, Col3, Col1
  • 4,3,1

Örnekler

Veri kümesinde sütunları seç' in nasıl kullanılacağına ilişkin örnekler için, bkz. model galerisindeBu örnek denemeleri.

Sütun seçimi için genel senaryolar

Aşağıdaki örneklerde, kullanıcıların Machine Learning 'de veri kümesinde Select sütunları uygulaması için bazı tipik yollar açıklanır ve sütunların nasıl seçiminde ilgili bazı ipuçları verilmektedir:

  • Bir matematik işlemini tüm sayısal sütunlara uygulayabilmem için veri kümesinden metin sütunları kaldırmak istiyorum.

    Birçok işlem, veri kümesinde yalnızca sayısal sütunların bulunmasını gerektirir. Metni dışlayarak ve kategorik sütunları hariç bırakarak hataya neden olabilecek sütunları geçici olarak kaldırabilirsiniz (ayrık kategorileri temsil eden sayılar).

    1. Sütun seçiciyi Başlatseçeneğine tıklayın.

    2. Başlangıçiçin tüm sütunlar' ı seçin.

    3. Dışla seçeneğini belirleyin, sütun türü' nü seçin ve sonra dize' yi seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dışla seçeneğini belirleyin, sütun türü' nü seçin ve kategorik' i seçin.

  • Özellik seçimini yalnızca kategorik Özellik sütunlarına uygulamam gerekiyor.

    Benzer türdeki sütunları ayırmanız gerekiyorsa, birden çok koşul uygulayabilirsiniz. Örneğin, Özellikler kategorik veya sayısal olabilir, ancak bazı özellik seçimi modülleri sayısal olmayan alanlara izin vermez, bu yüzden öncelikle Özellikler almanız ve ardından yalnızca sayısal özellikleri almak için bir koşul eklemeniz gerekir.

    1. Sütun seçiciyi Başlatseçeneğine tıklayın.

    2. BaşlangıçIçin sütun yok' u seçin.

    3. Dahil et seçeneğini belirleyin ve tüm özellikler' i seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve kategorik' i seçin.

  • Farklı sayısal sütunlara farklı bir normalleştirme işlemi uygulamam gerekiyor.

    Matematik işlemlerini uygulamadan önce, tamsayıları kayan nokta sayılarından ayırmanız ve bu şekilde devam etmeniz gerekebilir. Bunu yapmak için veri türlerini kullanın ve birden çok koşul uygulayın.

    1. Sütun seçiciyi Başlatseçeneğine tıklayın.

    2. BaşlangıçIçin sütun yok' u seçin.

    3. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve sonra sayısal' i seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve ardından aşağı akış işlemiyle uyumsuz olan sayısal türü seçin.

  • Seçici kullanılarak seçebileceğiniz çok fazla sütun var.

    Genellikle, bir veri kümesini içeri aktardıktan sonra, modelleme için gerekli olmayan çok sayıda sütun olduğunu fark edersiniz. Bununla birlikte, bunları daha sonra çıktı için ya da diğer durumları belirlemek üzere saklamak istiyorsunuz. Bu, veri kümesini iki parçaya bölerek (meta veriler ve modelleme için kullanılan sütunlar) ve daha sonra sütunları Ekle' yi kullanarak sütunları gerektiği gibi yeniden birleştirirseniz yapabilirsiniz.

    1. Sütun seçiciyi Başlatseçeneğine tıklayın.

    2. BaşlangıçIçin sütun yok' u seçin.

    3. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve ardından özellik' i seçin.

    4. Yeni bir koşul eklemek için artı işaretine (+) tıklayın.

    5. Dahil et seçeneğini belirleyin, sütun türü' nü seçin ve etiket' i seçin.

    6. Bu adımları tekrarlayın, ancak tüm sütunlarla başlayın ve ardından yalnızca meta verilerin bir veri kümesini oluşturmak için özellik ve etiket sütunlarını dışlayın.

  • İhtiyacım olan sütunlar için dizin değerlerini bilmiyorum.

    Veri kümenizde yalnızca birkaç sütun varsa, ilk 100 satırı görmek ve sonra hangi sütunun dizin 1, 2 vs. olduğunu anlamak için Görselleştir seçeneğini kullanabilirsiniz.

    • Machine Learning dizinler 1 ' de başlar, bu nedenle ilk sütun her zaman 1 ' dir.

    • Son sütunun dizinini almak için, sütun seçicideki iki sütun listesine bakın: KULLANILABILIR sütunlar ve SEÇILI sütunlar. Sütun listesinin altındaki gri çubuk her listedeki sütun sayısını görüntüler. Bu nedenle, 24 sütun varsa ve iki sütun seçilirse, toplam 26 sütun vardır ve son sütunun dizini 26 ' dır.

    Veri kümenizin şemasını ayıklamak için başka bir seçenek de, Dizin numaralarına sahip sütun adlarını almak için R betiği Yürüt modülünü kullanmaktır.

    1. veri kümenizi R betiği yürütme modülüne Bağlan.

    2. Modülünde, sütun adlarını çıkarmak için aşağıdakine benzer bir komut dosyası yazın. İle myindex başlayan satır, dizinleri sırasıyla temsil eden bir dizi oluşturur.

      dataset1 <- maml.mapInputPort(1) # class: data.frame
      mycolnames <-names(dataset1);
      myindex <- seq(from = 1, to = length(mycolnames), by=1);
      outdata <- as.data.frame(cbind(myindex, mycolnames));
      maml.mapOutputPort("outdata"); 
      

    Otomobil fiyat veri kümesi sonuçları

    MyIndex mycolnames
    1 symboling
    2 normalleştirilmiş zararlar
    3 make

Teknik notlar

İlişkisel veritabanları hakkında bilgi sahibiyseniz, bu modül verilerin bir projeksiyonu oluşturur; bu nedenle, özgün adı Project sütunları. veritabanı koşullarında, bir yansıtma, bir Transact-SQL veya lınq deyimidir gibi bir işlevdir. bu, verileri tablo biçiminde giriş olarak alır ve ilgili bir çıkış oluşturur.

İlişkisel ALDE, bir projeksiyon, öznitelik adları kümesi olarak yazılmış birli bir işlemdir. Bir projeksiyonun sonucu, diğer özniteliklerin atıldığı bu özniteliklerin kümesidir.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri tablosu Giriş veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Description
Sütun seçme herhangi biri ColumnSelection Yansıtılan veri kümesinde tutulacak sütunları seçin.

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri tablosu Çıkış veri kümesi

Özel durumlar

Özel durum Description
Hata 0001 Veri kümesinin bir veya daha fazla belirtilen sütunu bulunamıyorsa bir özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş veri kümesi null veya boşsa bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

İşleme