Veri kümesine dönüştürme

Bu makalede, Azure Machine Learning tasarımcısında Veri Kümesine Dönüştür bileşenini kullanarak bir işlem hattına ait verileri tasarımcının iç biçimine nasıl dönüştürdüğünüz açıklanır.

Dönüştürme çoğu durumda gerekli değildir. Azure Machine Learning, veriler üzerinde herhangi bir işlem gerçekleştirildiğinde verileri örtük olarak yerel veri kümesi biçimine dönüştürür.

Bir veri kümesinde bir tür normalleştirme veya temizleme işlemi gerçekleştirdiyseniz ve değişikliklerin diğer işlem hatlarında kullanıldığından emin olmak istiyorsanız verileri veri kümesi biçimine kaydetmenizi öneririz.

Not

Veri Kümesine Dönüştür yalnızca veri biçimini değiştirir. Çalışma alanına verilerin yeni bir kopyasını kaydetmez. Veri kümesini kaydetmek için çıkış bağlantı noktasına çift tıklayın, Veri kümesi olarak kaydet'i seçin ve yeni bir ad girin.

Veri Kümesine Dönüştür'ü kullanma

Veri Kümesine Dönüştür'ü kullanmadan önce veri kümesini hazırlamak için Meta Verileri Düzenle bileşenini kullanmanızı öneririz. Sütun adlarını ekleyebilir veya değiştirebilir, veri türlerini ayarlayabilir ve gerektiğinde başka değişiklikler yapabilirsiniz.

  1. Veri Kümesine Dönüştür bileşenini işlem hattınıza ekleyin. Bu bileşeni tasarımcıdaki Veri dönüştürme kategorisinde bulabilirsiniz.

  2. Bir veri kümesinin çıkışını veren herhangi bir bileşene bağlayın.

    Veriler tablolu olduğu sürece, verileri bir veri kümesine dönüştürebilirsiniz. Buna Verileri İçeri Aktar aracılığıyla yüklenen veriler, Verileri El ile Girme yoluyla oluşturulan veriler veya DönüştürmeYi Uygula aracılığıyla dönüştürülen veri kümeleri dahildir.

  3. Eylem açılan listesinde, veri kümesini kaydetmeden önce verilerde herhangi bir temizleme yapmak isteyip istemediğinizi belirtin:

    • Hiçbiri: Verileri olduğu gibi kullanın.

    • SetMissingValue: Belirli bir değeri veri kümesindeki eksik bir değere ayarlayın. Varsayılan yer tutucu soru işareti karakteridir (?), ancak farklı bir değer girmek için Özel eksik değer seçeneğini kullanabilirsiniz. Örneğin, Özel eksik değer için Taxi girerseniz veri kümesindeki tüm Taxi örnekleri eksik değere değiştirilir.

    • ReplaceValues: Başka bir tam değerle değiştirilecek tek bir tam değer belirtmek için bu seçeneği kullanın. Replace yöntemini ayarlayarak eksik değerleri veya özel değerleri değiştirebilirsiniz:

      • Eksik: Giriş veri kümesindeki eksik değerleri değiştirmek için bu seçeneği belirleyin. Yeni Değer için eksik değerlerin yerine geçecek değeri girin.
      • Özel: Giriş veri kümesindeki özel değerleri değiştirmek için bu seçeneği belirleyin. Özel değer için bulmak istediğiniz değeri girin. Örneğin, verileriniz eksik değerler için yer tutucu olarak kullanılan dizeyi obs içeriyorsa değerini girersiniz obs. Yeni değer için, özgün dizenin yerine geçecek yeni değeri girin.

    ReplaceValues işleminin yalnızca tam eşleşmelere uygulandığını unutmayın. Örneğin, bu dizeler etkilenmez: obs., obsolete.

  4. İşlem hattını gönderin.

Sonuçlar

  • Sonuçta elde edilen veri kümesini yeni bir adla kaydetmek için bileşenin sağ panelindeki Çıkışlar sekmesinin altındaki Veri kümesini kaydet simgesini seçin.

Teknik notlar

  • Veri kümesini giriş olarak alan tüm bileşenler CSV dosyasındaki veya TSV dosyasındaki verileri de alabilir. Herhangi bir bileşen kodu çalıştırilmeden önce girişler önceden işlenir. Ön işleme, girişte Veri Kümesine Dönüştür bileşenini çalıştırmaya eşdeğerdir.

  • SVMLight biçiminden veri kümesine dönüştüremezsiniz.

  • Özel bir değiştirme işlemi belirtirken, tam değerlere arama ve değiştirme işlemi uygulanır. Kısmi eşleşmelere izin verilmez. Örneğin, 3 değerini -1 veya 33 ile değiştirebilirsiniz, ancak 35 gibi iki basamaklı bir sayıdaki 3 değerini değiştiremezsiniz.

  • Özel değiştirme işlemleri için, sütunun geçerli veri türüne uymayan herhangi bir karakteri değiştirme olarak kullanırsanız değiştirme işlemi sessizce başarısız olur.

Sonraki adımlar

Bkz. Azure Machine Learning'de kullanılabilen bileşenler kümesi .